马上加入IBC程序猿 各种源码随意下,各种教程随便看! 注册 每日签到 加入编程讨论群

C#教程 ASP.NET教程 C#视频教程程序源码享受不尽 C#技术求助 ASP.NET技术求助

【源码下载】 社群合作 申请版主 程序开发 【远程协助】 每天乐一乐 每日签到 【承接外包项目】 面试-葵花宝典下载

官方一群:

官方二群:

【Java必修课】ArrayList与HashSet的contains方法性能比较(JMH性能测试)

[复制链接]
查看2191 | 回复0 | 2019-10-24 09:48:29 | 显示全部楼层 |阅读模式

1 简介

在日常开发中,ArrayListHashSet都是Java中很常用的聚集类。

  • ArrayListList接口最常用的实现类;
  • HashSet则是生存唯一元素Set的实现。

本文主要对两者共有的方法contains()做一个简朴的讨论,主要是性能上的对比,并用JMH(ava Microbenchmark Harness)举行测试比较。

2 先看JMH测试结果

我们使用一个由OpenJDK/Oracle里面开发了Java编译器的大牛们所开发的Micro Benchmark Framework来测试。下面简朴展示一下使用过程。

2.1 Maven导入相关依赖

导入JMH的相关依赖,可以去官网查察最新版本:

  1. <code><dependencies>
  2. <dependency>
  3. <groupId>org.openjdk.jmh</groupId>
  4. <artifactId>jmh-core</artifactId>
  5. <version>${openjdk.jmh.version}</version>
  6. </dependency>
  7. <dependency>
  8. <groupId>org.openjdk.jmh</groupId>
  9. <artifactId>jmh-generator-annprocess</artifactId>
  10. <version>${openjdk.jmh.version}</version>
  11. </dependency>
  12. </dependencies>
  13. <properties>
  14. <openjdk.jmh.version>1.19</openjdk.jmh.version>
  15. </properties></code>
复制代码

2.2 创建测试相关的类

2.2.1 聚集储存对象的类

由于要测试聚集类的方法,以是我们创建一个类来表示聚集所储存的对象。如下:

  1. <code>@Data
  2. @AllArgsConstructor(staticName = "of")
  3. public class Student {
  4. private Long id;
  5. private String name;
  6. }</code>
复制代码

2.2.2 JMH测试类

接下来我们就来写测试性能对比的类,代码如下:

  1. <code>@BenchmarkMode(Mode.AverageTime)
  2. @OutputTimeUnit(TimeUnit.NANOSECONDS)
  3. public class ContainsPerformanceTest {
  4. @State(Scope.Thread)
  5. public static class MyState {
  6. private Set<Student> studentSet = new HashSet<>();
  7. private List<Student> studentList = new ArrayList<>();
  8. private Student targetStudent = Student.of(99L, "Larry");
  9. @Setup(Level.Trial)
  10. public void prepare() {
  11. long MAX_COUNT = 10000;
  12. for (long i = 0; i < MAX_COUNT; i++) {
  13. studentSet.add(Student.of(i, "MQ"));
  14. studentList.add(Student.of(i, "MQ"));
  15. }
  16. studentList.add(targetStudent);
  17. studentSet.add(targetStudent);
  18. }
  19. }
  20. @Benchmark
  21. public boolean arrayList(MyState state) {
  22. return state.studentList.contains(state.targetStudent);
  23. }
  24. @Benchmark
  25. public boolean hashSet(MyState state) {
  26. return state.studentSet.contains(state.targetStudent);
  27. }
  28. public static void main(String[] args) throws Exception {
  29. Options options = new OptionsBuilder()
  30. .include(ContainsPerformanceTest.class.getSimpleName())
  31. .threads(6)
  32. .forks(1)
  33. .warmupIterations(3)
  34. .measurementIterations(6)
  35. .shouldFailOnError(true)
  36. .shouldDoGC(true)
  37. .build();
  38. new Runner(options).run();
  39. }
  40. }</code>
复制代码

测试类注解阐明:

  • @BenchmarkMode:表示举行Benchmark时使用的模式;AverageTime表示测试调用的均匀时间。
  • @OutputTimeUnit:测试的度量时间单位;NANOSECONDS表示使用纳秒为单位。
  • @State:接受一个Scope参数表示状态的共享范围;Scope.Thread表示每个线程独享。
  • @Setup:实行Benchmark前实行,雷同于JUnit@BeforeAll
  • @Benchmark:举行Benchmark的对象,雷同于JUnit@Test

测试类启动参数Options阐明:

  • include:benchmark所在的类名;
  • threads:每个进程中的测试线程数;
  • fork:进程数,如果为3,则JMH会fork出3个进程来测试;
  • warmupIterations:预热的迭代次数,
  • measurementIterations:现实丈量的迭代次数。

2.3 测试结果

设置好参数后,就可以跑测试了。测试结果如下:

  1. <code># Benchmark: ContainsPerformanceTest.arrayList
  2. # Run progress: 0.00% complete, ETA 00:00:18
  3. # Fork: 1 of 1
  4. # Warmup Iteration 1: 42530.408 ±(99.9%) 2723.999 ns/op
  5. # Warmup Iteration 2: 17841.988 ±(99.9%) 1882.026 ns/op
  6. # Warmup Iteration 3: 18561.513 ±(99.9%) 2021.506 ns/op
  7. Iteration 1: 18499.568 ±(99.9%) 2126.172 ns/op
  8. Iteration 2: 18975.407 ±(99.9%) 2004.509 ns/op
  9. Iteration 3: 19386.851 ±(99.9%) 2248.536 ns/op
  10. Iteration 4: 19279.722 ±(99.9%) 2102.846 ns/op
  11. Iteration 5: 19796.495 ±(99.9%) 1974.987 ns/op
  12. Iteration 6: 21363.962 ±(99.9%) 2175.961 ns/op
  13. Result "ContainsPerformanceTest.arrayList":
  14. 19550.334 ±(99.9%) 2771.595 ns/op [Average]
  15. (min, avg, max) = (18499.568, 19550.334, 21363.962), stdev = 988.377
  16. CI (99.9%): [16778.739, 22321.929] (assumes normal distribution)
  17. # Benchmark: ContainsPerformanceTest.hashSet
  18. # Run progress: 50.00% complete, ETA 00:00:16
  19. # Fork: 1 of 1
  20. # Warmup Iteration 1: 10.662 ±(99.9%) 0.209 ns/op
  21. # Warmup Iteration 2: 11.177 ±(99.9%) 1.077 ns/op
  22. # Warmup Iteration 3: 9.467 ±(99.9%) 1.462 ns/op
  23. Iteration 1: 9.540 ±(99.9%) 0.535 ns/op
  24. Iteration 2: 9.388 ±(99.9%) 0.365 ns/op
  25. Iteration 3: 10.604 ±(99.9%) 1.008 ns/op
  26. Iteration 4: 9.361 ±(99.9%) 0.154 ns/op
  27. Iteration 5: 9.366 ±(99.9%) 0.458 ns/op
  28. Iteration 6: 9.274 ±(99.9%) 0.237 ns/op
  29. Result "ContainsPerformanceTest.hashSet":
  30. 9.589 ±(99.9%) 1.415 ns/op [Average]
  31. (min, avg, max) = (9.274, 9.589, 10.604), stdev = 0.505
  32. CI (99.9%): [8.174, 11.004] (assumes normal distribution)
  33. # Run complete. Total time: 00:00:32
  34. Benchmark Mode Cnt Score Error Units
  35. ContainsPerformanceTest.arrayList avgt 6 19550.334 ± 2771.595 ns/op
  36. ContainsPerformanceTest.hashSet avgt 6 9.589 ± 1.415 ns/op</code>
复制代码

颠末测试,发现两者耗时差异极大,ArrayList大概是20K纳秒,而HashSet则10纳秒左右。两者完全不在一个数目级上。

3 源码分析

通过测试得知两者差异极大,就小窥一下源码分析分析。

3.1 ArrayList的contains()

ArrayList的底层使用数组作为数据存储,当给定一个Object去判定是否存在,需要去遍历数组,与每个元素对比。

  1. <code>public boolean contains(Object o) {
  2. return indexOf(o) >= 0;
  3. }
  4. public int indexOf(Object o) {
  5. if (o == null) {
  6. for (int i = 0; i < size; i++)
  7. if (elementData[i]==null)
  8. return i;
  9. } else {
  10. for (int i = 0; i < size; i++)
  11. if (o.equals(elementData[i]))
  12. return i;
  13. }
  14. return -1;
  15. }</code>
复制代码

从源码可以发现,contains()方法是通过调用indexOf()来判定的,而后者就是需要遍历数组,直到找到那个与入参相等的元素才会制止。由于,ArrayListcontains()方法的时间复杂度为O(n),也就是说,时间取决于长度,而且是正比的关系。

3.2 HashSet的contains()

HashSet底层是通过HashMap来实现的,而HashMap的底层结构为数组+链表JDK 8后改为数组+链表+红黑树

HashMap的相关代码如下:

  1. <code>public boolean containsKey(Object key) {
  2. return getNode(hash(key), key) != null;
  3. }
  4. final Node<K,V> getNode(int hash, Object key) {
  5. Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
  6. if ((tab = table) != null && (n = tab.length) > 0 &&
  7. (first = tab[(n - 1) & hash]) != null) {
  8. if (first.hash == hash && // always check first node
  9. ((k = first.key) == key || (key != null && key.equals(k))))
  10. return first;
  11. if ((e = first.next) != null) {
  12. if (first instanceof TreeNode)
  13. return ((TreeNode<K,V>)first).getTreeNode(hash, key);
  14. do {
  15. if (e.hash == hash &&
  16. ((k = e.key) == key || (key != null && key.equals(k))))
  17. return e;
  18. } while ((e = e.next) != null);
  19. }
  20. }
  21. return null;
  22. }</code>
复制代码

首先通过获取Hash值来找,如果Hash值相等且对象也相等,则找到。一样平常来说,在hashCode()方法实现没问题的情况下,发生Hash冲突的情况是比较少。以是可以以为,大部分情况下,contains()的时间复杂度为O(1),元素个数不影响其速率。如果发生Hash冲突,在链表长度小于8时,时间复杂度为O(n);在链表大于8时,转化为红黑树,时间复杂度为O(logn)

一样平常地,我们以为,HashSet/HashMap的查找的时间复杂度为O(1)

4 总结

通过JMH测试我们发现ArrayListHashSetcontains()方法性能差异很大。颠末源码分析得知,ArrayList对应的时间复杂度为O(n),而HashSet的时间度为O(1)


接待关注公众号<南瓜慢说>,将持续为你更新...







来源:https://www.cnblogs.com/larrydpk/p/11729208.html
C#论坛 www.ibcibc.com IBC编程社区
C#
C#论坛
IBC编程社区
*滑块验证:
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则