是什么导致java.util.HashSet和HashMap.keySet（）类的iterator（）稍微不可预测的排序？

六年前，我烧了几天试图追捕我完全确定的框架随机响应的地方。在精心追逐整个框架确保它全部使用相同的Random实例后，我继续追逐单步执行代码。这是高度重复的迭代自调用代码。更糟糕的是，该死的效果只会在完成大量迭代后出现。在+6小时之后，当我在javadoc中为HashSet.iterator（）发现一行时，我终于处于智慧状态，表明它不能保证返回元素的顺序。然后，我浏览了整个代码库，并用LinkedHashSet替换了所有HashSet实例。而且，我的框架正好向确定性生活迈进！哎呀！

我现在刚刚经历过同样的FREAKIN影响（至少这次只有3个小时）。无论出于何种原因，我都错过了HashMap恰好为其keySet（）提供相同方式的小细节。

这是关于这个主题的SO线程，虽然讨论从来没有完全回答我的问题： HashSet的迭代顺序

所以，我很好奇为什么会这样。鉴于我两次都有一个巨大的单线程java应用程序在完全相同的实例化/插入空间中使用完全相同的JVM参数（来自同一批处理文件的多次运行）在同一台计算机上运行，几乎没有其他任何运行，这可能会扰乱JVM使得HashSet和HashMap在经过大量迭代之后会出现不可预测的行为（并不是因为javadoc说不依赖于顺序而不一致）？

从源代码（java.util中的这些类的实现）或您对JVM的了解（可能是某些GC影响内部java类在分配内部存储空间时获得非零内存的位置）的任何想法？

我之前已经解决了这个问题，订单并不重要，但确实影响了结果。

Java的multithreading特性意味着具有完全相同输入的重复运行可能受到（例如）分配新内存块需要多长时间的微小时间差异的影响，这可能有时需要分页到磁盘内容，以及其他不需要的内容。其他一些不使用该页面的线程可能会继续，当考虑系统对象时，最终可能会产生不同的对象创建顺序。

这可能会影响JVM的不同运行中的等效对象的Object.hashCode()结果。

对我来说，我决定添加使用LinkedHashMap的小额开销，以便能够重现我正在运行的测试的结果。

简答

有一个权衡。如果您希望对元素进行分摊的常量时间O（1）访问，那么迄今为止的技术依赖于像哈希这样的随机方案。如果您想要对元素进行有序访问，那么最佳工程权衡只能为您提供O（ln（n））性能。对于你的情况，也许这并不重要，但是即使相对较小的结构，恒定时间和对数时间之间的差异也会产生很大的差异。

所以，是的，您可以仔细查看代码并仔细检查，但它归结为一个相当实际的理论事实。现在是刷掉那些支撑你房子基础的下垂角落的Cormen （或Googly Bookiness ）的副本的好时机，看看第11章（哈希表）和第13章（红黑树）。这些将分别填充JDK的HashMap和TreeMap实现。

答案很长

您不希望Map或Set返回键/成员的有序列表。这不是他们想要的。地图和集合结构不像基础数学概念那样排序，它们提供不同的性能。这些数据结构的目标（如@thejh所指出的）是有效的摊销insert ， contains和get时间，而不是维持排序。您可以了解如何维护散列数据结构以了解权衡取舍。看看关于Hash函数和哈希表的Wikipedia条目（具有讽刺意味的是，注意“无序映射”的Wiki条目重定向到后者）或计算机科学/数据结构文本。

请记住：除非您仔细查看合同是什么，否则不要依赖于ADT（特别是集合）的属性，例如订购，不变性，线程安全或其他任何内容。请注意，对于Map，Javadoc清楚地说：

地图的顺序定义为地图集合视图上的迭代器返回其元素的顺序。一些地图实现，比如TreeMap类，对它们的顺序做出了特定的保证; 其他人，比如HashMap类，没有。

和Set.iterator()有类似的：

返回此set中元素的迭代器。元素以无特定顺序返回（除非此集合是某个提供保证的类的实例）。

如果您想要这些的有序视图，请使用以下方法之一：

如果它只是一个Set ，也许你真的想要一个SortedSet比如TreeSet
使用TreeMap ，它允许自然排序键或通过Comparator进行特定排序
抽象你的数据结构，如果这是你想要的行为，它可能是一个特定于应用程序的东西，并维护一个SortedSet键和一个Map ，它将在摊销时间内表现更好。
获取Map.keySet() （或者只是您感兴趣的Set ）并将其放入SortedSet例如TreeSet ，使用自然顺序或特定的Comparator 。
在排序之后，使用Map.entrySet().iterator() Map.Entry 。例如for (final Map.Entry entry : new TreeSet(map.entrySet())) { }可以有效地访问键和值。
如果您只是这样做一次，您可以从结构中获取一系列值并使用Arrays.sort() ，它具有不同的性能配置文件（空间和时间）。

链接到源

如果您想查看juHashSet和juHashMap的源代码，可以在GrepCode上找到它们。请注意，HashSet只是HashMap的糖。为什么不总是使用排序版本？好吧，正如我在上面提到的那样，性能不同，在某些应用中很重要。请在此处查看相关的SO问题。您还可以在底部看到一些具体的性能数字（我没有仔细查看以确认这些是准确的，但它们恰好证实了我的观点，所以我会愉快地传递链接。:-)

http://download.oracle.com/javase/1.4.2/docs/api/java/lang/Object.html#hashCode ()说：

尽可能合理，Object类定义的hashCode方法确实为不同的对象返回不同的整数。（这通常通过将对象的内部地址转换为整数来实现，但JavaTM编程语言不需要此实现技术。）

那么内部地址可能会改变吗？

这也意味着您可以通过为应该充当键的所有内容编写自己的hashCode()方法来适当地修复它而不会放慢速度。

你永远不应该依赖哈希映射的顺序。

如果你想要一个确定性排序的Map，我建议你使用像TreeMap / TreeSet这样的SortedMap / SortedSet，或者使用LinkedHashMap / LinkedHashSet。我经常使用后者，不是因为程序需要排序，而是因为它更容易读取日志/调试地图的状态。即当你添加一个键时，它每次都会结束。

您可以使用相同的元素创建两个HashMap / HashSet，但根据集合的容量获取不同的顺序。您的代码运行方式可能会产生细微的差异，从而触发不同的最终存储桶大小，从而产生不同的顺序。

例如

 public static void main(String... args) throws IOException { printInts(new HashSet(8,2)); printInts(new HashSet(16,1)); printInts(new HashSet(32,1)); printInts(new HashSet(64,1)); } private static void printInts(HashSet integers) { integers.addAll(Arrays.asList(0,10,20,30,40,50,60,70,80,90,100)); System.out.println(integers); }

版画

 [0, 50, 100, 70, 40, 10, 80, 20, 90, 60, 30] [0, 50, 100, 70, 80, 20, 40, 10, 90, 60, 30] [0, 100, 70, 40, 10, 50, 80, 20, 90, 60, 30] [0, 70, 10, 80, 20, 90, 30, 100, 40, 50, 60]

这里有HashSet，它们以相同的顺序添加相同的值，导致不同的迭代器顺序。您可能没有使用构造函数，但您的应用程序可能会间接导致不同的存储桶大小。

是什么导致java.util.HashSet和HashMap.keySet（）类的iterator（）稍微不可预测的排序？

简答

答案很长

链接到源

Java Hashmap – multithreading放

HashMap值未附加到ListView

如果密钥以与equals不一致的方式实现Comparable，那么Java 8的HashMap是否会出错？这是一个错误吗？

基于Value然后Key对HashMap进行排序？

两个或更多（哈希）映射的联合

Java中的HashMap，1亿条目

java hashmap键迭代

为什么这个HashMap.get返回null？

无法从Sun文档中了解Hash表的Poisson部分

为什么Hashtable的initialCapacity为11而HashMap中的DEFAULT_INITIAL_CAPACITY为16且需要2的幂