Tag: hadoop partitioning

Hadoop中默认的散列分区器将两个不同的键转到同一个reducer?

我们知道Hadoop保证来自不同mappers的相同密钥将被发送到同一个reducer 。 但是如果两个不同的键具有相同的哈希值 ,它们肯定会转到相同的 reducer ,那么它们是否会按顺序发送到相同的 reduce方法? 哪个部分负责这个逻辑? 非常感谢!