使用map-reduce构建分布式KD树

我正在尝试使用map-reduce构建分布式KD树。 分布式KD树的描述可以在这里找到Dkd-Tree

我有一个维度为20的图像的特征向量。我必须根据上面的链接构建分布式kd树,也看看这个图像Kdtree kdree

我有数百万张图片。 那么我可以使用什么方法来构建树的顶部(图像的第二部分)? 我对各个节点之间的图像分布感到困惑。

如果树在第一次map-reduce操作中构建了HDFS,那么如何在下一次map-reduce操作中访问它?