Beam / Dataflow 2.2.0 – 从pcollection中提取前n个元素

有没有办法在梁pcollection中提取前n个元素? 文档似乎没有表明任何此类function。 我认为这样的操作首先需要一个全局元素编号赋值然后一个filter – 拥有这个function会很好。

我使用Google DataFlow Java SDK 2.2.0

PCollection本身是无序的,因此“前N个元素”的概念不存在 – 但是:

  • 如果您需要某些条件的前N个元素,则可以使用Top变换 。

  • 如果您需要任何 N个元素,可以使用Sample 。