为什么我看不到Kafka Streams reduce方法的任何输出？

给出以下代码：

KStream stream = builder.stream(Serdes.String(), customSerde, "test_in"); stream .groupByKey(Serdes.String(), customSerde) .reduce(new CustomReducer(), "reduction_state") .print(Serdes.String(), customSerde);

我在Reducer的apply方法中有一个println语句，当我希望减少时会成功打印出来。但是，上面显示的最终打印语句不显示任何内容。同样，如果我使用方法而不是print ，我在目标主题中看不到任何消息。

在reduce语句之后我需要什么来查看减少的结果？如果一个值被推送到输入，我不希望看到任何东西。如果按下具有相同键的第二个值，我希望减少器应用（它确实如此），并且我还期望减少的结果继续到处理管道中的下一步。如上所述，我在管道的后续步骤中没有看到任何内容，我不明白为什么。

从Kafka 0.10.1.0所有聚合运算符都使用内部重复数据删除缓存来减少结果KTable changelog流的负载。例如，如果您使用相同的密钥直接计数和处理两个记录，则完整的更改日志流将为, 。

使用新的缓存function，缓存将接收并存储它，但不会立即将其发送到下游。当计算，它将替换缓存的第一个条目。根据缓存大小，不同密钥数，吞吐量和提交间隔，缓存会向下游发送条目。这种情况发生在单个密钥条目的缓存逐出或缓存的完全刷新（向下游发送所有条目）。因此，KTable更改日志可能只显示（因为重复删除）。

您可以通过Streams配置参数StreamConfig.CACHE_MAX_BYTES_BUFFERING_CONFIG来控制缓存的大小。如果将值设置为零，则完全禁用缓存，KTable更改日志将包含所有更新（有效地提供0.10.1.0行为）。

汇编文档包含一个更详细地解释缓存的部分：

为什么我看不到Kafka Streams reduce方法的任何输出？

Kafka – 使用高级消费者实现延迟队列

kafka KStream – 采用n秒计数的拓扑

为什么Kafka消费者表现缓慢？

Apache Storm Trident和Kafka Spout Integration

在使用Java创建之前检查kafka中是否存在主题

如何从Java中获取kafka服务器的主题列表

Kafka – 如何在Producer类中获取失败的消息详细信息

Kafurn in Kubernetes – 将协调员标记为团体死亡

Kafka 0.8.2.2 – 无法发布消息

kafka.consumer.SimpleConsumer：由于套接字错误而重新连接：java.nio.channels.ClosedChannelException