如何在Java 8中并行读取文件的所有行

我想尽快将1 GB大文件的所有行读入Stream 。目前我正在使用Files(path).lines() 。在解析文件之后，我正在进行一些计算（ map() / filter() ）起初我认为这已经是并行完成了，但似乎我错了：当按原样读取文件时，它需要在我的双CPU笔记本电脑上50秒。但是，如果我使用bash命令拆分文件然后并行处理它，它只需要大约30秒。

我尝试了以下组合：

单个文件，没有平行线（）流~50秒
单个文件， Files(..).lines().parallel().[...] ~~ 50秒
两个文件，没有平行线（）strean~30秒
两个文件， Files(..).lines().parallel().[...] ~~ 30秒

我用大致相同的结果（1或2秒）多次运行这4次。 [...]只是一个地图和filter链，最后有一个toArray(...)来触发评估。

结论是使用lines().parallel()没有区别。由于并行读取两个文件所需的时间较短，因此分割文件会带来性能提升。然而，似乎整个文件是串行读取的。

编辑：我想指出我使用SSD，所以实际上是在寻找时间。该文件总共有1658652（相对较短）的行。在bash中拆分文件大约需要1.5秒： time split -l 829326 file # 829326 = 1658652 / 2 split -l 829326 file 0,14s user 1,41s system 16% cpu 9,560 total

所以我的问题是，Java 8 JDK中是否有任何类或函数可以并行读取所有行而不必先拆分它？例如，如果我有两个CPU核心，则第一行读取器应从第一行开始，第二行(totalLines/2)+1行(totalLines/2)+1 。

您可以从这篇文章中找到一些帮助。试图并行化文件的实际读取可能是错误的树，因为最大的减速将是你的文件系统（即使在SSD上）。

如果你在内存中设置一个文件通道，你应该能够以极快的速度从那里并行处理数据，但是你可能不需要它，因为你会看到一个巨大的速度提升。

如何在Java 8中并行读取文件的所有行

关闭模态JInternalFrame

Java Email message Parser？

Eclipse中源代码的相对路径

使用子类名访问父类静态字段不会加载子类？

使用Jackson进行不对称序列化和反序列化

使用JAXB Marshaller处理XML转义字符（例如引号）

java.util.regex.Matcher中的groupCount（）始终返回0

什么是正确的Java main（）方法参数语法？

如何使用Java连接到本地安装的neo4j服务器

如何在客户端使用JAXB注释进行GWT？