使用\ Z vs \ z作为扫描仪分隔符的行为

[编辑]我找到了答案,但由于新用户的限制,我无法回答这个问题。 无论哪种方式,这都是Java中的已知错误。

http://bugs.java.com/bugdatabase/view_bug.do?bug_id=8028387

我正在尝试在64位ubuntu上将文件读入Java 6中的字符串。 Java给了我一个非常奇怪的结果, "\\Z"它读取整个文件,但是"\\z"它读取整个字符串最多1024个字符。 我已经阅读了所有课程的Java 6 API,但我很茫然。

\ Z和\ z的描述可在以下位置找到:

http://docs.oracle.com/javase/6/docs/api/java/util/regex/Pattern.html#lt

什么可能导致这种奇怪的行为?

 String fileString = new Scanner(new File(fileName)).useDelimiter("\\z").next(); String fileString2 = new Scanner(new File(fileName)).useDelimiter("\\Z").next(); System.out.println("using Z : " + fileString2.length()); System.out.println("Using z "+ fileString.length()); 

输出:使用Z:9720使用z:1024

谢谢!

有关文件/ java-version的详细信息:

用java-6-openjdk-amd64运行Ubuntu(也用oracle java6测试)文件是简单的文本文件UTF-8编码。

正如Pattern文档所述

  • \z输入结束
  • \Z输入结束但是对于最终终止符,如果有的话

我怀疑,因为Scanners缓冲区大小设置为1024 ,

  354 private static final int BUFFER_SIZE = 1024;  //改为1024; 

扫描器读取此数量的字符并将其用作当前输入,因此\z可用于表示其结束,而\Z则不能,因为它不是“最终终结符”(整个输入中有更多元素要读取) 。