使用\ Z vs \ z作为扫描仪分隔符的行为
[编辑]我找到了答案,但由于新用户的限制,我无法回答这个问题。 无论哪种方式,这都是Java中的已知错误。
http://bugs.java.com/bugdatabase/view_bug.do?bug_id=8028387
我正在尝试在64位ubuntu上将文件读入Java 6中的字符串。 Java给了我一个非常奇怪的结果, "\\Z"
它读取整个文件,但是"\\z"
它读取整个字符串最多1024个字符。 我已经阅读了所有课程的Java 6 API,但我很茫然。
\ Z和\ z的描述可在以下位置找到:
http://docs.oracle.com/javase/6/docs/api/java/util/regex/Pattern.html#lt
什么可能导致这种奇怪的行为?
String fileString = new Scanner(new File(fileName)).useDelimiter("\\z").next(); String fileString2 = new Scanner(new File(fileName)).useDelimiter("\\Z").next(); System.out.println("using Z : " + fileString2.length()); System.out.println("Using z "+ fileString.length());
输出:使用Z:9720使用z:1024
谢谢!
有关文件/ java-version的详细信息:
用java-6-openjdk-amd64运行Ubuntu(也用oracle java6测试)文件是简单的文本文件UTF-8编码。
正如Pattern文档所述
-
\z
输入结束 -
\Z
输入结束但是对于最终终止符,如果有的话
我怀疑,因为Scanners缓冲区大小设置为1024 ,
354 private static final int BUFFER_SIZE = 1024; //改为1024;
扫描器读取此数量的字符并将其用作当前输入,因此\z
可用于表示其结束,而\Z
则不能,因为它不是“最终终结符”(整个输入中有更多元素要读取) 。