有多少人被Java子串内存问题所困扰?

我最近发现java.lang.String.substring方法不返回一个新字符串,而是返回一个包含原始字符串的视图。 这可能会对记忆产生影响。 例如,如果您正在读取ascii文件,并使用子字符串解析文件中的标记并将子字符串的结果存储在内存中 – 您实际存储在内存中的是子字符串操作之前的整个字符串! 您当然可以通过在自己的版本中包装子字符串来解决此问题,该子字符串返回子字符串结果的新字符串。

我曾被它咬过一次,逐行读取字典文件。 每一行都很短,但BufferedReader创建的缓冲区意味着每个字符串都由一个80-char数组支持。

那是我第一次学习写作的时候:

 word = new String(word); 

大多数时候它不是问题 – 当然它可以比“采取完全独立的复制”方法更有效。

在2000年或2001年,早期的XML解析器之一(我不记得是哪个)遭遇了这个问题。 通过阅读一些早期FpML (描述金融产品的非常大的XML文档)中的3个字段,我们花了一段时间来追踪我们的内存不足。

什么是令人讨厌的是,如果写一个

 String copy = new String(s); 

IntelliJ IDEA警告我,这是多余的! 愚蠢的IDE。

http://java.sun.com/j2se/1.5.0/docs/api/java/lang/String.html

在java文档中,它声明substring方法确实返回一个新字符串。

还是我误解了这个问题?

此外,字符串是不可变的。 这是一个SO线程,解释了为什么会这样。