在Windows上检查Java中文件是否为空的最有效方法

我试图在Windows上用Java检查日志文件是否为空(意味着没有错误)。 到目前为止,我尝试过使用2种方法。

方法1(失败)

FileInputStream fis = new FileInputStream(new File(sLogFilename)); int iByteCount = fis.read(); if (iByteCount == -1) System.out.println("NO ERRORS!"); else System.out.println("SOME ERRORS!"); 

方法2(失败)

 File logFile = new File(sLogFilename); if(logFile.length() == 0) System.out.println("NO ERRORS!"); else System.out.println("SOME ERRORS!"); 

现在,当日志文件为空(没有内容)时,这些方法都会失败,但文件大小不为零(2个字节)。

检查文件是否为空的最有效最准确的方法是什么? 我要求提高效率,因为我必须循环检查文件大小数千次。

注意:文件大小只会徘徊在几到10 KB左右!

方法3(失败)

按照@ Cygnusx1的建议,我也尝试过使用FileReader ,但没有成功。 这是片段,如果有人感兴趣的话。

 Reader reader = new FileReader(sLogFilename); int readSize = reader.read(); if (readSize == -1) System.out.println("NO ERRORS!"); else System.out.println("SOME ERRORS!"); 

检查第一行文件是否为空:

 BufferedReader br = new BufferedReader(new FileReader("path_to_some_file")); if (br.readLine() == null) { System.out.println("No errors, and file empty"); } 

为什么不使用:

 File file = new File("test.txt"); if (file.length() == 0) { // file empty } else { // not empty } 

它有什么问题吗?

您可以选择尝试FileReader方法,但现在可能还没有时间放弃。 如果BOM字段正在销毁,请尝试在stackoverflow上发布此解决方案。

字节顺序标记用Java解压缩文件读取

另一种方法是(使用Apache Commons FileUtils ) –

 private void printEmptyFileName(final File file) throws IOException { if (FileUtils.readFileToString(file).trim().isEmpty()) { System.out.println("File is empty: " + file.getName()); } } 

这是对Saik0的答案的改进,该答案基于Anwar Shaikh的评论,即太大的文件(高于可用内存)将引发exception:

使用Apache Commons FileUtils

 private void printEmptyFileName(final File file) throws IOException { /*Arbitrary big-ish number that definitely is not an empty file*/ int limit = 4096; if(file.length < limit && FileUtils.readFileToString(file).trim().isEmpty()) { System.out.println("File is empty: " + file.getName()); } } 

尝试使用FileReader ,此读取器用于读取字符流,而FileInputStream用于读取原始数据。

来自Javadoc:

FileReader用于读取字符流。 要读取原始字节流,请考虑使用FileInputStream。

由于您想要读取日志文件,因此FileReader是使用IMO的类。

 String line = br.readLine(); String[] splitted = line.split("anySplitCharacter"); if(splitted.length == 0) //file is empty else //file is not empty 

我的文本文件遇到了同样的问题。 虽然它是空的,但readLine方法返回的值不是null。 因此,我尝试将其值分配给我用于访问数据的分割属性的String数组。 它确实对我有用。 试试这个并告诉我它是否适用于你。

从http://www.coderanch.com/t/279224/Streams/java/Checking-empty-file中窃取

 FileInputStream fis = new FileInputStream(new File("file_name")); int b = fis.read(); if (b == -1) { System.out.println("!!File " + file_name + " emty!!"); } 

更新:我的第一个答案是不成熟的,包含一个错误。

你的第一个片段的想法是正确的。 你可能想检查iByteCount == -1 :文件是否至少有一个字节:

 if (iByteCount == -1) System.out.println("NO ERRORS!"); else System.out.println("SOME ERRORS!"); 

现在,当日志文件为空(没有内容)时,这些方法都会失败,但文件大小不为零(2个字节)。

实际上,我认为你会发现该文件不是空的。 相反,我认为你会发现这两个字符是CR和NL; 即文件由一行为空。

如果你想测试一个文件是空的还是只有一个空行,那么一个简单,相对有效的方法是:

 try (BufferedReader br = new BufferedReader(FileReader(fileName))) { String line = br.readLine(); if (line == null || (line.length() == 0 && br.readLine() == null)) { System.out.println("NO ERRORS!"); } else { System.out.println("SOME ERRORS!"); } } 

我们能更有效地做到这一点吗? 有可能。 这取决于您处理三种不同情况的频率:

  • 一个完全空的文件
  • 由单个空行组成的文件
  • 具有非空行或多行的文件。

你可以通过使用Files.length()和/或只读取前两个字节来Files.length() 。 但问题包括:

  • 如果你们都测试文件大小并读取前几个字节,那么你正在进行2次系统调用。
  • 实际的线路终止序列可以是CR,NL或CR NL,具体取决于平台。 (我知道你说这是针对Windows的,但是如果你需要移植你的应用程序会怎么样?或者如果有人发给你一个非Windows文件?)
  • 避免设置流/读取器堆栈会很好,但文件的字符编码可以将CR和NL映射到字节0x0d0x0a之外的其他内容。 (例如…… UTF-16)
  • 然后有一些令人烦恼的习惯,一些Windows实用程序已将BOM标记放入UTF-8编码文件中。 (这甚至会弄乱上面的简单版本!)

所有这些意味着最有效的解决方案将变得相当复杂。

我认为最好的方法是使用file.length == 0

有时第一行可能是空的。