如何在解析CSV行中的空位置时避免触发ArrayIndexOutOfBoundsException?

String[] values = line.split(","); Long locId = Long.parseLong(replaceQuotes(values[0])); String country = replaceQuotes(values[1]); String region = replaceQuotes(values[2]); String city = replaceQuotes(values[3]); String postalCode = replaceQuotes(values[4]); String latitude = replaceQuotes(values[5]); String longitude = replaceQuotes(values[6]); String metroCode = replaceQuotes(values[7]); String areaCode = replaceQuotes(values[8]); //... public String replaceQuotes(String txt){ txt = txt.replaceAll("\"", ""); return txt; } 

我正在使用上面的代码来解析具有以下格式的数据的CSV:

 828,"US","IL","Melrose Park","60160",41.9050,-87.8641,602,708 

但是,当我遇到如下所示的一行数据时,我得到java.lang.ArrayIndexOutOfBoundsException: 7

 1,"O1","","","",0.0000,0.0000,, 

这是否意味着每当我尝试访问values[7]的值时,都会抛出exception?

如果是这样,我如何解析文本行的那个位置不包含数据的行?

首先, String.split()不是一个很好的CSV解析器:它不知道引号,只要你的一个引用值包含一个逗号就会搞砸。

话虽如此,默认情况下String.split()遗漏空的尾随元素。 您可以使用双参数变量来影响它:

 String[] values = line.split(",", -1); 
  • -1 (或任何负值)表示数组将根据需要大小。
  • 使用正值可以完成最大量的拆分(意味着超出该值的所有内容都将是单个值,即使它包含逗号)。
  • 0 (默认情况下,如果使用单参数值)意味着数组将尽可能大, 空的尾随值将被排除在数组之外(完全如您所见)。

作为一般规则,如果已经存在一个有效的解析器,你永远不应该破解你自己的(错误的)解析器。 CSV不容易正确解析,并且String.split将不会执行任务,因为CSV允许在" s之间使用而不作为单独的工作。

考虑使用OpenCSV 。 这将解决您现在遇到的问题以及用户在使用数据时将遇到的问题。