如何在解析CSV行中的空位置时避免触发ArrayIndexOutOfBoundsException?
String[] values = line.split(","); Long locId = Long.parseLong(replaceQuotes(values[0])); String country = replaceQuotes(values[1]); String region = replaceQuotes(values[2]); String city = replaceQuotes(values[3]); String postalCode = replaceQuotes(values[4]); String latitude = replaceQuotes(values[5]); String longitude = replaceQuotes(values[6]); String metroCode = replaceQuotes(values[7]); String areaCode = replaceQuotes(values[8]); //... public String replaceQuotes(String txt){ txt = txt.replaceAll("\"", ""); return txt; }
我正在使用上面的代码来解析具有以下格式的数据的CSV:
828,"US","IL","Melrose Park","60160",41.9050,-87.8641,602,708
但是,当我遇到如下所示的一行数据时,我得到java.lang.ArrayIndexOutOfBoundsException: 7
1,"O1","","","",0.0000,0.0000,,
这是否意味着每当我尝试访问values[7]
的值时,都会抛出exception?
如果是这样,我如何解析文本行的那个位置不包含数据的行?
首先, String.split()
不是一个很好的CSV解析器:它不知道引号,只要你的一个引用值包含一个逗号就会搞砸。
话虽如此,默认情况下String.split()
遗漏空的尾随元素。 您可以使用双参数变量来影响它:
String[] values = line.split(",", -1);
-
-1
(或任何负值)表示数组将根据需要大小。 - 使用正值可以完成最大量的拆分(意味着超出该值的所有内容都将是单个值,即使它包含逗号)。
-
0
(默认情况下,如果使用单参数值)意味着数组将尽可能大, 但空的尾随值将被排除在数组之外(完全如您所见)。
作为一般规则,如果已经存在一个有效的解析器,你永远不应该破解你自己的(错误的)解析器。 CSV不容易正确解析,并且String.split将不会执行任务,因为CSV允许在"
s之间使用而不作为单独的工作。
考虑使用OpenCSV 。 这将解决您现在遇到的问题以及用户在使用数据时将遇到的问题。