如果列标签是同名的,如何使用java解析Spark中的XML
我尝试使用java 1.8解析spark 2.2中的XML,但这并没有给出预期的数据集。
样本xml –
url1 123 english
我试过的代码 –
Dataset xmlParse = spark .read() .format("com.databricks.spark.xml") //.option("rootTag", "RECORDS") .option("rowTag", "RECORD") .load("sample.xml"); xmlParse.printSchema() root |-- PROP: array (nullable = true) | |-- element: struct (containsNull = true) | | |-- PVAL: string (nullable = true) | | |-- _NAME: string (nullable = true)
xmlParse.show
|PROP +------------------------------------------- |[[urlvalue,product.url],[123,product.id],[English,product.language]] |
预期数据集/dataframe: –
product.url|product.id|product.language urlvalue |123 |English