如果列标签是同名的,如何使用java解析Spark中的XML

我尝试使用java 1.8解析spark 2.2中的XML,但这并没有给出预期的数据集。

样本xml –

   url1   123   english   

我试过的代码 –

  Dataset xmlParse = spark .read() .format("com.databricks.spark.xml") //.option("rootTag", "RECORDS") .option("rowTag", "RECORD") .load("sample.xml"); xmlParse.printSchema() root |-- PROP: array (nullable = true) | |-- element: struct (containsNull = true) | | |-- PVAL: string (nullable = true) | | |-- _NAME: string (nullable = true) 

xmlParse.show

  |PROP +------------------------------------------- |[[urlvalue,product.url],[123,product.id],[English,product.language]] | 

预期数据集/dataframe: –

  product.url|product.id|product.language urlvalue |123 |English