Tag: 萨克斯

如何在java或php中解析一个非常大的xml文件并插入到mysql DB中

我正在尝试将一个庞大的xml文件解析到我的MySQL数据库中。 该文件是4.7gb。 我知道,它疯了。 数据来自这里: http : //www.discogs.com/data/ (最新专辑xml是700mb压缩和4.7gb解压缩) 我可以使用java或php来解析和更新数据库。 我认为java是更聪明的想法。 我需要找到一种方法来解析xml而不填充我的4gb ram,并将其加载到db中。 这样做最聪明的方法是什么? 我听说过SAX解析器,我在想正确的方向吗? 现在,我不关心从这些url下载图像,我只想要数据库中的数据。 我还没有设计表格,但我现在对xml方面更感兴趣。 我使用php的fread()来打开文件的前1000个叮咬,所以至少我可以看到它的样子,这里是文件中第一张专辑结构的样本: Persuader, The Stockholm 12″ Electronic Deep House Sweden 1999-03-00 Recorded at the Globe studio in Stockholm. The titles are the names of Stockholm’s districts. 5427 A Östermalm 4:45 B1 Vasastaden 6:11 B2 Kungsholmen 2:49 C1 Södermalm 5:38 C2 […]