在本地服务器上使用freebase数据?

是否存在使用freebase数据转储创建类似于freebase提供的数据库的现有方法,但是在您自己的服务器上? 相当多的freebase,但在本地,而不是通过API?

我想有可能创建,但是现在有没有现成的解决方案? 或者不使用API​​的类似数据的替代解决方案? 我没有为dbpedia找到这个:|

看一下Google Code上的freebase-quad-rdfize项目。 它应该允许您下载每周Freebase四重转储并将其加载到您选择的RDF三重存储中。

freebase-quad-rdfize的替代方案如下: https : //github.com/castagna/freebase2rdf

我使用Apache Jena的TDB存储来加载RDF数据,使用Fuseki通过HTTP上的SPARQL协议来提供数据。

也可以看看:

此外,您现在有另一种选择: http : //basekb.com/

我是以下的创建者:BaseKB ,Freebase到RDF的第一个可用转换。

Freebase四重转储中存在关键完整性问题,这使得很难从四重转储中获得完全正确的结果。 :BaseKB重建Freebase的关键结构,以便保持唯一名称假设。 这很重要,因为编写像SQL查询一样工作的简单SPARQL查询的能力取决于此。

现在,:BaseKB存在两个版本。 有一个免费版,包含1.2亿个关于400万个主题的事实(来自维基百科的主题),还有一个包含所有内容的“专业版”。

至于Phillip Kendall提出的性能问题,我可以说这主要是拥有足够的RAM。 凭借24GB的RAM,我可以在一小时内将免费版加载到三重商店。 有些查询比我喜欢的时间更长,但整体查询性能良好。

任何想要使用“Pro”版本的人都需要exception强大的硬件,并且会花费大量精力让他们的工具链工作。 我正在与合作伙伴合作,以令人满意的方式向用户提供“专业版”。

将数据导入您选择的三重商店并不难 – 但除非您做一些微不足道的工作,否则在合理的时间内获得任何答案都会遇到很大困难。

几年前有人确实将整个数据集导入到MySQL中 – 加载需要2周时间,甚至简单的查询,例如“作为一个人输入的事物的数量”花了> 1分钟来给出答案。 这是在大硬件上,数据集现在比以前大得多。

如果您可以将数据库导出为TXT或数据库文件(如MDB,XLS或任何其他高度可传输的数据格式)中的说明,制表符分隔或逗号分隔值,那么使用该数据库在计算机上构建自己的MySQL数据库没有问题。数据。 主要是确保您可以导出数据,您可以从中重建自己的数据库。

Interesting Posts