Tag: 本体

如何提高使用维基百科数据时的性能和巨大的数据。 的网页?

我应该使用维基百科的文章链接数据转储从组织的网站中提取代表性术语。 要做到这一点,我 – 已抓取并下载的组织的网页。 (〜11万) 创建了维基百科ID和术语/标题的字典。 (约4,000万条记录) 现在,我应该使用字典处理每个网页,以识别术语并跟踪他们的术语ID和频率。 为了使字典适合内存,我将字典拆分为较小的文件。 根据我对小型数据集的实验,上述处理时间约为75天。 这仅适用于1个组织。 我必须为40多个人做同样的事情。 实施 – HashMap用于在内存中存储字典。 使用Boyer-Moore搜索实现循环遍历每个地图条目以在网页中搜索术语。 对每个网页重复上述操作,并将结果存储在HashMap中。 我已经尝试优化代码并调整JVM以获得更好的性能。 有人可以建议更有效地实施上述方法,将处理时间缩短到几天。 Hadoop是一个可以考虑的选择吗?

如何使用Jena API将资源与其他资源相关联

我创建了一个包含两个类的本体,第一个名为Father ,第二个是名为Son的子类。 我想使用Jena为类父设置以下条件 只有儿子。 有一些儿子。 然后我会对Son这样做: 有一些父亲。 我的第二个问题是我不知道如何将类Son的实例与使用Jena的Father类联系起来。 我知道使用Protégé操纵我的课程是可能的,但我想探索耶拿。

java(jena)的本体论

我正在做一些基于本体的项目。我想识别用户输入的文本的语义。 是否有任何可能的方法来完成我通过jena处理本体的任务?

使用Jena以编程方式生成OWL类层次结构

我想通过提供向量以编程方式使用OWL生成本体。 我的目标是能够在Protégé中打开生成的OWL文件并使用Jena。 输入向量 我要通过的向量: [[layer, network layer, data link layer, physical layer], [network, computer network], [data link], [ontology, ontology extraction]]. 预期产出 输出应具有以下树状层次结构: layer -network layer -data link layer -physical layer network -computer network ontology -ontology extraction data link 层次结构,其中network layer在layer下面等等,是非常重要的。 这是我想要生成的文件的示例:

如何使用JENA创建owl文件?

我陷入了本体创作的中间。 我想用Java创建一个OWL文件,这是我的目标。 我已经创建了分层集群,但现在我必须在本体创建中使用这些集群。 提前致谢。 到目前为止我已经尝试过了。 我得到了狄金森的观点。 现在这是我的代码,我在线程“main”中获得Exception as Exception com.hp.hpl.jena.shared.BadURIException:只有格式良好的绝对URIrefs可以包含在RDF / XML输出中:代码:57 / REQUIRED_COMPONENT_MISSING在SCHEME中:缺少该方案所需的组件。 JenaOwl.java public class JenaOwl { static OntModel jenaModel = null; public static void main(String[] args) throws IOException { JenaOwl jo = new JenaOwl(); FileWriter fw = null; try { jenaModel = createModel(); } catch (Exception ex) { Logger.getLogger(JenaOwl.class.getName()).log(Level.SEVERE, null, ex); } […]

如何将RDF三元组添加到OWLOntology?

我有一些来自RabbitMQ的数据。 数据格式为三元组,因此队列中的消息可能如下所示: :Tom foaf:knows :Anna 其中:是我要导入数据的本体的标准命名空间,但也可以使用其他来自导入的前缀。 三元组由主语,属性/谓语和对象组成,我知道在每条消息中哪个是哪个。 在接收端,我有一个带有OWLOntology对象的Java程序,该对象表示应该临时存储新到达的三元组以用于推理和其他东西的本体。 我有点设法将三元组变成Jena OntModel但这就是它结束的地方。 我尝试使用OWLRDFConsumer但我找不到任何关于如何应用它的信息。 我的函数看起来像这样: public void addTriple(RDFTriple triple) { //OntModel model = ModelFactory.createOntologyModel(); String subject = triple.getSubject().toString(); subject = subject.substring(1,subject.length()-1); Resource s = ResourceFactory.createResource(subject); String predicate = triple.getPredicate().toString(); predicate = predicate.substring(1,predicate.length()-1); Property p = ResourceFactory.createProperty(predicate); String object = triple.getObject().toString(); object = object.substring(1,object.length()-1); RDFNode o = ResourceFactory.createResource(object); Statement […]

我如何为Jena的Ontology添加一些三倍?

我有class1 instance2和class2 instance2 。 我也在我的本体中定义了HasName(object property) 。 现在,如何通过jena将triple( instance1 HasName instance2 )添加到我的本体?