Tag: opennlp

如何在OpenNLP中创建一个好的NER培训模型?

我刚开始使用OpenNLP。 我需要创建一个简单的训练模型来识别名称实体。 在这里阅读文档https://opennlp.apache.org/docs/1.8.0/apidocs/opennlp-tools/opennlp/tools/namefind我看到这个简单的文本来训练模型: Pierre Vinken , 61 years old , will join the board as a nonexecutive director Nov. 29 . Mr . Vinken is chairman of Elsevier NV , the Dutch publishing group . Rudolph Agnew , 55 years old and former chairman of Consolidated Gold Fields PLC , was named a director of […]

如何“更新”现有的命名实体识别模型 – 而不是从头开始创建?

请参阅OpenNLP的教程步骤 – 命名实体识别: 链接到教程我使用此处的“en-ner-person.bin”模型在本教程中,有关于培训和创建新模型的说明。 有没有办法用额外的训练数据“更新”现有的“en-ner-person.bin”? 假设我有一个500个额外人名的列表,否则不会被识别为人 – 我如何生成新模型?

如何使用Open nlp的分块解析器提取名词短语

我是自然语言处理的新手。我需要从文本中提取名词短语。到目前为止,我已经使用open nlp的分块解析器来解析我的文本以获得树结构。但是我无法从中提取名词短语。树结构,在打开的nlp中是否有任何正则表达式模式,以便我可以用它来提取名词短语。 下面是我正在使用的代码 InputStream is = new FileInputStream(“en-parser-chunking.bin”); ParserModel model = new ParserModel(is); Parser parser = ParserFactory.create(model); Parse topParses[] = ParserTool.parseLine(line, parser, 1); for (Parse p : topParses){ p.show();} 在这里,我得到的输出为 (TOP(S(S(ADJP(JJ欢迎)(PP(TO to)(NP(NNP Big)(NNP Data。)))))(S(NP(PRP We))(VP(VP(VBP)) (VP(VBG工作)(PP(IN)(NP(NNP自然)(NNP语言)(NNP Processing.can)))))(NP(DT some)(CD one)(NN帮助))(NP( PRP us))(PP(IN in)(S(VP(VBG提取)(NP(DT)(NN名词)(NNS短语))(PP(IN))(NP(DT))(NN树)( WP结构。)))))))))) 有人可以帮助我获取像NP,NNP,NN等名词短语。可以告诉我,我是否需要使用任何其他NP Chunker来获取名词短语?是否有任何正则表达式模式来实现相同的目的。 请帮帮我。 提前致谢 Gouse。