Tag: opennlp

在OpenNLP中培训命名实体

我想为印度名字训练一个语料库: class NameTraining { public static void TrainNames() throws IOException { Charset charset = Charset.forName(“UTF-8”); FileReader fileReader = new FileReader(“train.txt”); ObjectStream fileStream = new PlainTextByLineStream(fileReader); ObjectStream sampleStream = new NameSampleDataStream(fileStream); TokenNameFinderModel model = NameFinderME.train(“pt-br”, “train”, sampleStream, Collections.emptyMap()); NameFinderME nfm = new NameFinderME(model); } public static void main(String args[]) throws IOException { NameTraining det = new […]

有没有办法获取OpenNLP的“原始”文本数据?

我知道之前曾问过这个问题 – 但答案并不令人满意(从某种意义上说,答案只是一个链接)。 所以我的问题是,有没有办法扩展现有的openNLP模型? 我已经了解了DBPedia / Wikipedia的技术。 但是如果我只是想附加一些文字来改进模型呢?真的没有办法吗? (如果是这样 – 这真的很愚蠢……)

如何使用OpenNLP创建自定义模型?

我正在尝试使用OpenNLP Java API从文档中提取 名称,技能等实体 。 但它没有提取适当的名称 。 我正在使用opennlp sourceforge链接上提供的模型 这是一段java代码 – public class tikaOpenIntro { public static void main(String[] args) throws IOException, SAXException, TikaException { tikaOpenIntro toi = new tikaOpenIntro(); toi.filest(“”); String cnt = toi.contentEx(); toi.sentenceD(cnt); toi.tokenization(cnt); String names = toi.namefind(toi.Tokens); toi.files(names); } public String Tokens[]; public String contentEx() throws IOException, SAXException, TikaException { InputStream […]

在NLP的帮助下分析句子并提取人名,组织和位置

我需要使用NLP解决以下问题,您能否指出如何使用OpenNLP API实现此目的 一个。 如何判断一个句子是否暗示过去,现在或将来的某种行为。 (eg) I was very sad last week – past I feel like hitting my neighbor – present I am planning to go to New York next week – future 湾 如何找到与个人,公司或国家相对应的单词 (eg) John is planning to specialize in Electrical Engineering in UC Berkley and pursue a career with IBM). 人=约翰 公司= […]

为什么从WEB-INF文件夹中加载POSModel文件不起作用?

我正在使用Spring MVC进行我的Web项目。 我将模型文件放在WEB-INF目录中 String taggerModelPath = “/WEB-INF/lib/en-pos-maxent.bin”; String chunkerModelPath = “/WEB-INF/lib/en-chunker.bin”; POSModel model = new POSModelLoader() .load(new File(servletContext.getResource(taggerModelPath).toURI().getPath())); 这适用于Windows环境。 但是当我在远程Linux服务器上部署它时出现错误 HTTP状态500 – 请求处理失败; 嵌套exception是opennlp.tools.cmdline.TerminateToolException:POS Tagger模型文件不存在! 路径:/localhost/nlp/WEB-INF/lib/en-pos-maxent.bin 访问文件资源的最佳方法是什么? 谢谢

opennlp中的Span类不起作用

我是java opennlp的新手,我正在尝试实现一个程序,从文件中提取城市名称,但我首先在字符串上测试我的代码,我得到一些错误,代码是 import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.IOException; import java.io.InputStream; import main.java.opennlp.tools.namefind.NameFinderME; import main.java.opennlp.tools.namefind.TokenNameFinderModel; import main.java.opennlp.tools.util.InvalidFormatException; import main.java.opennlp.tools.util.Span; import opennlp.tools.tokenize.Tokenizer; import opennlp.tools.tokenize.TokenizerME; import opennlp.tools.tokenize.TokenizerModel; import opennlp.tools.tokenize.SimpleTokenizer; import opennlp.tools.sentdetect.SentenceDetectorME; import opennlp.tools.sentdetect.SentenceModel; import org.xml.sax.SAXException; public class CityFinder { public String Tokens[]; public static void main(String[] args) throws IOException, SAXException { CityFinder toi = new CityFinder(); String cnt; […]

在Java中将单词转换为其名词/形容词/动词forms

是否可以使用Java替代NLTK来“详细说明”这个问题? 在动词/名词/形容词forms之间转换单词 例如,我想将天生转换为出生,因为当使用Wordnet相似性时,该算法并未表明出生和出生非常相似。 因此,我想将出生时转为出生,反之亦然。 为了有更多相似的词。 你有什么建议? 我发现了一些工具,但我不确定他们是否可以这样做: – NTLK(我猜只有python) – OpenNlp – Stanford-Nlp – Simple NLG 谢谢

有没有办法使用OpenNLP获得句子的主题?

有没有办法使用OpenNLP获得句子的主题? 我试图找出用户句子中最重要的部分。 通常,用户将向我们的“引擎”提交句子,并且我们想要确切知道该句子的核心主题是什么。 目前我们使用openNlp来: 大块的句子 识别句子的名词短语,动词等 确定句子的所有“主题” (没有完成!)确定句子的“核心主题” 如果您有任何好主意,请告诉我。

我如何在OpenNLP中训练命名实体识别器标识符?

好的,我有以下代码来训练OpenNLP的NER标识符 FileReader fileReader = new FileReader(“train.txt”); ObjectStream fileStream = new PlainTextByLineStream(fileReader); ObjectStream sampleStream = new NameSampleDataStream(fileStream); TokenNameFinderModel model = NameFinderME.train(“pt-br”, “train”, sampleStream, Collections.emptyMap()); nfm = new NameFinderME(model); 我不知道如果缺少某些东西我是否做错了,但分类不起作用。 我假设train.txt错了。 发生的错误是所有令牌都只分类为一种类型。 我的train.txt数据类似于以下示例,但有更多的条目变化和数量。 另一件事是我每次都是从文本中逐字逐句地分类,而不是所有的标记。 8000m 100ºC 50kg Renato 有人可以certificate我做错了吗?

如何在Java中使用OpenNLP?

我想要POStag一个英文句子并做一些处理。 我想使用openNLP。 我安装了它 当我执行命令 I:\Workshop\Programming\nlp\opennlp-tools-1.5.0-bin\opennlp-tools-1.5.0>java -jar opennlp-tools-1.5.0.jar POSTagger models\en-pos-maxent.bin < Text.txt 它为Text.txt中的输入提供输出POSTagging Loading POS Tagger model … done (4.009s) My_PRP$ name_NN is_VBZ Shabab_NNP i_FW am_VBP 22_CD years_NNS old._. Average: 66.7 sent/s Total: 1 sent Runtime: 0.015s 我希望它安装得当吗? 现在我如何从java应用程序内部执行此操作? 我已经将openNLPtools,jwnl,maxent jar添加到项目中但是如何调用POStagging?