Tag: gate

如何从文本中检索各种日期和时间值

我想从一组字符串中检索日期和其他时间实体。 这可以在不解析JAVA中的日期字符串的情况下完成,因为大多数解析器处理有限范围的输入模式。 但输入是一个手动输入,在这里,因此含糊不清。 输入可以是: 9月12日| 3月中旬| 12. 2013年9月 9月12日| 9月12日| 2013 9月13日| 9月12日,2013年2月12日 我在Java中找到了许多关于查找日期的答案,但是大多数答案并没有处理如此巨大的输入模式。 我已经尝试使用SimpleDateFormat类并使用一些parse()函数来检查解析函数是否中断,这意味着它不是一个日期。 我试过使用regex但我不确定它是否适合这种情况。 我还使用ClearNLP来注释日期,但它没有给出可靠的注释集。 获得这些价值观的最接近方法可能是使用如下所述Chain of responsibility 。 是否有一个库具有一组日期模式。 我可以用那个吗?

在没有GUI的情况下从Java程序内部运行GATE管道。 用gate构建一个tomcat应用程序

我已经为GATE构建了一些插件组件,并结合ANNIE工具,在GATE平台上运行管道。 有谁知道如何从控制台运行管道? 我想在Tomcat中构建一个Web应用程序,它将从网页中获取纯文本,将其传递给我构建的GATE管道并执行某些操作。 所以我需要在一个简单的Java文件中运行GATE,怎么做呢? 提前谢谢,抱歉我的语法很差

Jape文件在一个句子中找到模式

如果我在jape规则中写的单词出现在同一个句子中,我需要注释一个句子的一部分。 例如,句子是“孩子无法抗拒他的日常生活中的任何变化”。 我在“trouble.lst”文件中添加了像抵抗这样的词,并在“alteration.lst”文件中进行了更改。 现在在这句话中,我需要注释“抵抗任何变化”的部分为“A3b”。 我尝试使用下面的代码,但它没有考虑同一句话中的单词。 我的jape规则也是从不同的句子中取词。 假设抵抗出现在一个句子中并且在其他一些后面的句子中发生变化,因此这段代码也注释了这一点。 任何人都可以帮我找出解决方案吗? Phase:secondpass Input: Lookup Options: control = brill Rule: A3b ({Lookup.majorType == “trouble”} {Lookup.majorType == “alteration”} ):label –> :label.A3b = {rule= “A3b”}

句子分类(分类)

我一直在阅读有关文本分类的文章,并发现了几种可用于分类的Java工具,但我仍然想知道:文本分类是否与句子分类相同! 有没有专注于句子分类的工具?

文本简化工具(Java)

使用Java进行文本简化的最佳工具是什么? 以下是文本简化的示例: John, who was the CEO of a company, played golf. ↓ John played golf. John was the CEO of a company.