Tag: 语言检测

使用PostgreSQL中的数据进行语言检测

我在PostgreSQL中有一个表,其中列是文本。 我需要一个能够识别每个文本语言的库或工具以用于测试目的。 不需要PostgreSQL代码,因为我在安装语言时遇到问题,但是任何可以连接到数据库,检索文本并识别它的语言都是受欢迎的。 我在Perl脚本的答案中使用了Lingua::Identify ,它有效,但结果不准确。 我想要识别的文本来自网络,大多数是葡萄牙语,但Lingua::Identify将法语,意大利语和西class牙语分类为类似的语言。 我需要更精确的东西。 我添加了java和r标签,因为我在系统中使用的语言和使用它们的解决方案很容易实现,但欢迎使用任何语言的解决方案。