Tag: 主题建模

使用Java中的Mallet折叠(估计新文档的主题)在LDA中

我正在通过Java使用Mallet,我无法弄清楚如何针对我训练过的现有主题模型评估新文档。 我生成模型的初始代码与Mallett开发者指南中的主题建模非常相似,之后我只是将模型保存为Java对象。 在稍后的过程中,我从文件重新加载该Java对象,通过.addInstances()添加新实例,然后根据原始训练集中找到的主题仅评估这些新实例。 这个stats.SE线程提供了一些高级建议,但我看不出如何将它们用于Mallet框架。 任何帮助非常感谢。