Tag: 分类

如何训练libsvm格式的图像(像素)数据用于Java识别

我想让一个Java应用程序通过使用libsvm来识别字符,但是当进入这个时,我不明白如何训练图像数据与libsvm一起使用? 最近要学习它,我用现有数据进行了测试: 我还通过将每个像素转换为0来创建基于32×32的训练图像数据,但我不知道它是否可以用于创建libsvm训练数据格式? 还有libsvm测试数据是如何创建的? 转换图像像素(0,1)示例: 00000000000001111000000000000000 00000000000011111110000000000000 00000000001111111111000000000000 00000001111111111111100000000000 00000001111111011111100000000000 00000011111110000011110000000000 00000011111110000000111000000000 00000011111110000000111100000000 00000011111110000000011100000000 00000011111110000000011100000000 00000011111100000000011110000000 00000011111100000000001110000000 00000011111100000000001110000000 00000001111110000000000111000000 00000001111110000000000111000000 00000001111110000000000111000000 00000001111110000000000111000000 00000011111110000000001111000000 00000011110110000000001111000000 00000011110000000000011110000000 00000001111000000000001111000000 00000001111000000000011111000000 00000001111000000000111110000000 00000001111000000001111100000000 00000000111000000111111000000000 00000000111100011111110000000000 00000000111111111111110000000000 00000000011111111111110000000000 00000000011111111111100000000000 00000000001111111110000000000000 00000000000111110000000000000000 00000000000011000000000000000000 0 00000000000001111111110000000000 00000000001111111111111000000000 00000000011111111111111100000000 00000000011111111111111100000000 00000000011111111111111110000000 00000001111111111111111100000000 00000000111110000011111100000000 00000000000000000001111100000000 00000000000000000001111100000000 00000000000000000001111100000000 00000000000000000011111000000000 00000000000000000111111000000000 00000000000000000111111000000000 00000000000000000111111000000000 00000000000000001111110000000000 00000000011111111111111111000000 00000000111111111111111111100000 […]

Java文本分类问题

我有一组Books对象,类Book定义如下: Class Book{ String title; ArrayList taglist; } 标题是书的标题,例如: Javascript for dummies 。 和taglist是我们示例的标签列表: Javascript,jquery,“web dev”,.. 正如我所说,有一套书谈论不同的东西:IT,生物,历史……每本书都有一个标题和一组描述它的标签。 我必须按主题将这些书自动分类为分开的集合,例如: IT书籍: Java for dummies Javascript for dummies 在30天内学习闪光灯 C ++编程 历史书: 世界大战 美国在1960年 马丁路德金的一生 生物学书籍: …. 你们知道一种分类算法/方法来申请这类问题吗? 解决方案是使用外部API来定义文本的类别,但问题在于书籍使用不同的语言:法语,西class牙语,英语。

识别任意日期字符串

我需要能够识别日期字符串。 如果我无法区分月份和日期(例如12/12/10)并不重要,我只需要将字符串分类为日期,而不是将其转换为Date对象。 所以,这实际上是一个分类而不是解析问题。 我会有一些文字,例如: “bla bla bla bla 12 Jan 09 bla bla bla 01/04/10 bla bla bla” 我需要能够识别每个日期字符串的开始和结束边界。 我想知道是否有人知道任何可以做到这一点的java库。 到目前为止,我的google-fu还没有拿到任何东西。 更新:我需要能够识别出最广泛的代表日期的方法。 当然,天真的解决方案可能是为每种可能的格式编写if语句,但是模式识别方法与训练有素的模型一样,理想情况下我正在追求的。