使用LIBSVM来预测用户的真实性

我打算使用LibSVM来预测Web应用程序中的用户真实性。 (1)收集特定用户行为的数据(例如,登录时间,IP地址,国家等)。(2)使用收集的数据训练SVM(3)使用实时数据比较并生成真实性水平的输出

有人可以告诉我怎样才能用LibSVM做这样的事情? Weka可以帮助解决这些类型的问题吗?

您提到的三个步骤是解决方案的概述。 更详细一些:

  1. 确保获得大量标记数据,即使用真实/非真实注释的行为日志。 (如果没有标记数据,您将进入半监督学习的非常先进的领域,或者必须考虑其他解决方案。)
  2. 根据您认为可以很好地预测真实性的数据设计许多function 。 尝试使用该方法并对其进行优化,直到它通过某种统计标准运行良好。 使用十倍交叉validation确保您不会过度拟合。
  3. LibSVM可以输出概率估计值及其答案; 见其手册第8节。