使用LIBSVM来预测用户的真实性
我打算使用LibSVM来预测Web应用程序中的用户真实性。 (1)收集特定用户行为的数据(例如,登录时间,IP地址,国家等)。(2)使用收集的数据训练SVM(3)使用实时数据比较并生成真实性水平的输出
有人可以告诉我怎样才能用LibSVM做这样的事情? Weka可以帮助解决这些类型的问题吗?
您提到的三个步骤是解决方案的概述。 更详细一些:
- 确保获得大量标记数据,即使用真实/非真实注释的行为日志。 (如果没有标记数据,您将进入半监督学习的非常先进的领域,或者必须考虑其他解决方案。)
- 根据您认为可以很好地预测真实性的数据设计许多function 。 尝试使用该方法并对其进行优化,直到它通过某种统计标准运行良好。 使用十倍交叉validation确保您不会过度拟合。
- LibSVM可以输出概率估计值及其答案; 见其手册第8节。