Tag: 相似度

比较两种不同长度的数组

我正在开发一个Android程序,它将比较使用手势点的手势的相似性。 我有两个像这样的数组: gest_1 = [120,333,453,564,234,531] gest_2 = [222,432,11,234,223,344,534,523,432,234] 我知道没有办法动态调整其中一个数组的大小,所以我有什么方法可以使用这些数组比较这些手势并返回相似性? 请注意,数组中的数据只是随机输出。

我如何编写在Java Code中使用相似性度量的SPARQL查询

我想知道在Java代码中编写此SPARQL查询的简单方法: select ?input ?string (strlen(?match)/strlen(?string) as ?percent) where { values ?string { “London” “Londn” “London Fog” “Lando” “Land Ho!” “concatenate” “catnap” “hat” “cat” “chat” “chart” “port” “part” } values (?input ?pattern ?replacement) { (“cat” “^x[^cat]*([c]?)[^at]*([a]?)[^t]*([t]?).*$” “$1$2$3”) (“Londn” “^x[^Londn]*([L]?)[^ondn]*([o]?)[^ndn]*([n]?)[^dn]*([d]?)[^n]*([n]?).*$” “$1$2$3$4$5”) } bind( replace( concat(‘x’,?string), ?pattern, ?replacement) as ?match ) } order by ?pattern desc(?percent) 此代码包含在讨论中使用iSPARQL使用相似性度量来比较值 。 […]

百分比相似性分析(Java)

我有以下情况: 字符串a =“网络爬虫是一种自动浏览万维网互联网的计算机程序”; 字符串b =“Web Crawler计算机程序浏览万维网”; 是否有任何想法或标准算法来计算相似性的百分比? 例如,在上述情况下,通过手动查看估计的相似度应为90%++。 我的想法是对两个字符串进行标记,并比较匹配的标记数量。 类似的东西(7个令牌/ 1个令牌)* 100.但是,当然,这种方法根本没有效果。 比较匹配的字符数也似乎无效…. 任何人都可以给一些指导??? 以上是我的项目Plagiarism Analyzer的一部分。 因此,匹配的单词将完全相同而没有任何同义词。 在这种情况下唯一的问题是如何计算相当准确的相似性百分比。 非常感谢任何帮助。

java中的PHP similar_text()

您是否知道Java中的PHP similar_text函数的任何严格等效实现?

文本相似度算法

我有两个字幕文件。 我需要一个函数来告诉它们是代表相同的文本还是相似的文本 有时只有一个文件中有“风正在吹……音乐在播放”这样的评论。 但80%的内容都是一样的。 该函数必须返回TRUE(文件表示相同的文本)。 有时会出现像1这样的拼写错误,而不是l(1-L),就像这里一样: 她只有行李 。 当然,这意味着函数必须返回TRUE。 我的意见: 该函数应返回文本相似度的百分比 – 同意 “所有人都很开心”和“所有人都不高兴” – 这里被认为是拼写错误,因此被视为同一文本。 确切地说,函数返回的百分比将更低,但足够高以表示短语是相似的 请考虑是否要在整个文件或搜索字符串上应用Levenshtein – 不确定Levenshtein,但算法必须作为一个整体应用于文件。 不过,这将是一个很长的字符串。

相似度得分 – Levenshtein

我在Java中实现了Levenshtein算法,现在我正在通过算法进行校正,即成本。 这确实有点帮助但不多,因为我希望结果为百分比。 所以我想知道如何计算这些相似点。 我也想知道你们这样做的原因以及原因。