Tag: 相似度

比较两种不同长度的数组: 我正在开发一个Android程序，它将比较使用手势点的手势的相似性。我有两个像这样的数组： gest_1 = [120,333,453,564,234,531] gest_2 = [222,432,11,234,223,344,534,523,432,234] 我知道没有办法动态调整其中一个数组的大小，所以我有什么方法可以使用这些数组比较这些手势并返回相似性？请注意，数组中的数据只是随机输出。

我如何编写在Java Code中使用相似性度量的SPARQL查询: 我想知道在Java代码中编写此SPARQL查询的简单方法： select ?input ?string (strlen(?match)/strlen(?string) as ?percent) where { values ?string { “London” “Londn” “London Fog” “Lando” “Land Ho!” “concatenate” “catnap” “hat” “cat” “chat” “chart” “port” “part” } values (?input ?pattern ?replacement) { (“cat” “^x[^cat]*([c]?)[^at]*([a]?)[^t]*([t]?).*$” “$1$2$3”) (“Londn” “^x[^Londn]*([L]?)[^ondn]*([o]?)[^ndn]*([n]?)[^dn]*([d]?)[^n]*([n]?).*$” “$1$2$3$4$5”) } bind( replace( concat(‘x’,?string), ?pattern, ?replacement) as ?match ) } order by ?pattern desc(?percent) 此代码包含在讨论中使用iSPARQL使用相似性度量来比较值。 […]

百分比相似性分析（Java）: 我有以下情况：字符串a =“网络爬虫是一种自动浏览万维网互联网的计算机程序”; 字符串b =“Web Crawler计算机程序浏览万维网”; 是否有任何想法或标准算法来计算相似性的百分比？例如，在上述情况下，通过手动查看估计的相似度应为90％++。我的想法是对两个字符串进行标记，并比较匹配的标记数量。类似的东西（7个令牌/ 1个令牌）* 100.但是，当然，这种方法根本没有效果。比较匹配的字符数也似乎无效…. 任何人都可以给一些指导??? 以上是我的项目Plagiarism Analyzer的一部分。因此，匹配的单词将完全相同而没有任何同义词。在这种情况下唯一的问题是如何计算相当准确的相似性百分比。非常感谢任何帮助。

文本相似度算法: 我有两个字幕文件。我需要一个函数来告诉它们是代表相同的文本还是相似的文本有时只有一个文件中有“风正在吹……音乐在播放”这样的评论。但80％的内容都是一样的。该函数必须返回TRUE（文件表示相同的文本）。有时会出现像1这样的拼写错误，而不是l（1-L），就像这里一样：她只有行李。当然，这意味着函数必须返回TRUE。我的意见：该函数应返回文本相似度的百分比 – 同意 “所有人都很开心”和“所有人都不高兴” – 这里被认为是拼写错误，因此被视为同一文本。确切地说，函数返回的百分比将更低，但足够高以表示短语是相似的请考虑是否要在整个文件或搜索字符串上应用Levenshtein – 不确定Levenshtein，但算法必须作为一个整体应用于文件。不过，这将是一个很长的字符串。

相似度得分 – Levenshtein: 我在Java中实现了Levenshtein算法，现在我正在通过算法进行校正，即成本。这确实有点帮助但不多，因为我希望结果为百分比。所以我想知道如何计算这些相似点。我也想知道你们这样做的原因以及原因。