相似度计算之兰氏距离
浏览:3184次 出处信息
兰氏距离(Lance and Williams distance)堪培拉距离(Canberra Distance),被认为是曼哈顿距离的加权版本。
其定义公式为:
![Rendered by QuickLaTeX.com \[d(\mathbf {p} ,\mathbf {q} )=\sum _{i=1}^{n}{\frac {|p_{i}-q_{i}|}{|p_{i}|+|q_{i}|}}\]](https://www.biaodianfu.com/wp-content/ql-cache/quicklatex.com-233edf5ed364fb2347833bd59a518803_l3.png)
通常兰氏距离对于接近于0(大于等于0)的值的变化非常敏感。与马氏距离一样,兰氏距离对数据的量纲不敏感。不过兰氏距离假定变量之间相互独立,没有考虑变量之间的相关性。
Python实现:
def canberra_distance(p, q):
n = len(p)
distance = 0
for i in n:
if p[i] == 0 and q[i] == 0:
distance += 0
else:
distance += abs(p[i] - q[i]) / (abs(p[i]) + abs(q[i]))
return distance参考资料:
建议继续学习:
- 相似度计算常用方法综述 (阅读:10053)
- 字符串匹配那些事(一) (阅读:6630)
- 如何计算两个文档的相似度(一) (阅读:6026)
- 如何计算两个文档的相似度(二) (阅读:4683)
- URL相似度计算的思考 (阅读:4297)
- Levenshtein distance相似度算法 (阅读:3981)
- 如何计算两个文档的相似度(三) (阅读:3560)
- 若无云,岂有风——词语语义相似度计算简介 (阅读:3269)
- 常见相似度计算方法回顾 (阅读:2891)
- 相似度计算之马氏距离 (阅读:2803)
QQ技术交流群:445447336,欢迎加入!
扫一扫订阅我的微信号:IT技术博客大学习
扫一扫订阅我的微信号:IT技术博客大学习
<< 前一篇:常见相似度计算方法回顾
后一篇:一维数组的聚类 >>
文章信息
- 作者:标点符 来源: 标点符
- 标签: 兰氏距离 相似度
- 发布时间:2018-07-05 14:00:16
建议继续学习
近3天十大热文
-
[903] WordPress插件开发 -- 在插件使用 -
[135] 解决 nginx 反向代理网页首尾出现神秘字 -
[56] 整理了一份招PHP高级工程师的面试题 -
[54] Innodb分表太多或者表分区太多,会导致内 -
[54] 如何保证一个程序在单台服务器上只有唯一实例( -
[52] 全站换域名时利用nginx和javascri -
[52] 海量小文件存储 -
[52] CloudSMS:免费匿名的云短信 -
[51] 用 Jquery 模拟 select -
[49] ps 命令常见用法
