欧式距离与余弦相似度
创作时间:
作者:
@小白创作中心
欧式距离与余弦相似度
引用
1
来源
1.
https://www.cnblogs.com/jack-lee/p/3654209.html
在数据分析和机器学习领域,相似度度量是评估样本间差异的重要方法。欧式距离和余弦相似度是两种常用的相似度度量方式,它们各有特点和适用场景。本文将详细介绍这两种度量方法的计算公式、归一化处理以及如何选择合适的度量方式。
1)概述
两者都是评定个体间差异的大小的。欧几里得距离度量会受指标不同单位刻度的影响,所以一般需要先进行标准化,同时距离越大,个体间差异越大;
空间向量余弦夹角的相似度度量不会受指标刻度的影响,余弦值落于区间[-1,1],值越大,差异越小。
2)计算公式
欧氏距离(也叫欧几里得距离)公式:
余弦相似度的计算公式如下:
3)归一化
一般来说,为了比较的方便,都会对得到的结果进行归一化处理:
1)在欧氏距离公式中,取值范围会很大,一般通过如下方式归一化:
sim = 1 / (1 + dist(X,Y))
2)因为余弦值的范围是 [-1,+1] ,相似度计算时一般需要把值归一化到 [0,1],一般通过如下方式:
sim = 0.5 + 0.5 * cosθ
经过归一化处理以后,相似度全部落在了0和1之间,值越大,相似度越高。
4)相似度度量的选择
选择哪种度量方式,没有统一的结论,要依据处理数据的特点来进行确定,可以参考一下知乎上关于这个问题的讨论:http://www.zhihu.com/question/19640394
热门推荐
降胆红素最快的十种食物是什么
经期减肥指南:饮食、运动与心理调节三管齐下
出生后接种疫苗顺序
盟旗制度的历史发展
2025高考全国一卷作文素材积累与运用
如何应对过度负债带来的财务压力和困扰
湘潭市口腔医院:AI+移动诊室构筑口腔健康双防线 创新闭环服务惠及全生命周期
解密中国古代女子选美:更为看重的要素
古代九种女性面相特征:从丹凤眼到儒雅气质
葫芦——中国独特的特产(葫芦的历史渊源、种类、生长环境、功能与文化价值)
动物有灵魂吗?从宗教、哲学到科学的全面探讨
无人值守人工智能智慧系统数据分析:深度洞察与未来展望
云南交投集团推出全国首个高速公路隧道“准无人值守”一站式解决方案
非常有深度的人生经典语录,简短精辟!适合发朋友圈!
身价暴涨133%!英超19岁小将蹿红:晋升国脚,梦想加盟皇马
湖北云梦:小麦亩产破千斤,"两精一抗"技术显成效
表演中途大量无人机坠海?无人机飞行“五须知”,快来了解→
横沥牛肉面:此牛肉面非彼牛肉面
【3·15特辑】遇到消费陷阱别慌张!法官教你这样维权!
养生保健品的选择与使用技巧
从向曹丕跪地称臣,到霸气拒送人质,他哪来的底气?
脚内侧骨头凸起正常吗
2024年黑龙江各市GDP排行榜 哈尔滨第一 大庆增速缓慢
夏天穿什么颜色的衣服更凉快?很多人都穿错了……
玉器鉴赏:玉璜、玉琮、玉玦及其文化意义详解
氯气安全操作规范详解
项目风险识别是什么?如何进行项目风险识别?项目风险识别的作用与案例分析
节俭办赛、以赛营城!哈尔滨亚冬会给十五运会带来了哪些启示?
不走寻常路,进化过程中人类失去全身毛发,为何与其它生物不同?
万物皆有“道”!探索道家医学中,天地人和谐的共生之道