NLP中的余弦相似度 Cosine similarity 是什么,如何计算
创作时间:
2025-01-22 05:44:07
作者:
@小白创作中心
NLP中的余弦相似度 Cosine similarity 是什么,如何计算
在自然语言处理(NLP)领域,余弦相似度是一种常用的距离度量方法,用于衡量两个向量之间的相似程度。这种方法在文本相似度计算、信息检索和推荐系统等领域有着广泛的应用。本文将详细介绍余弦相似度的概念及其计算方法。
余弦相似度 Cosine similarity
为了衡量两个词的相似程度,我们需要一种方法来度量这两个词对应的嵌入向量之间的相似度。给定向量 (u) 和 (v),余弦相似度定义如下:
- 分子:(u) 和 (v) 的点积(或内积)
- 分母:向量 (u) 和 (v) 的范式(或长度)相乘
计算结果即为向量 (u) 和 (v) 之间夹角 (\theta) 的余弦值,也就是两个向量的相似度。
余弦值的范围是 -1~1,其中:
- 1 对应完全正相关
- -1 对应完全负相关
- 0 对应完全不相关
其中,向量范式的计算公式为:向量中每个元素的平方和开根号。
本文原文来自CSDN
热门推荐
生产进度看板怎么做?一文搞清!
鲍威尔"遛鹰"还是"放鸽":美联储议息声明及点阵图比着看
宇宙海三大绝地:黑洞漩涡、时空裂缝与量子迷雾
胆囊息肉约什么科室检查
股票卖出常见策略分析
什么是财产处分?一文详解财产处分的法律知识
Spring中@PostConstruct和@PreDestroy注解详解与实战
Mac 自带的截屏功能详解
最全Mac系统快捷键一览
从石头缝里榨石油!我国页岩油可采储量世界第三
马丁·路德:宗教改革先驱传记
《假如给我三天光明》:海伦·凯勒的坚韧人生与光明梦想
研究发现:口内型舌下腺囊肿自愈率达92.1%,或改变传统治疗方案
韩愈“谏迎佛骨”为什么被贬潮州
哲学上的人生意义是什么?
如何掌握判断股票趋势的方法?股票趋势判断技巧全解析
大豆纤维被和棉被哪个好?一文详解两者优劣
「三医协同 共启未来」合肥顺利举办,新型抗肿瘤药物重塑乳腺癌诊疗新生态
昆明的气候类型及气候特点
一文带你了解晶闸管作用、工作原理
剑气纵横:武侠世界中的剑术传奇与精神象征
心理科普:大学生如何缓解学习压力
有多少个国家:全球国家数量与分布概览
邓婷教授:五大胃癌新靶点治疗的研究进展
蓝色危机:全球海洋仍在面临的12个威胁
房屋承租人的利益该怎么保障
租房合同应包含哪些关键条款?这些条款如何保护租户和房东的利益?
爱情著名诗句,哪句最让你感动?
互联互通,新一代医院信息集成平台与未来更适配
常吃这类食物,血糖降了,体重轻了,连脂肪肝也悄悄变好了