NLP中的余弦相似度 Cosine similarity 是什么,如何计算
创作时间:
2025-01-22 05:44:07
作者:
@小白创作中心
NLP中的余弦相似度 Cosine similarity 是什么,如何计算
在自然语言处理(NLP)领域,余弦相似度是一种常用的距离度量方法,用于衡量两个向量之间的相似程度。这种方法在文本相似度计算、信息检索和推荐系统等领域有着广泛的应用。本文将详细介绍余弦相似度的概念及其计算方法。
余弦相似度 Cosine similarity
为了衡量两个词的相似程度,我们需要一种方法来度量这两个词对应的嵌入向量之间的相似度。给定向量 (u) 和 (v),余弦相似度定义如下:
- 分子:(u) 和 (v) 的点积(或内积)
- 分母:向量 (u) 和 (v) 的范式(或长度)相乘
计算结果即为向量 (u) 和 (v) 之间夹角 (\theta) 的余弦值,也就是两个向量的相似度。
余弦值的范围是 -1~1,其中:
- 1 对应完全正相关
- -1 对应完全负相关
- 0 对应完全不相关
其中,向量范式的计算公式为:向量中每个元素的平方和开根号。
本文原文来自CSDN
热门推荐
分手后如何优雅转身?四个步骤助你重获新生
掌握这四招,告别“说话伤人”难题
跨越三个世纪:福音音乐如何影响现代流行乐
美国社会福音运动:从个人救赎到社会改革的宗教革命
十首诗词里的流年:从庄子到蒋捷的时光咏叹
一机两镜拍马术:EOS R5让体育摄影更简单
35句小众绝美诗词,带你领略古人的隐逸生活
《花儿与少年》卡点悼念郑佩佩,文案藏着3处巧思,花少团4人发声2人沉默
8月,印象最深的8句文案
山东省主要旅游景点未来24小时预报
膳食纤维:缓解肠胃胀气的秘密武器
小米粥:肠胃胀气的舒缓之选
成都附二中医医院推荐:中医食疗缓解肠胃胀气
守护厨房之美:不锈钢橱柜保养全攻略
富春茶社领衔,扬州15家老字号美食全收录
品味淮扬:扬州十大名菜详解
七道经典扬州菜:从四喜藕粉圆到八宝葫芦鸭
掌握这些技巧,轻松辨别茅世原酱酒真伪
从免费到付费:点映礼如何改变影视营销
《好东西》7亿票房逆袭:双城点映策略创造贺岁档奇迹
退群有道:四种方法让你优雅退出微信群
北大团队实现iPS细胞治疗1型糖尿病重大突破,患者一年无需胰岛素
突破!干细胞技术治愈25年糖尿病,患者33月未用胰岛素
个人礼仪入门:仪表、交谈、着装三大要点详解
我国启动首个减重手术治疗糖尿病临床研究,13家医院参与
中国成撒哈拉以南非洲最大基建投资方,夜间灯光亮度增15%
酒后打嗝和吐酸水?这些实用小妙招帮你轻松应对!
印度人口超中国:社会结构之变与未来挑战
余秀华登台跳舞:用不完美之躯诠释诗歌之美
从诗人到舞者:余秀华<万吨月色>首演引发残障剧场争议