NLP中的余弦相似度 Cosine similarity 是什么,如何计算
创作时间:
2025-01-22 05:44:07
作者:
@小白创作中心
NLP中的余弦相似度 Cosine similarity 是什么,如何计算
在自然语言处理(NLP)领域,余弦相似度是一种常用的距离度量方法,用于衡量两个向量之间的相似程度。这种方法在文本相似度计算、信息检索和推荐系统等领域有着广泛的应用。本文将详细介绍余弦相似度的概念及其计算方法。
余弦相似度 Cosine similarity
为了衡量两个词的相似程度,我们需要一种方法来度量这两个词对应的嵌入向量之间的相似度。给定向量 (u) 和 (v),余弦相似度定义如下:
- 分子:(u) 和 (v) 的点积(或内积)
- 分母:向量 (u) 和 (v) 的范式(或长度)相乘
计算结果即为向量 (u) 和 (v) 之间夹角 (\theta) 的余弦值,也就是两个向量的相似度。
余弦值的范围是 -1~1,其中:
- 1 对应完全正相关
- -1 对应完全负相关
- 0 对应完全不相关
其中,向量范式的计算公式为:向量中每个元素的平方和开根号。
本文原文来自CSDN
热门推荐
电在导体中的速度接近光速,所以电流的本质就是电磁波!
沈阳美食探店:老边饺子、马家烧麦和明湖春必打卡!
不老林糖:沈阳必尝的甜蜜特产
沈阳美食如何撑起千亿产业?
茶香袅袅,人生如梦
重庆巫山小三峡:自驾游必打卡的5A级景区
自驾游重庆必打卡地道美食探店
重庆古城墙:横跨千年的历史见证
中国饭店协会发布《2024饭店业高质量发展案例汇编》
儿童抽动症:家庭与学校的双重守护
学校如何关爱抽动症学生?
儿童抽动症最新诊疗指南发布,中医西医结合提供全面解决方案
小明的抽动症故事:家长必读!
越秀廊桥:瑶族文化的网红打卡地
摄影师杨树田推荐:恭王府最美拍摄点
恭王府游玩攻略:打卡必看三大绝景!
周末带娃打卡恭王府:亲子研学好去处
成都美食之都:在家也能做地道川味
成都熊猫亚洲美食节:探寻千年美食文化
打卡成都必吃美食,跟着熊猫地图走!
《将军长歌》:一部鲜活的开国将军传奇
密云冬季旅游打卡地大揭秘
探秘密云:长城、古镇与水库的魅力之旅
秋冬打卡:云蒙峡最美景色
密云长城摄影打卡攻略:捕捉最美瞬间
了解不同性别的基因与染色体
流量卡VS随身WiFi:优缺点详解与实用性评估
《2024世界纺织行业趋势展望》——探寻加快发展纺织新质生产力的关键路径
2024年11月新能源轿车市场快报
都2025了,你还不知道自家车用的什么电池?