NLP中的余弦相似度 Cosine similarity 是什么,如何计算
创作时间:
2025-01-22 05:44:07
作者:
@小白创作中心
NLP中的余弦相似度 Cosine similarity 是什么,如何计算
在自然语言处理(NLP)领域,余弦相似度是一种常用的距离度量方法,用于衡量两个向量之间的相似程度。这种方法在文本相似度计算、信息检索和推荐系统等领域有着广泛的应用。本文将详细介绍余弦相似度的概念及其计算方法。
余弦相似度 Cosine similarity
为了衡量两个词的相似程度,我们需要一种方法来度量这两个词对应的嵌入向量之间的相似度。给定向量 (u) 和 (v),余弦相似度定义如下:
- 分子:(u) 和 (v) 的点积(或内积)
- 分母:向量 (u) 和 (v) 的范式(或长度)相乘
计算结果即为向量 (u) 和 (v) 之间夹角 (\theta) 的余弦值,也就是两个向量的相似度。
余弦值的范围是 -1~1,其中:
- 1 对应完全正相关
- -1 对应完全负相关
- 0 对应完全不相关
其中,向量范式的计算公式为:向量中每个元素的平方和开根号。
本文原文来自CSDN
热门推荐
朋友圈互动新姿势:点赞+评论=高情商社交
微信朋友圈:如何在分享与心理健康之间找到平衡?
当心!298元“国产iPhone”是山寨货,教你如何辨别和维权
深度剖析:心血管疾病检查技术的全面对比
秋冬打卡:霞浦花竹村&杨家溪
新大洲本田车主必看:冬季保养秘籍
探索新疆帕米尔高原:神奇漂亮又让人犯迷糊的风光带
新疆帕米尔高原旅游攻略
揭秘南疆秘境:喀什帕米尔高原塔莎古道四日环线探秘之旅
即食海参六种美味做法推荐
盐水泡肉,轻松去腥!
香哈&生命时报推荐:去腥妙招大集合!
揭秘虚拟现实:你所不知道的沉浸式体验
AR技术在教育内容创作中的应用
海淀家长教你高效辅导三年级口算
三年级口算新玩法:五种简便算法大揭秘!
家族企业引入职业经理人问题研究
朗润园:北大学术文化的瑰宝
秋日九江三日游:甘棠湖+南门湖+庐山全攻略
庐山西海:九江必打卡的绝美风光
九江市博物馆&烟水亭:历史文化的双重盛宴
庐山秋景美如画,你去打卡了吗?
从《从你的全世界路过》看迟到:一个心理与管理的双重解读
美国留学迟到的心理压力大揭秘
职场必备:如何优雅地说出你的迟到借口?
珍珠耳饰:让你秒变优雅女神
珍珠耳饰选购全攻略:从材质到保养,新手也能变身搭配达人!
戏曲舞台上的哪吒:传统艺术的创新演绎
哪吒与敖丙的性格反转,你更喜欢谁?
中国政法大学政治学专业:全国前十的学科实力