NLP中的余弦相似度 Cosine similarity 是什么,如何计算
创作时间:
2025-01-22 05:44:07
作者:
@小白创作中心
NLP中的余弦相似度 Cosine similarity 是什么,如何计算
在自然语言处理(NLP)领域,余弦相似度是一种常用的距离度量方法,用于衡量两个向量之间的相似程度。这种方法在文本相似度计算、信息检索和推荐系统等领域有着广泛的应用。本文将详细介绍余弦相似度的概念及其计算方法。
余弦相似度 Cosine similarity
为了衡量两个词的相似程度,我们需要一种方法来度量这两个词对应的嵌入向量之间的相似度。给定向量 (u) 和 (v),余弦相似度定义如下:
- 分子:(u) 和 (v) 的点积(或内积)
- 分母:向量 (u) 和 (v) 的范式(或长度)相乘
计算结果即为向量 (u) 和 (v) 之间夹角 (\theta) 的余弦值,也就是两个向量的相似度。
余弦值的范围是 -1~1,其中:
- 1 对应完全正相关
- -1 对应完全负相关
- 0 对应完全不相关
其中,向量范式的计算公式为:向量中每个元素的平方和开根号。
本文原文来自CSDN
热门推荐
《银河奥特曼S》眼q之泪:一个懦弱上班族的温暖蜕变
当动物不象征人类,狗就是狗,山羊就是山羊
Excel分镜头脚本制作指南:从表格结构到专业技巧
桂枝的功效与作用
中药里的“桂”:肉桂、桂枝、桂圆等药材辨析
打造产城融合发展实验地
js中怎么深度拷贝
AADC缺乏症是什么病
拥抱:情感交流的艺术与科学
二手房省钱装修全攻略:小预算也能打造理想家!
从“琼”到“黑”,一分钟记住中国34个省级行政区简称
珠海外伶仃岛入选“中国最美十座小岛”榜单,海岛风光美不胜收
2025年导游证报考全攻略
新Emoji来临:“疲惫的脸”表达当代人精神状态
亲子教育心理咨询:摧毁一个孩子有多么简单?答案是:“控制他”
办理房产退税所需资料及查询进度和到账时间
血液透析和腹膜透析的优缺点在哪里?
紫微斗数的准确性为何存在争议
成功首飞! 湛江⇌海口,打“飞的”35分钟直达
超越自我,心静如水:如何做到百毒不侵,从容面对人生
从腾讯、米哈游4家大厂春招行程看985就业认可度:哪些985遗憾缺席?
宝宝体温37.5度算不算发烧?一文读懂低热应对指南
5个月宝宝发烧38度的最佳处理方法
环境保护中污染源自动监测技术的应用研究
My First HTML Page
4000块跨境电商创业到年入百万,普通人如何实现逆天改命
成都附二中医医院科普:腿疼麻,可能是气血不足在“报警”!
【文档编辑技巧】MathType公式组的编辑
索尼镜头字母含义
银行账户的关联账户如何管理?