问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

论文必看!情感分析得分解读,如何避免误解?

创作时间:
作者:
@小白创作中心

论文必看!情感分析得分解读,如何避免误解?

引用
1
来源
1.
https://www.weiciyun.com/blog/sentiment_04/index.html

在使用情感分析工具时,你是否遇到过这样的困惑:明明是负面倾向的文本,情感得分却是正数?本文将为你详细解析情感分析得分的计算原理,帮助你避免对结果的误解。

在使用微词云情感分析中,很多用户发现某些负面倾向的文本,它的情感得分却是正数,这让很多人感到困惑。例如:

  • 负面情感倾向,但得分是 3.9,而不是 -3.9
  • 中性评论得分 13.25,但用户以为中性应该是 0

这种情况其实是情感分析算法的计算方式不同造成的。本文将详细解析情感分析如何计算得分,以及为什么负面情感得分不是负数,我会从以下章节进行展开讲解:

1.情感分析的基本原理
2.情感得分的计算方式
3.负面得分为何是正数?
4.案例解析:如何判断情感倾向?
5.其他计算方式对比

一、情感分析的基本原理

我们先从基础的算法原理来讲起,为下面的分析做好铺垫。

目前常见的情感分析方法包括:

  • 基于情感词典的方法(Sentiment Lexicon-based)
  • 基于机器学习的方法(如 SVM、LSTM)
  • 基于深度学习的方法(如 BERT、Transformer)

我们的微词云情感分析工具采用的是基于情感词典的方法,它的核心原理是:

构建情感词典(如 Hownet、NTUSD)

识别文本中的情感词(如“喜欢”是正向,“糟糕”是负向)
结合程度词、否定词调整情感强度(如“非常好”比“好”得分更高)
累加所有情感词的得分,计算最终情感得分

二、情感得分的计算方式

微词云情感分析工具的计算逻辑如下:

  • 每个正面词、负面词都有固定的情感得分(例如“优秀”+3,“差劲”-3)
  • 所有情感词的得分都是正数,只是负面情感词的得分单独计算

情感倾向判断:

  • 正面得分 ≥ 负面得分的 4 倍 → 正面情感
  • 2 倍 ≤ 正面得分 < 4 倍 → 中性情感
  • 正面得分 < 负面得分的 2 倍 → 负面情感

示例:

文本
正面得分
负面得分
情感倾向
A: 这次体验很糟糕,但客服态度不错
5.0
9.0
负面
B: 产品质量极差,完全不能接受
0.5
10.0
负面
C: 有点小问题,但总体还行
8.0
3.0
中性

三、为什么负面得分是正数?

很多用户的误解是:

  • 认为负面得分应该是 负数,如 -9.0
  • 认为中性情感的得分应该是 0

实际上,负面得分是一个“累计得分”,它表示的是:

  • 负面情感的强度(而不是数学上的“负数”)
  • 负面情感得分越高,代表负面情绪越强
  • 正面/负面得分比例决定情感倾向,而不是数值的正负

简单理解:

  • 得分=0,并不代表情感中性,而是表示没有情感信息
  • 负面情感=负数的方式 只是另一种表示法,与你的工具计算方式不同,但本质无差异

四、案例解析:如何判断情感倾向?

让我们看一个实际案例:

文本 1:产品质量极差,完全不能接受。

  • 正面得分:0.5
  • 负面得分:10.0
  • 正面得分 < 负面得分的 2 倍 → 负面评论

文本 2:这次体验很糟糕,但客服态度还不错。

  • 正面得分:5.0
  • 负面得分:9.0
  • 正面得分 < 负面得分的 2 倍 → 负面评论

五、其他计算方式对比

有些情感分析工具会:

  • 采用负数表示负面情感(如 -5.0 代表负面情感)
  • 采用归一化得分,将得分范围限定在 [-1, 1]

微词云工具采用的是“累计情感得分”方式,而不是“正负极性得分”,所以:

  • 负面情感的强度不是用负数表示,而是直接计算负面得分的大小。
  • 这更符合大多数学术研究中的情感分析模型,但对部分用户来说可能不够直观。

如果你希望看到负值表示方式,可以这样转换:

  • 原始模式:负面得分 = 9.0
  • 极性模式(手动调整):情感得分 = -9.0

希望这篇文章能帮助你在论文写作时更准确地使用情感分析工具,并清晰地解释情感得分的计算方式!

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号