Sarcasm detection论文解析 |利用对话语境进行讽刺分析

创作时间:

作者:

@小白创作中心

Sarcasm detection论文解析 |利用对话语境进行讽刺分析

引用

CSDN

https://blog.csdn.net/weixin_62828995/article/details/138380534

论文地址

论文地址：Sarcasm Analysis Using Conversation Context | Computational Linguistics | MIT Press
github地址：https://github.com/debanjanghosh/sarcasm_context
Alex-Fabbri/deep_learning_nlp_sarcasm: code for deep learning models applied to nlp tasks (github.com)

论文首页

利用对话语境进行讽刺分析

📅出版年份:2018
📖出版期刊:Computational Linguistics
📈影响因子:2
🧑文章作者:Ghosh Debanjan,Fabbri Alexander R.,Muresan Smaranda
📍 期刊分区:
JCR分区: Q1 中科院分区升级版: 计算机科学2区中科院分区基础版: 工程技术4区影响因子: 9.3 5年影响因子: 6.2 EI: 是 CCF: B

🔎摘要

讽刺检测的计算模型通常依赖于孤立的语句内容。然而，如果没有额外的语境，说话者的讽刺意图并不总是很明显。我们以社交媒体讨论为重点，研究了三个问题：(1) 对话语境建模是否有助于讽刺检测？(2) 我们能否识别是对话上下文的哪一部分触发了讽刺回复？ (3) 对于包含多个句子的讽刺帖子，我们能否识别出讽刺的具体句子？为了解决第一个问题，我们研究了几种类型的长短时记忆（LSTM）网络，它们可以对对话上下文和当前回合进行建模。我们的研究表明，在句子层面关注上下文和当前转折的 LSTM 网络以及条件 LSTM 网络优于只读取当前转折的 LSTM 模型。作为会话上下文，我们考虑了前一轮、后一轮或两者。我们的计算模型在两种类型的社交媒体平台上进行了测试：推特和论坛。我们讨论了这些数据集之间的一些差异，包括它们的规模和金标签注释的性质。为了解决后两个问题，我们对 LSTM 模型产生的注意力权重进行了定性分析，并将结果与人类在这两个任务中的表现进行了比较。

🌐研究目的

我们以社交媒体讨论为重点，研究了三个问题：

(1) 对话语境建模是否有助于讽刺检测？
(2) 我们能否识别是对话上下文的哪一部分触发了讽刺回复？
(3) 对于包含多个句子的讽刺帖子，我们能否识别出讽刺的具体句子？

我们的研究目标之一是对两类社交媒体平台进行比较研究，这两类平台已被单独考虑用于讽刺检测。

📰研究背景

讽刺检测的计算模型通常依赖于孤立的语句内容。然而，如果没有额外的语境，说话者的讽刺意图并不总是很明显。p756
曾经的大多数方法大多考虑的是孤立的语篇。p759
目前有两个主要的研究方向--作者语境和对话语境p759

🔬研究方法

🔩模型架构

两种架构：

一种是同时使用单词级和句子级注意力的分层结构（Yang et al. 2016），
另一种仅使用句子级注意力（这里我们仅使用平均单词嵌入来表示句子）。

基于注意力的 LSTM 网络 p767

对话上下文由先前的回合 pt 表示。上下文（左）由 LSTM (LSTMpt) 读取，
当前轮 ct（右）由另一个 LSTM (LSTMct) 读取。
请注意，对于我们也考虑后续转 st 的模型，我们只需使用另一个 LSTM 来读取 st。

条件 LSTM 网络 p769

我们还尝试了 Rockta ̈schel 等人引入的条件编码模型。
使用了两个独立的LSTM——LSTMpt和LSTMct——与之前的架构类似，没有任何注意力，但是对于LSTMct来说，它的内存状态是用LSTMpt的最后一个单元状态来初始化的。对于使用连续转弯 st 作为上下文的模型，LSTM 表示 LSTMst 以 LSTMct 的表示为条件。