问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

从emoji到AI:北大团队开创跨语言情感分析新方法

创作时间:
作者:
@小白创作中心

从emoji到AI:北大团队开创跨语言情感分析新方法

引用
人人都是产品经理
9
来源
1.
https://www.woshipm.com/ai/6029105.html
2.
https://blog.csdn.net/weixin_63655126/article/details/136167866
3.
https://www.codercto.com/a/82131.html
4.
https://jamesqi.com/%E5%8D%9A%E5%AE%A2/%E5%8D%87%E7%BA%A7%E4%BB%A5%E5%89%8D%E7%9A%84Emoji%E7%BF%BB%E8%AF%91%E5%99%A8
5.
https://aclanthology.org/volumes/2024.ccl-1/
6.
https://hcst.pku.edu.cn/info/1029/1657.htm
7.
https://www.ai.pku.edu.cn/info/1138/1239.htm
8.
https://www.showapi.com/news/article/6788db7d4ddd79f11a00222d
9.
http://www.360doc.com/content/24/0430/19/47115229_1122012722.shtml

2019年5月,在美国旧金山举行的国际万维网大会(WWW 2019)上,北京大学信息科学技术学院刘譞哲副教授团队的研究论文“Emoji-Powered Representation Learning for Cross-Lingual Sentiment Classification”荣获最佳长论文奖。这是中国学术研究机构首次获得这一荣誉,标志着我国在人机交互领域取得了重大突破。

01

ELSA模型:用表情符号连接不同语言的情感世界

刘譞哲团队提出的ELSA(Emoji-powered representation learning for cross-lingual sentiment analysis)模型,创造性地将表情符号(emoji)作为跨语言情感分析的桥梁。这一突破性研究解决了长期以来困扰学术界的跨语言情感分析难题。

在互联网时代,75%的用户使用非英语语言,而大约一半的Web内容也是非英语内容。然而,现有的情感分析研究主要集中在英语文本上,其他语言的研究相对较少,导致非英语用户无法享受到高质量的情感分析服务。传统的跨语言情感分析方法通常依赖机器翻译,但这种方法存在一个致命缺陷:不同语言的情感表达方式存在差异,机器翻译往往只能保留共性的情感信息,而丢失了语言特定的情感细节。

例如,日语中的“怒っている”翻译成英语是“angry”,两者都表达了负面情绪;但“汤水のように使う”在日语中形容浪费,翻译成英语后却变成了“use it like hot water”,完全失去了原有的情感含义。

为了解决这一问题,ELSA模型巧妙地利用了emoji的跨语言特性。emoji作为一种全球通用的视觉语言,不仅能够跨越语言障碍,还能保留丰富的表情细节。具体来说,ELSA模型首先从Twitter上收集两种语言的语料,基于语料中的emoji使用情况学习两语言各自的表征模型。然后,通过机器翻译技术生成平行语料,抓住两种语言之间共性的情感信息。这种双管齐下的方法既保留了语言的共性,又兼顾了语言的特性,从而显著提高了跨语言情感分析的准确性。

为了验证ELSA模型的效果,研究团队使用了经典的亚马逊评论数据集进行测试。该数据集包含了法语、德语、日语等9个不同语言的评论任务。实验结果表明,ELSA模型在所有测试任务中都显著优于现有的跨语言情感分析方法。

02

从理论到实践:表情符号在人机交互中的应用

表情符号在人机交互中的应用远不止于学术研究。在实际产品中,emoji已经成为了提升用户体验的重要工具。

以EmojiAll网站为例,该网站开发了一个基于AI的emoji翻译器,能够实现emoji与文字之间的双向转换。最初,这个翻译器采用了一种简单的转换策略:emoji符号先转换为英文短名称,再翻译成中文,最后再次翻译回英文。虽然这种方法实现起来相对简单,但效果并不理想。

随着AI技术的快速发展,特别是ChatGPT等大语言模型的出现,emoji翻译器的效果得到了质的飞跃。新的AI模型不仅能够更准确地理解emoji的含义,还能生成更加自然流畅的文本。据EmojiAll网站的数据显示,新版翻译器上线后,用户平均停留时间从40秒增加到80秒,总交互时长更是翻了几倍。

03

跨语言情感分析:国际研究前沿

跨语言情感分析是当前自然语言处理领域的研究热点之一。除了北大团队的研究外,国际上还有许多其他值得关注的工作。

例如,有研究提出了一种图像映射文本特征(MITF)网络,将不同模态的信息映射到单一模态,以增强跨模态语义的融合和对齐。在三个开源数据集上的实验结果表明,该方法相比原始模型在Mean Recall指标上平均提高了3.7%,检索速度提升了约4倍。

在跨语言代码生成领域,研究者们提出了片段级语码转换(SpanCS)方法,将翻译-训练和语码转换两种经典数据增广方法有效结合。实验结果表明,SpanCS在跨语言代码生成任务上显著优于前人的方法。

这些研究成果共同推动了跨语言情感分析技术的发展,为构建更加智能、更加人性化的AI系统奠定了基础。

04

未来展望:表情符号将如何改变人机交互

随着AI技术的不断进步,表情符号在人机交互中的作用将越来越重要。未来的AI系统将能够更好地理解人类的情感和意图,提供更加个性化和贴心的服务。

例如,通过分析用户在社交媒体上使用的emoji,AI可以更准确地判断用户的情绪状态,从而提供更加合适的内容推荐。在客服机器人中,emoji可以帮助机器人更好地理解用户的需求,提供更加精准的服务。在教育领域,带有emoji的AI教学助手可以更好地激发学生的学习兴趣。

总之,表情符号正在成为人机交互中不可或缺的一部分。北京大学刘譞哲团队的研究成果不仅展示了emoji在跨语言情感分析中的巨大潜力,更为未来的人机交互提供了新的思路和方向。随着技术的不断发展,我们有理由相信,未来的AI系统将能够更好地理解人类的情感世界,为用户提供更加智能、更加贴心的服务。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号