问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

OpenAI o3-mini被曝大量使用中文推理,全世界AI都要学中国话了?

创作时间:
作者:
@小白创作中心

OpenAI o3-mini被曝大量使用中文推理,全世界AI都要学中国话了?

引用
36氪
1.
https://36kr.com/p/3152807697078787

近日,国外网友发现OpenAI的o3-mini模型在推理过程中大量使用中文,即使在用俄语提问时也会用中文思考。这一现象引发了网友的广泛讨论,有人质疑OpenAI是否在"偷师"中国的DeepSeek模型,也有人认为这可能是因为中文更短,在强化学习中能获得更多的奖励。

事实上,这种"语言混杂"现象在其他AI模型中也有发现。例如,谷歌的Gemini会混杂德语。阿尔伯塔大学助理教授、AI研究员Matthew Guzdial解释道:"模型并不知道什么是语言,也不知道语言之间有什么不同,因为对它来说这些都只是文本。"

Hugging Face的工程师Tiezhen Wang则认为,这种语言切换的过程,恰似程序员在选择编程语言时的自然反应。让AI接触多种语言,使其能够学习不同文化所蕴含的独特思维方式。这种包容性不仅能让AI更加全面,还能使其更加公平。

DeepSeek在论文中对这一现象进行了分析。研究团队发现,当强化学习提示词涉及多种语言时,思维链常常出现语言混杂的现象。为了减轻语言混杂的问题,DeepSeek在RL训练过程中引入了"语言一致性奖励",计算方法是CoT中目标语言词汇的比例。

目前,"语言混杂"还亟待解决。DeepSeek-R1也只是针对中文和英文进行了优化,在处理其他语言的查询时,也可能出现语言混杂问题。例如,即使查询是用非英语或非中文的语言提出的,DeepSeek-R1也可能在推理和回答中使用英文。

值得注意的是,就在事件发酵后不久,OpenAI CEO山姆·奥特曼表示,OpenAI"没有计划"起诉DeepSeek。在采访中,奥特曼非常自信地表示,OpenAI可以继续引领世界。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号