腾讯公布大语言模型训练专利:可提高模型的准确性
创作时间:
作者:
@小白创作中心
腾讯公布大语言模型训练专利:可提高模型的准确性
引用
新浪网
1.
https://finance.sina.com.cn/tech/roll/2025-02-08/doc-ineiufsx8830607.shtml
腾讯近日公布了一项关于大语言模型训练方法的专利,通过引入多重摘要文本的对比学习机制,显著提升了模型的泛化能力和生成准确性。这一创新技术为AI语言处理领域提供了新的发展方向。
2月7日,腾讯科技(深圳)有限公司申请的“大语言模型的训练方法、装置、计算机设备及存储介质”专利正式公布。这一技术通过在模型训练中引入多重摘要文本的对比学习机制,显著提升了模型的泛化能力与生成准确性,为AI语言处理领域提供了新的方向。
根据专利摘要,腾讯的新方法创新性地引入“第一摘要文本”与“第二摘要文本”,两者信息量不同且前者包含正确与错误语句的混合。模型通过对比这两种摘要,学习区分正确与错误表达,同时减少单一数据源导致的过拟合问题。这种设计不仅扩展了模型的学习维度,还通过动态调整优化了生成结果的可靠性。
值得注意的是,该方法与近年来对比学习在文本摘要领域的应用趋势相契合。此前研究显示,对比学习通过构造正负样本调整模型表示空间,已在提升摘要质量、缓解暴露偏差等方面取得成效。腾讯此次将对比学习框架融入大语言模型训练,进一步拓展了该技术的应用边界。
有媒体分析称,腾讯的专利通过多样化摘要文本及对比机制,为模型提供了更贴近真实应用的学习环境,尤其对智能客服、内容生成等需高精度输出的领域具有直接意义。此外,该技术或能加速大模型落地进程。例如,在短文本对话场景中,腾讯曾推出基于混合注意力机制的对话模型专利,若结合新训练方法,有望进一步提升回复的相关性与丰富性。
可以看到,腾讯近年来在大语言模型领域动作频频,从2023年的微调方法专利到此次训练框架创新,显示出其全链条技术布局的野心。
热门推荐
申请公租房有补贴吗
为什么会被入耳式耳机电到
新车首保后,以后不去4s店保养了,对车有影响吗?
BCM 应用临床,为血透患者配上身体状况「监控器」
追查怪奇事件中的人类心理的搜查组SRI的活跃!:《怪奇大作战》
团队如何高效约的时间
如何利用自然光拍摄出绝美照片?
钣金加工材料怎么选用
砭石养生之五脏排毒法(图文详解,建议收藏!)
法国大革命:时间起止及其历史意义
三字高雅不俗的队名 仙气十足的团名三个字
给水管和排水管该如何选择?
排水管道检测:方法与注意事项
专家解读:下午喝咖啡为何会导致失眠?
如何帮助宠物狗适应新的环境(有效方法让你的小狗快速适应新家)
如何让宠物狗狗适应新窝(建立安全感的关键)
沿着黄河游兰州:母亲河孕育的金城故事
野芹菜的营养价值
怎么用软件查询CPB生产日期
优化资源管理策略提升企业效率的方法
CSGO激流大行动任务攻略:玩法详解与抽奖概率全解析
开车时,使用免提比手持电话更安全吗?
Azure DevOps 中使用 Git 进行代码共享的完整指南
卡特349发动机异响大揭秘:原因、排查与解决
充电泵电路-从低压源获得更高电压
接种疫苗时,一定要理解医生的告知!
对方全责,我需要提供哪些证据来证明?
新手司机懵了,自己把车蹭了一下,应该走交强险还是商业险?
万册奇书存世不到4%,鲁迅与《永乐大典》有什么关系?
如何规范办理低保手续?低保手续办理的审核标准是什么?