腾讯公布大语言模型训练专利:可提高模型的准确性
创作时间:
作者:
@小白创作中心
腾讯公布大语言模型训练专利:可提高模型的准确性
引用
新浪网
1.
https://finance.sina.com.cn/tech/roll/2025-02-08/doc-ineiufsx8830607.shtml
腾讯近日公布了一项关于大语言模型训练方法的专利,通过引入多重摘要文本的对比学习机制,显著提升了模型的泛化能力和生成准确性。这一创新技术为AI语言处理领域提供了新的发展方向。
2月7日,腾讯科技(深圳)有限公司申请的“大语言模型的训练方法、装置、计算机设备及存储介质”专利正式公布。这一技术通过在模型训练中引入多重摘要文本的对比学习机制,显著提升了模型的泛化能力与生成准确性,为AI语言处理领域提供了新的方向。
根据专利摘要,腾讯的新方法创新性地引入“第一摘要文本”与“第二摘要文本”,两者信息量不同且前者包含正确与错误语句的混合。模型通过对比这两种摘要,学习区分正确与错误表达,同时减少单一数据源导致的过拟合问题。这种设计不仅扩展了模型的学习维度,还通过动态调整优化了生成结果的可靠性。
值得注意的是,该方法与近年来对比学习在文本摘要领域的应用趋势相契合。此前研究显示,对比学习通过构造正负样本调整模型表示空间,已在提升摘要质量、缓解暴露偏差等方面取得成效。腾讯此次将对比学习框架融入大语言模型训练,进一步拓展了该技术的应用边界。
有媒体分析称,腾讯的专利通过多样化摘要文本及对比机制,为模型提供了更贴近真实应用的学习环境,尤其对智能客服、内容生成等需高精度输出的领域具有直接意义。此外,该技术或能加速大模型落地进程。例如,在短文本对话场景中,腾讯曾推出基于混合注意力机制的对话模型专利,若结合新训练方法,有望进一步提升回复的相关性与丰富性。
可以看到,腾讯近年来在大语言模型领域动作频频,从2023年的微调方法专利到此次训练框架创新,显示出其全链条技术布局的野心。
热门推荐
Excel怎么做每日时间表
家中常备药品清单明细(超实用常备药清单及存放秘籍)
螺钿——破碎后再重组的流光之彩
人物小传 | 仁慈之主萨拉丁,如何用仁慈书写历史传奇?
在家也能做“窃听器”?我又行了 | 正经玩
大龄农民工,路在何方?
推荐一些有内涵的谭姓男生名字
发现高血糖及时治疗,别等出现5类症状再去治,小心糖尿病足溃疡
促甲状腺激素高是什么原因造成的
今晚主场对阵澳大利亚,DeepSeek预测国足出线概率仅为5%-10%?
信用卡与信用分:解锁信用宝藏的钥匙
说它是新疆美食调料的“E人社牛”,没人会反驳
美国名校深度探访系列:哈佛大学Harvard University
“五大名窑”各自的特点是什么?看完涨知识了!建议收藏
让思维在笔尖生长
从新手司机到老练驾驶者的进阶之路:提升技巧与安全须知
证人证言的补强证据收集策略
网站建设如何合理网站设计布局
胶原蛋白丰苹果肌有效果吗
在菲律宾庆祝国家英雄日:探索历史和文化指南
vcruntime140.dll丢失怎么办?全面解析及解决方案
在多智能体世界中玩转“自利”与“利他”的平衡艺术
i5-12600KF和R5-7500F详尽对比:选购装机CPU指南
MOS管的开启电压和阈值电压
如何在期权市场中实现收益最大化?这种收益的可持续性如何?
石榴怎样去籽
实现PC端和安卓手机的局域网内文件共享
探索珠穆朗玛峰的十个有趣事实:深入了解珠峰
LeetCode—和为K的子数组(前缀和)
【成语】醉生梦死意思|解释|出处|典故|用法