平安科技王磊:大规模预训练模型在金融领域应用的缺陷与改进
创作时间:
作者:
@小白创作中心
平安科技王磊:大规模预训练模型在金融领域应用的缺陷与改进
引用
1
来源
1.
https://hub.baai.ac.cn/view/14338
随着BERT、GPT-3等大规模预训练模型的相继问世,"模型越大,性能越好"的理念逐渐深入人心。然而,在实际应用中,这些模型在垂直领域却面临着诸多挑战。平安科技前沿技术部门负责人王磊在CNCC 2021上的报告中,深入探讨了大规模预训练模型在金融领域应用中遇到的主要问题,并提出了相应的解决方案。
目前,大规模预训练模型已经在自然语言处理领域取得了巨大的成功。BERT、GPT-3等大规模预训练模型被看做是"暴力美学"的一次胜利,验证了"模型越大,性能越好"的逻辑,业界也普遍形成了"炼大模型"的竞赛趋势,国内研究机构和企业也相继发布了大规模预训练模型,呈现百花齐放、百家争鸣的发展格局。
大规模预训练模型在垂直领域的"致命"问题
在2021年12月的CNCC 2021"产业共话:大型预训练模型的商业应用及技术发展方向"论坛上,平安科技前沿技术部门负责人王磊做了《大规模预训练模型金融领域应用中面临的主要问题与应对技术探讨》的报告。在报告中,他指出了当前大规模预训练模型在垂直领域的"致命"问题。
王磊认为,大规模预训练模型在垂直领域性能达不到要求的原因主要有两个:
- 大规模预训练模型的训练语料库规模很大,既包含了该领域的关键信息也包含了其他无关信息,使得模型缺少对关键信息的关注。
- 当前大规模预训练模型的机制改进也很少涉及对关键信息的提取。
平安科技的解决方案
针对上述问题,王磊提出了平安科技的解决方案。他认为,大规模预训练模型本质上都是在处理信号,但只要是信号,就可能进行分解,将背景信息和垂直领域的信息分离开来,从而有效贴合下游场景。
此外,金融客户对上线模型的精度要求很高,不少场景直接使用预加载模型往往很难满足需求。王磊提出置信度评估方法,利用强化学习和Bagging思想评估模型靠谱程度。
这一解决方案不仅解决了大规模预训练模型在金融领域应用中的关键问题,也为其他垂直领域的应用提供了有益的参考。
热门推荐
定焦镜头的对焦方式、优点和缺点
燃烧需要氧气,那么在没有氧气的外太空,火箭是如何飞行的?
红毛丹去核小技巧 红毛丹怎么吃不沾膜
什么样的篮球鞋垫好? 专业的篮球鞋垫要如何选择
开发商停工怎么办?六步指南助你维权
减肥可以吃杂粮饭吗?与荞麦面相比哪个更合适?
奶与咖的奇妙碰撞:解锁完美CP组合
医生提醒:一天里面,2个时间段测量血糖最准确,很多人没选对
大模型系列:LLaMA大模型简述和本地部署实践
文档如何链接分享到微信
提升产业链招商效果的六大策略
压缩天然气汽车与液化石油气汽车:燃料、储存与应用的全面对比
探讨如何利用多因素身份验证来增强远程连接服务器的安全性
脚崴了如何判断是不是骨折?专业医生详解5大判断标准
脚崴了如何判断是不是骨折?专业医生给出五大判断标准
【机器学习】KMeans聚类分析实战:用户分群聚类详解与指标全解析
混动车驾驶习惯如何降低百公里油耗?长期使用能否省钱?听我说说
Excel中的人均GDP计算方法详解
芋头什么时候收获
VIE架构的监管合规与争议概述:对企业国际化的深刻影响
解密VIE架构:合法性、风险与合规
两栖登陆作战怎么打?
王者荣耀:亚连大喜过望!“黄盾”让他变身伤害机器!
节气“惊蛰”春回大地人要暖机 医揭桂枝姜枣茶、四神排骨汤喝起来!
惊蛰节气民俗:各地独特的“炒虫”文化与传统习俗
成都航空人力资源待遇怎么样
违约方合同解除权的适用条件
姐弟恋现象的生理、心理与社会解析
出生8天的宝宝在过热环境下会否上火
腺样体肥大的娃,如何有效护理?