平安科技王磊:大规模预训练模型在金融领域应用的缺陷与改进
创作时间:
作者:
@小白创作中心
平安科技王磊:大规模预训练模型在金融领域应用的缺陷与改进
引用
1
来源
1.
https://hub.baai.ac.cn/view/14338
随着BERT、GPT-3等大规模预训练模型的相继问世,"模型越大,性能越好"的理念逐渐深入人心。然而,在实际应用中,这些模型在垂直领域却面临着诸多挑战。平安科技前沿技术部门负责人王磊在CNCC 2021上的报告中,深入探讨了大规模预训练模型在金融领域应用中遇到的主要问题,并提出了相应的解决方案。
目前,大规模预训练模型已经在自然语言处理领域取得了巨大的成功。BERT、GPT-3等大规模预训练模型被看做是"暴力美学"的一次胜利,验证了"模型越大,性能越好"的逻辑,业界也普遍形成了"炼大模型"的竞赛趋势,国内研究机构和企业也相继发布了大规模预训练模型,呈现百花齐放、百家争鸣的发展格局。
大规模预训练模型在垂直领域的"致命"问题
在2021年12月的CNCC 2021"产业共话:大型预训练模型的商业应用及技术发展方向"论坛上,平安科技前沿技术部门负责人王磊做了《大规模预训练模型金融领域应用中面临的主要问题与应对技术探讨》的报告。在报告中,他指出了当前大规模预训练模型在垂直领域的"致命"问题。
王磊认为,大规模预训练模型在垂直领域性能达不到要求的原因主要有两个:
- 大规模预训练模型的训练语料库规模很大,既包含了该领域的关键信息也包含了其他无关信息,使得模型缺少对关键信息的关注。
- 当前大规模预训练模型的机制改进也很少涉及对关键信息的提取。
平安科技的解决方案
针对上述问题,王磊提出了平安科技的解决方案。他认为,大规模预训练模型本质上都是在处理信号,但只要是信号,就可能进行分解,将背景信息和垂直领域的信息分离开来,从而有效贴合下游场景。
此外,金融客户对上线模型的精度要求很高,不少场景直接使用预加载模型往往很难满足需求。王磊提出置信度评估方法,利用强化学习和Bagging思想评估模型靠谱程度。
这一解决方案不仅解决了大规模预训练模型在金融领域应用中的关键问题,也为其他垂直领域的应用提供了有益的参考。
热门推荐
AP模式设置完成后为何没有网络连接?
艾里斑半径与显微镜分辨力公式d=0.61λ/NA
八十岁老人腘窝囊肿怎么办?五种治疗方法全解析
人体每天需要摄入哪些营养成分
“没点大病组不了乐队”,少女音乐动画怎么会发展成这样
莲雾什么时候开花结果
每个地区死亡赔偿金标准是怎样的
如何挑选一扇好门?
新手必读:全面解析如何挑选最适合你的羽毛球拍
叶黄素对人类健康保护作用的探讨
个人所得税专项附加扣除标准详解:子女教育、继续教育、住房贷款等六项
对抗泛耐药革兰阴性菌,头孢他啶 / 阿维巴坦凭什么脱颖而出?
如何评估家用电器的性能?这种性能如何进行比较和选择?
智慧消防:提升学校安全管理的有效手段
卫健委2024糖尿病饮食指导:主食三要点——不低碳 低生糖 粗细配
如何在手机上登录Web微信
水泥的生产工艺和应用领域有哪些?水泥行业的市场竞争状况怎样?
案例分析:海口某餐厅公开逃单者照片,法律与道德的边界在哪里?
福州市台江区图书馆:一座融合闽都文化的现代化图书馆
哪吒三观不正?在《封神演义》的世界观里,他的行为很合理!
对口型搞笑配音:从日本“口型模仿”到全球文化现象
投喂塘朗山猕猴非善举!保持两米以上距离避免“人猴冲突”
范玮琪:从美国到华语乐坛的音乐之旅
快走能否帮助减肥?掌握这5个技巧,让你更快瘦下来!
5个瑜伽体式,轻松锻炼核心力量
探寻海南:木棉花盛开绝佳观赏地指南
超声骨密度检查和双能X线骨密度检查有什么不同?
64岁阿姨骨密度似30岁,她的4个生活习惯
千万别空腹运动?真相在这里!
正确的“祭祖”方式和意义