平安科技王磊:大规模预训练模型在金融领域应用的缺陷与改进
创作时间:
作者:
@小白创作中心
平安科技王磊:大规模预训练模型在金融领域应用的缺陷与改进
引用
1
来源
1.
https://hub.baai.ac.cn/view/14338
随着BERT、GPT-3等大规模预训练模型的相继问世,"模型越大,性能越好"的理念逐渐深入人心。然而,在实际应用中,这些模型在垂直领域却面临着诸多挑战。平安科技前沿技术部门负责人王磊在CNCC 2021上的报告中,深入探讨了大规模预训练模型在金融领域应用中遇到的主要问题,并提出了相应的解决方案。
目前,大规模预训练模型已经在自然语言处理领域取得了巨大的成功。BERT、GPT-3等大规模预训练模型被看做是"暴力美学"的一次胜利,验证了"模型越大,性能越好"的逻辑,业界也普遍形成了"炼大模型"的竞赛趋势,国内研究机构和企业也相继发布了大规模预训练模型,呈现百花齐放、百家争鸣的发展格局。
大规模预训练模型在垂直领域的"致命"问题
在2021年12月的CNCC 2021"产业共话:大型预训练模型的商业应用及技术发展方向"论坛上,平安科技前沿技术部门负责人王磊做了《大规模预训练模型金融领域应用中面临的主要问题与应对技术探讨》的报告。在报告中,他指出了当前大规模预训练模型在垂直领域的"致命"问题。
王磊认为,大规模预训练模型在垂直领域性能达不到要求的原因主要有两个:
- 大规模预训练模型的训练语料库规模很大,既包含了该领域的关键信息也包含了其他无关信息,使得模型缺少对关键信息的关注。
- 当前大规模预训练模型的机制改进也很少涉及对关键信息的提取。
平安科技的解决方案
针对上述问题,王磊提出了平安科技的解决方案。他认为,大规模预训练模型本质上都是在处理信号,但只要是信号,就可能进行分解,将背景信息和垂直领域的信息分离开来,从而有效贴合下游场景。
此外,金融客户对上线模型的精度要求很高,不少场景直接使用预加载模型往往很难满足需求。王磊提出置信度评估方法,利用强化学习和Bagging思想评估模型靠谱程度。
这一解决方案不仅解决了大规模预训练模型在金融领域应用中的关键问题,也为其他垂直领域的应用提供了有益的参考。
热门推荐
楚辞中提取女孩文雅气质的名字有哪些技巧
了不起的粟裕同志
买房子最好的楼层,如何选择最适合的居住高度
新能源车充电攻略:三元锂 vs 磷酸铁锂,到底该充多少电?
探索天蝎座十二生肖的人格特征
储能系统技术原理与难点详解
2025年起,电动车、摩托车、三轮车上路迎"6大严查"
北京市属公园清明游园活动安排:赏花、文化体验、红色教育等你来
抽血化验能查出什么
电动车VS燃油车:谁更耐用?最新研究揭示关键数据
8年用车成本大对比:电动车到底省不省钱?
肯尼迪遇刺案绝密档案解密:家族伤痛与权力博弈背后的六十年追问
粟和栗的区别:“粟”和“栗”各指什么?五谷,南北说法各不相同
门牙外伤裂纹深浅怎么判断多深?教你自测方法,轻松判断裂纹深浅及时止损
2025年金融行业分析:民营企业融资渠道将更加多元化
一个包子多少热量?教你科学食用包子
这么吹,小心头发越掉越多,正确吹头的四个关键→
舌中裂纹吃什么食物好得快
如何区分C语言中的变量和常量
儿童均衡阅读作用
适合小学生阅读的10本优秀书籍
怎么在手机上打开excel不乱
收藏!详解瞳距与瞳高的测量
乡镇如何使用大数据库
闪烁体探测器与盖革管:核辐射检测中的技术较量
高校专项计划95所大学名单及录取分数线汇总(2025参考)
美股血崩!“七姐妹”市值一夜蒸发5.51万亿元 特斯拉已“腰斩”
我院针灸科刘志顺团队原创研究成果再登国际顶刊
自我效能感:个体能力判断与行为动机的关键
比特币多空对决:策略与风险全解析