“法信法律基座大模型”发布:法律人工智能迎来国家级基础设施
“法信法律基座大模型”发布:法律人工智能迎来国家级基础设施
11月15日,最高人民法院正式发布“法信法律基座大模型”,这是国内首个完成网信部门生成式人工智能服务备案的法律行业基座大模型,也是我国首个国家级法律人工智能基础设施。这一重大发布标志着我国法律科技发展迈入新阶段,为司法效率和公正性的提升注入了新的科技动力。
法信法律基座大模型:法律AI的国家级基础设施
“法信法律基座大模型”是在清华大学千亿参数通用大模型基座上,投入最高人民法院“法信”等多个法律大数据平台经过高质量专业标注的3.2亿篇共计3.67万亿字的法律文献、裁判、案例、观点等数据语料,并融入人民法院电子音像出版社历时十余年搭建的包含18万法律知识体系编码的“法信大纲”。经过为期数月的预训练、优化训练、监督微调和多轮测评,最终形成“法信法律基座大模型”。
这一模型定位于法律行业基座模型,旨在为法治领域提供生成式人工智能底层能力。同时,它也是一套保障法律人工智能安全发展、配套安全治理机制,以及提供数据资源、算力资源、评测资源的服务体系。
核心功能:从语义理解到逻辑推理
“法信法律基座大模型”具备多项核心功能,包括法律语义理解、逻辑推理、融合搜索、内容生成等。这些功能使其能够在多个场景下为法律工作者提供智能化支持。
- 法律语义理解:理解和解释法律文本中的语言含义,帮助法律工作者快速把握复杂法律文献的核心要义。
- 逻辑推理:根据法律知识进行逻辑推理,辅助法律决策,特别是在案件分析和法律适用方面提供智能化支持。
- 融合搜索:结合不同来源的法律数据,提供综合搜索服务,帮助法律工作者快速定位所需信息。
- 内容生成:生成法律文书、判决书等法律文件,减轻法律工作者的重复性劳动负担。
实践应用:从审判辅助到公共法律服务
“法信法律基座大模型”的应用场景覆盖了司法工作的多个方面:
- 智能辅助审判:辅助法官从大篇幅的电子卷宗中快速进行信息分析比对,抓取要点、提炼梗概,提高立案审查和阅卷效率。在深圳法院人工智能辅助审判系统1.0版上线全面运行后,有力提升了审判工作质效。
- 行政执法辅助:辅助执法人员对执法案件的信息进行审查核验,监测报警异常情况,检查执法行为是否符合法定程序和规范,确保执法活动的合法性。
- 公共法律服务:理解公众非专业化的诉求表述,提供和解、调解、应诉等不同策略和建议,为公众提供更为便捷、普惠的法律咨询服务。
技术创新:通用能力与专业知识的深度融合
清华大学计算机科学与技术系副教授刘知远指出,该模型的技术创新主要体现在如何将我国司法审判业务需求与大模型技术相结合,实现“先通后专,通专结合”。模型训练过程中应用了基于课程学习的模型训练技术、高效的数据治理与合成技术,并通过加入安全对齐语料培养模型价值观,确保模型输出内容的安全可靠。
未来展望:构建法律智能体协同网络
刘知远副教授表示,未来每一位法律工作者都可能拥有专属的智能体助理,承担机械的重复性劳动以及简单的创造性工作。随着大模型智能体技术的发展,当事人、律师、法官、法律学者将能够通过专属自身角色的智能体助手,构建出一个更高质量、更高效的群体智能工作协同网络。
“法信法律基座大模型”的发布,不仅体现了我国在法律人工智能领域的技术实力,更展示了科技与司法深度融合的广阔前景。随着这一模型在更多场景下的应用和优化,我们有理由期待,一个更加高效、公正、透明的智慧司法体系正在加速构建之中。