问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

超越GPT-4o!阿里云开源最强代码模型Qwen2.5-Coder

创作时间:
作者:
@小白创作中心

超越GPT-4o!阿里云开源最强代码模型Qwen2.5-Coder

引用
雷锋网
1.
https://m.leiphone.com/category/industrynews/ItAiY0DflQ1E8KJy.html

11月12日,阿里云通义大模型团队开源了通义千问代码模型全系列,共推出6款Qwen2.5-Coder模型。相关评测显示,这些代码模型在同等尺寸下均取得了业界最佳效果,其中32B尺寸的旗舰代码模型在多个基准评测中取得开源最佳成绩,成为全球最强开源代码模型。

编程语言因其高度逻辑化和结构化的特性,对大模型的逻辑能力提出了较高要求。Qwen2.5-Coder系列模型基于Qwen2.5基础大模型进行初始化,通过使用5.5T tokens的数据持续训练,显著提升了代码生成、推理和修复等核心任务的性能。

本次发布的旗舰模型Qwen2.5-Coder-32B-Instruct在多个主流代码生成基准上刷新了开源模型的得分纪录。特别是在代码修复能力的Aider和多编程语言能力的McEval等9个基准测试中,该模型的表现甚至超越了闭源模型GPT-4o,实现了开源模型对闭源模型的反超。

在代码推理方面,Qwen2.5-Coder-32B-Instruct也在CRUXEval-O基准上取得了开源模型的最佳成绩。该模型在40余种编程语言中表现出色,在McEval基准上获得了所有开闭源模型的最高分,并在MdEval基准上斩获开源冠军。

此次开源的Qwen2.5-Coder系列包括0.5B/1.5B/3B/7B/14B/32B等6个尺寸的全系列模型,每个尺寸都提供了Base和Instruct两种版本。其中,Base模型可供开发者进行微调,而Instruct模型则是开箱即用的官方对齐模型。所有Qwen2.5-Coder模型在同等尺寸下均达到了最佳性能。

Qwen2.5-Coder全系列的开源,将为开发者提供更丰富的选择,无论是在端侧还是云上,都能更好地利用AI大模型完成编程开发工作。即便是编程“小白”,也能通过内置Qwen2.5-Coder的代码助手和可视化工具,用自然语言对话生成网站、数据图表、简历和游戏等各类应用。

截至目前,Qwen2.5已开源100多个大语言模型、多模态模型、数学模型和代码模型,几乎所有模型都实现了同等尺寸下的最佳性能。据统计,全球基于Qwen系列二次开发的衍生模型数量在9月底已突破7.43万,超越Llama系列衍生模型的7.28万,通义千问已成为全球最大的生成式语言模型族群。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号