超越GPT-4o！阿里云开源最强代码模型Qwen2.5-Coder

创作时间:

作者:

@小白创作中心

超越GPT-4o！阿里云开源最强代码模型Qwen2.5-Coder

引用

雷锋网

https://m.leiphone.com/category/industrynews/ItAiY0DflQ1E8KJy.html

11月12日，阿里云通义大模型团队开源了通义千问代码模型全系列，共推出6款Qwen2.5-Coder模型。相关评测显示，这些代码模型在同等尺寸下均取得了业界最佳效果，其中32B尺寸的旗舰代码模型在多个基准评测中取得开源最佳成绩，成为全球最强开源代码模型。

编程语言因其高度逻辑化和结构化的特性，对大模型的逻辑能力提出了较高要求。Qwen2.5-Coder系列模型基于Qwen2.5基础大模型进行初始化，通过使用5.5T tokens的数据持续训练，显著提升了代码生成、推理和修复等核心任务的性能。

本次发布的旗舰模型Qwen2.5-Coder-32B-Instruct在多个主流代码生成基准上刷新了开源模型的得分纪录。特别是在代码修复能力的Aider和多编程语言能力的McEval等9个基准测试中，该模型的表现甚至超越了闭源模型GPT-4o，实现了开源模型对闭源模型的反超。

在代码推理方面，Qwen2.5-Coder-32B-Instruct也在CRUXEval-O基准上取得了开源模型的最佳成绩。该模型在40余种编程语言中表现出色，在McEval基准上获得了所有开闭源模型的最高分，并在MdEval基准上斩获开源冠军。

此次开源的Qwen2.5-Coder系列包括0.5B/1.5B/3B/7B/14B/32B等6个尺寸的全系列模型，每个尺寸都提供了Base和Instruct两种版本。其中，Base模型可供开发者进行微调，而Instruct模型则是开箱即用的官方对齐模型。所有Qwen2.5-Coder模型在同等尺寸下均达到了最佳性能。

Qwen2.5-Coder全系列的开源，将为开发者提供更丰富的选择，无论是在端侧还是云上，都能更好地利用AI大模型完成编程开发工作。即便是编程“小白”，也能通过内置Qwen2.5-Coder的代码助手和可视化工具，用自然语言对话生成网站、数据图表、简历和游戏等各类应用。

截至目前，Qwen2.5已开源100多个大语言模型、多模态模型、数学模型和代码模型，几乎所有模型都实现了同等尺寸下的最佳性能。据统计，全球基于Qwen系列二次开发的衍生模型数量在9月底已突破7.43万，超越Llama系列衍生模型的7.28万，通义千问已成为全球最大的生成式语言模型族群。

热门推荐

怎么提高自控力：10个实用方法助你增强自制力