2024年中国AI大模型产业发展与应用研究报告

创作时间:

作者:

@小白创作中心

2024年中国AI大模型产业发展与应用研究报告

引用

来源

https://www.fxbaogao.com/detail/4674074

2024年，中国AI大模型产业进入快速发展阶段。从2018年OpenAI发布首个生成式预训练模型GPT-1至今，AI大模型技术经历了飞速发展。2023年，百度发布文心一言，拉开国内"百模大战"序幕。2024年，中国AI大模型产业落地明显加速，市场规模约157亿元，预计2022-2027年复合增长率达148%。

研究背景

AI大模型是指拥有亿级以上参数的深度学习模型，从应用场景角度可分为通用大模型和垂直大模型，其中垂直大模型又可以分为行业大模型和垂直场景大模型。通用大模型，聚焦基础层和技术攻关；垂直大模型，聚焦垂直领域解决方案，在通用大模型基础上开发行业和场景专用模型，面向政务、金融、医疗、教育、交通等垂直行业和营销、客服、运营等通用场景。

2024年以来，我国AI大模型的产业应用已经迅速展开，本报告通过调研中国AI大模型产业发展和市场应用，梳理AI大模型的发展历程、产业生态、商业模式、行业应用、市场规模、发展趋势等，并对典型垂类行业和场景应用案例进行剖析，以期达到以下目的：

通过研究AI大模型产业的发展历程、产业生态、商业模式、行业和场景应用等，帮助企业了解AI大模型产业的发展脉络和发展方向；
重点分析AI大模型产业的市场规模、发展驱动、市场应用、发展趋势，帮助AI大模型企业把握市场需求动向和发展趋势；
深入调研AI大模型的典型行业和场景应用，挖掘行业里应用相对成熟、落地价值度高、市场反馈良好的优秀服务商与实践案例，为客户产品选择提供参考。

发展现状

AI大模型可按照应用领域和输入数据类型进行分类

AI大模型是指拥有亿级以上参数的深度学习模型。AI大模型利用深度学习算法和人工神经网络技术等AI技术，通过学习大量的数据提升预测能力，其性能与模型的参数规模、数据集大小和训练用的计算量之间存在幂律关系；AI大模型基于注意力机制，通过在大规模、多元化的无标注数据集进行训练，具有较强泛化能力，应用在广泛的场景和任务。按输入数据类型，AI大模型分为语言大模型，视觉大模型、多模态大模型等；从应用领域角度分类，AI大模型分为通用大模型、行业大模型、垂直大模型。

按应用领域	L0通用大模型	L1行业大模型	AI 大模型分类
按输入数据类型	语言大模型	视觉大模型	多模态大模型
在多个领域和任务上通用，具有基础的认知能力，各学科知识都懂一点；通用大模型就像完成了大学前素质教育阶段的学生。	针对特定的行业或领域的大模型，通常使用行业相关的数据进行预训练或微调，来提高在该领域的性能和准确度；行业大模型就像选择了专业的大学生，对所在专业领域的知识有了更深入的了解。	针对特定任务或场景的大模型，使用更加专业的知识和数据进行预训练和微调，在专业任务上的性能和效果更优；垂直大模型就像研究生，在所在具体领域有了比较深入的研究。
通过处理大量文本数据来理解和生成人类语言的大模型，执行自然语言处理任务，如文本分类、问答、对话、摘要总结等；常见的语言大模型包括ChatGPT、文心一言、讯飞星火等。	是一种基于大规模数据和强大计算能力训练的深度学习模型，通过模拟人类视觉系统的工作原理，通过复杂的神经网络结构，实现对图像和视频数据的高度识别、分析和表达的效果；常见的视觉大模型包括智谱CogVLM、书生·视觉大模型等。	多模态大模型指的是将文本、图像、视频、音频等多模态信息联合起来进行训练的模型；典型的多模态大模型包括腾讯的hunyuan-vision、商汤科技的日日新等。

至2024年中国AI大模型产业发展加速进入商用阶段

1956-2006年，深度学习和神经网络技术的提出和发展，为AI大模型的出现奠定了技术基础，大模型技术萌芽开始出现；2006年后自然语言处理技术、Transformer架构的发展，为大模型预训练算法技术和架构奠定了基础；2018年OpenAI和Google分别发布GPT-1与BERT，预训练大模型成为自然语言处理领域的主流；2022年底， OpenAI推出ChatGPT引发全球大模型发展热潮，2023年中国国内大模型训练开始井喷，出现“百模大战”现象；2024年中国政策加大行业落地推动力度，商业发展加速。

1956年：约翰·麦卡锡首次提出“人工智能”概念，标志着AI领域的诞生
1998年：法国学者YannLeCun等人构建LeNet-5，标志着机器学习从浅层模型向深度学习模型的转变，为自然语言处理和计算机视觉等领域的研究奠定了基础
2013年：Word2Vec模型诞生，提出将单词转换为向量的“词向量模型”，推动了自然语言处理的发展
2014年：对抗式生成网络（GAN）诞生，标志着深度学习进入了生成式模型研究的新阶段
2024年1-7月，中国央国企采购大模型项目数量已超过950个
2023年：GPT-4发布，具备了多模态理解与多类型内容生成能力，进一步推动了大模型技术的发展
2023年：中国掀起“百模大战”，发布各类大模型数量超过100个，涵盖通用大模型、行业大模型、基于通用大模型或行业大模型的应用服务型大模型等
截至2024年11月，中国获得备案的大模型数量达到309个，中国大模型开始在垂类行业众多场景落地
截止2024年底，中国大模型产品使用价格进一步下降，为大模型广泛商用落地提供了基础

2024年4月（第一批）2024年8月（第二批）2024年11月（第三批）数据来源：第一新声研究院整理 120 100 80 60 40 20 0 95 2024年生成式人工智能服务备案数量 117 97 2023-2024年国产大模型价格走势（元/百万Tokens） 500 •2017年：Google提出了基于自注意力机制的Transformer架构，为大模型的预训练算法架构奠定了基础 •2018年：OpenAI和Google分别发布了GPT-1与BERT，标志着预训练大模型成为自然语言处理领域的主流 •2020年：OpenAI推出了GPT-3模型，参数规模达到了1750亿， 400 300 200 100 0 300 50201.5 在零样本学习任务上实现了巨大性能的提升 2023年H12023年H22024年H12024年H2 数据来源：第一新声研究院整理

AI大模型产业发展现状

大模型发展与应用结构

TOP5大模型应用行业：互联网、金融、医疗、教育、政务

我国AI大模型需要依照《生成式人工智能管理暂行办法》进行备案，截止到2024年11月，已有3批次共计309个大模型通过国家互联网信息办公室备案。从应用类型看，通用大模型占比28%，垂类大模型占比72%；从应用领域看，互联网行业、金融行业、医疗行业、教育行业、工业行业大模型占比均超过10%。

------模态结构------ ------类型结构------ ------行业结构------ 视频大模型12% 通用大模型28% 其他18% 互联网21% 多模态大模型10% 语言大模型78% 垂直大模型72% 工业10% 政务11% 教育12% 医疗12% 金融16%

洞察一：得益于语言大模型的能力和丰富的应用场景，语言大模型的数量明显多于其他模态；随着大模型多任务适应性和多模态能力持续增强，对齐视觉特征和文本特征，实现跨模态的统一理解，并根据指令创造新的内容或增强现有数据表达，成为当前大模型创新的焦点。

洞察二：闭源大模型的商业化输出和开源大模型的涌现，推动大模型落地门槛持续降低，垂直行业成为创新的重要赛道，吸引了产业资本支持；2024年，我国垂直大模型涌现，快速向垂直行业渗透。

洞察三：垂类大模型覆盖互联网、金融、医疗、教育、政务等众多行业；目前垂类大模型行业用户对知识助手、智能客服、智能营销、编码助手等应用接受程度高，同时对数据分析、办公助手等应用抱有较高期待。

产品发展

国产大模型已大幅降价，为广泛商业化应用奠定基础

当前AI大模型产品进化路线有两条，一是通过增加模型参数量、扩大数据集、提升训练计算量来获得性能更强大的大模型产品；二是通过优化模型架构适应性和计算效率，获得更具性价比的产品，如70B参数的模型，通过优化架构和训练策略，可获得接近或超越更大规模模型的性能。随着大模型能力和性价比的提升，国产大模型厂商开始大幅降价，截止到2024年底，我国典型AI大模型的价格下降至0.5元/百万Tokens以内，为大模型应用的广泛落地打下了基础。

中国AI大模型代表厂商及最新大模型

公司	模型名称	价格(元/百万Tokens)
智谱华章	GLM-4-Air	0.5
字节跳动	Doubao-vision-lite-32k	1.5
阿里巴巴	Qwen-vl-plus	1.5
百度	ERNIE3.5	0.8
腾讯	hunyuan-standard	0.8
科大讯飞	SparkPro	0.5

中国AI大模型代表厂商及最新大模型

AI大模型代表厂商	大模型版本	模型特点
智谱华章	GLM-4- Plus	4050亿参数，具备全面的语言理解能力，更好的智能遵循能力和高质量数据构造能力，结合跨模态能力和实时推理能力，适用于聊天机器人、内容创造、教育辅导、多模态交互等场景
字节跳动	豆包通用模型pro	8000亿参数，基于DIT架构，在图像和语音处理方面性能突出，其视频生成能力可帮助用户提供专业级视频内容
阿里巴巴	Qwen2.5-Turbo	上下文处理的长度极限获得突破，推理速度显著提升，适用于文本理解、代码处理等场景，兼具高效性与低成本优势
百度	文心大模型 4.0Turbo	训练速度相比上代产品提升数倍至数十倍，生成内容更具条理性，输入输出价格下降70%，适用于智能客服、智能助手、内容创作、数据分析等场景
深度求索	DeepSeek-V3	参数规模6710亿,采用了混合专家架构（Mixture-of-Experts,MoE），这种架构使得模型在有限硬件资源下仍能实现高性能
科大讯飞	讯飞星火 4.0Turbo	突出的数学能力和代码能力，新增多模态视觉交互及超拟人虚拟人交互功能，适用于智能写作、多模态交互、医疗、教育、司法和政务服务等场景