问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

2024年中国AI大模型产业发展与应用研究报告

创作时间:
作者:
@小白创作中心

2024年中国AI大模型产业发展与应用研究报告

引用
1
来源
1.
https://www.fxbaogao.com/detail/4674074

2024年,中国AI大模型产业进入快速发展阶段。从2018年OpenAI发布首个生成式预训练模型GPT-1至今,AI大模型技术经历了飞速发展。2023年,百度发布文心一言,拉开国内"百模大战"序幕。2024年,中国AI大模型产业落地明显加速,市场规模约157亿元,预计2022-2027年复合增长率达148%。

研究背景

AI大模型是指拥有亿级以上参数的深度学习模型,从应用场景角度可分为通用大模型和垂直大模型,其中垂直大模型又可以分为行业大模型和垂直场景大模型。通用大模型,聚焦基础层和技术攻关;垂直大模型,聚焦垂直领域解决方案,在通用大模型基础上开发行业和场景专用模型,面向政务、金融、医疗、教育、交通等垂直行业和营销、客服、运营等通用场景。

2024年以来,我国AI大模型的产业应用已经迅速展开,本报告通过调研中国AI大模型产业发展和市场应用,梳理AI大模型的发展历程、产业生态、商业模式、行业应用、市场规模、发展趋势等,并对典型垂类行业和场景应用案例进行剖析,以期达到以下目的:

  • 通过研究AI大模型产业的发展历程、产业生态、商业模式、行业和场景应用等,帮助企业了解AI大模型产业的发展脉络和发展方向;
  • 重点分析AI大模型产业的市场规模、发展驱动、市场应用、发展趋势,帮助AI大模型企业把握市场需求动向和发展趋势;
  • 深入调研AI大模型的典型行业和场景应用,挖掘行业里应用相对成熟、落地价值度高、市场反馈良好的优秀服务商与实践案例,为客户产品选择提供参考。

发展现状

AI大模型可按照应用领域和输入数据类型进行分类

AI大模型是指拥有亿级以上参数的深度学习模型。AI大模型利用深度学习算法和人工神经网络技术等AI技术,通过学习大量的数据提升预测能力,其性能与模型的参数规模、 数据集大小和训练用的计算量之间存在幂律关系;AI大模型基于注意力机制,通过在大规模、多元化的无标注数据集进行训练,具有较强泛化能力,应用在广泛的场景和任 务。按输入数据类型,AI大模型分为语言大模型,视觉大模型、多模态大模型等;从应用领域角度分类,AI大模型分为通用大模型、行业大模型、垂直大模型。

按应用领域
L0通用大模型
L1行业大模型
AI 大模型分类
L2垂直大模型
按输入数据类型
语言大模型
视觉大模型
多模态大模型
在多个领域和任务上通用,具有基础的认知能力,各学科知识都懂一点;通用大模型就像完成了大学前素质教育阶段的学生。
针对特定的行业或领域的大模型,通常使用行业相关的数据进行预训练或微调,来提高在该领域的性能和准确度;行业大模型 就像选择了专业的大学生,对所在专业领域的知识有了更深入的了解。
针对特定任务或场景的大模型,使用更加专业的知识和数据进行预训练和微调,在专业任务上的性能和效果更优;垂直大模型就像研究生,在所在具体领域有了比较深入的研究。
通过处理大量文本数据来理解和生成人类语言的大模型,执行自然语言处理任务,如文本分类、问答、对话、摘要总结等;常见的语言大模型包括ChatGPT、文心一言、讯飞星火等。
是一种基于大规模数据和强大计算能力训练的深度学习模型,通过模拟人类视觉系统的工作原理,通过复杂的神经网络结构,实现对图像和视频数据的高度识别、分析和表达的效果;常见的视觉大模型包括智谱CogVLM、书生·视觉大模型等。
多模态大模型指的是将文本、图像、视频、音频等多模态信息联合起来进行训练的模型;典型的多模态大模型包括腾讯的hunyuan-vision、商汤科技的日日新等。

至2024年中国AI大模型产业发展加速进入商用阶段

1956-2006年,深度学习和神经网络技术的提出和发展,为AI大模型的出现奠定了技术基础,大模型技术萌芽开始出现;2006年后自然语言处理技术、Transformer架构 的发展,为大模型预训练算法技术和架构奠定了基础;2018年OpenAI和Google分别发布GPT-1与BERT,预训练大模型成为自然语言处理领域的主流;2022年底, OpenAI推出ChatGPT引发全球大模型发展热潮,2023年中国国内大模型训练开始井喷,出现“百模大战”现象;2024年中国政策加大行业落地推动力度,商业发展加速。

  • 1956年:约翰·麦卡锡首次提出“人工智能”概念,标志着AI领域的诞生
  • 1998年:法国学者YannLeCun等人构建LeNet-5,标志着机器学习从浅层模型向深度学习模型的转变,为自然语言处理和计算机视觉等领域的研究奠定了基础
  • 2013年:Word2Vec模型诞生,提出将单词转换为向量的“词向量模型”,推动了自然语言处理的发展
  • 2014年:对抗式生成网络(GAN)诞生,标志着深度学习进入了生成式模型研究的新阶段
  • 2024年1-7月,中国央国企采购大模型项目数量已超过950个
  • 2023年:GPT-4发布,具备了多模态理解与多类型内容生成能力,进一步推动了大模型技术的发展
  • 2023年:中国掀起“百模大战”,发布各类大模型数量超过100个,涵盖通用大模型、行业大模型、基于通用大模型或行业大模型的应用服务型大模型等
  • 截至2024年11月,中国获得备案的大模型数量达到309个,中国大模型开始在垂类行业众多场景落地
  • 截止2024年底,中国大模型产品使用价格进一步下降,为大模型广泛商用落地提供了基础

2024年4月(第一批)2024年8月(第二批)2024年11月(第三批) 数据来源:第一新声研究院整理 120 100 80 60 40 20 0 95 2024年生成式人工智能服务备案数量 117 97 2023-2024年国产大模型价格走势(元/百万Tokens) 500 •2017年:Google提出了基于自注意力机制的Transformer架构,为大模型的预训练算法架构奠定了基础 •2018年:OpenAI和Google分别发布了GPT-1与BERT,标志着预训练大模型成为自然语言处理领域的主流 •2020年:OpenAI推出了GPT-3模型,参数规模达到了1750亿, 400 300 200 100 0 300 50201.5 在零样本学习任务上实现了巨大性能的提升 2023年H12023年H22024年H12024年H2 数据来源:第一新声研究院整理

AI大模型产业发展现状

大模型发展与应用结构

TOP5大模型应用行业:互联网、金融、医疗、教育、政务

我国AI大模型需要依照《生成式人工智能管理暂行办法》进行备案,截止到2024年11月,已有3批次共计309个大模型通过国家互联网信息办公室备案。从应用类型看,通用大模型占比28%,垂类大模型占比72%;从应用领域看,互联网行业、金融行业、医疗行业、教育行业、工业行业大模型占比均超过10%。

------模态结构------ ------类型结构------ ------行业结构------ 视频大模型12% 通用大模型28% 其他18% 互联网21% 多模态大模型10% 语言大模型78% 垂直大模型72% 工业10% 政务11% 教育12% 医疗12% 金融16%

洞察一:得益于语言大模型的能力和丰富的应用场景,语言大模型的数量明显多于其他模态;随着大模型多任务适应性和多模态能力持续增强,对齐视觉特征和文本特征,实现跨模态的统一理解,并根据指令创造新的内容或增强现有数据表达,成为当前大模型创新的焦点。

洞察二:闭源大模型的商业化输出和开源大模型的涌现,推动大模型落地门槛持续降低,垂直行业成为创新的重要赛道,吸引了产业资本支持;2024年,我国垂直大模型涌现,快速向垂直行业渗透。

洞察三:垂类大模型覆盖互联网、金融、医疗、教育、政务等众多行业;目前垂类大模型行业用户对知识助手、智能客服、智能营销、编码助手等应用接受程度高,同时对数据分析、办公助手等应用抱有较高期待。

产品发展

国产大模型已大幅降价,为广泛商业化应用奠定基础

当前AI大模型产品进化路线有两条,一是通过增加模型参数量、扩大数据集、提升训练计算量来获得性能更强大的大模型产品;二是通过优化模型架构适应性和计算效率, 获得更具性价比的产品,如70B参数的模型,通过优化架构和训练策略,可获得接近或超越更大规模模型的性能。随着大模型能力和性价比的提升,国产大模型厂商开始大 幅降价,截止到2024年底,我国典型AI大模型的价格下降至0.5元/百万Tokens以内,为大模型应用的广泛落地打下了基础。

中国AI大模型代表厂商及最新大模型

公司
模型名称
价格(元/百万Tokens)
智谱华章
GLM-4-Air
0.5
字节跳动
Doubao-vision-lite-32k
1.5
阿里巴巴
Qwen-vl-plus
1.5
百度
ERNIE3.5
0.8
腾讯
hunyuan-standard
0.8
科大讯飞
SparkPro
0.5

中国AI大模型代表厂商及最新大模型

AI大模型代表厂商
大模型版本
模型特点
智谱华章
GLM-4- Plus
4050亿参数,具备全面的语言理解能力,更好的智能遵循能力和高质量数据构造能力,结合跨模态能力和实时推理能力,适用于聊天机器人、内容创造、教育辅导、多模态交互等场景
字节跳动
豆包通用模型pro
8000亿参数,基于DIT架构,在图像和语音处理方面性能突出,其视频生成能力可帮助用户提供专业级视频内容
阿里巴巴
Qwen2.5-Turbo
上下文处理的长度极限获得突破,推理速度显著提升,适用于文本理解、代码处理等场景,兼具高效性与低成本优势
百度
文心大模型 4.0Turbo
训练速度相比上代产品提升数倍至数十倍,生成内容更具条理性,输入输出价格下降70%,适用于智能客服、智能助手、内容创作、数据分析等场景
深度求索
DeepSeek-V3
参数规模6710亿,采用了混合专家架构(Mixture-of-Experts,MoE),这种架构使得模型在有限硬件资源下仍能实现高性能
科大讯飞
讯飞星火 4.0Turbo
突出的数学能力和代码能力,新增多模态视觉交互及超拟人虚拟人交互功能,适用于智能写作、多模态交互、医疗、教育、司法和政务服务等场景

2024年中国AI大模型产业图谱

数据智能 具身智能 知识助手 客服 创意内容生成 营销 办公 应用 产业图谱 工具 芯片 基础设施 通用模型 智算中心 服务器 垂直模型 数据 商业化模式 AI大模型商业化落地

应用场景及案例

  1. TOP5大模型应用行业:互联网、金融、医疗、教育、政务

  2. 国产大模型已大幅降价,为广泛商业化应用奠定基础

  3. 中国AI大模型产业图谱

  4. AI大模型商业化落地:55%为定制化模式、40%-45%为API及订阅模式

  5. 五种部署方式:直接调用、能力嵌入、扩展应用、定制模型、全栈构建

  6. 2024年AI大模型应用市场规模约157亿元,2022-2027年复合增长率达148%

  7. 未来3年,中国AI大模型产业将逐步进入需求侧驱动阶段

  8. AI大模型在互联网、政务、金融等行业应用场景日益丰富

  9. 金融行业痛点及解决方案

  10. 医疗健康行业痛点及解决方案

  11. 教育行业客服场景痛点及解决方案

  12. 政务领域市场监督管理场景痛点及解决方案

  13. 零售消费行业痛点及解决方案

  14. 制造行业知识管理场景痛点及解决方案

发展趋势及挑战

  1. AI大模型四个主要技术方向
  2. 融合应用软件、智能助手和AIAgent是AI大模型市场应用的三个主要方向
  3. 缺乏高质量数据集是大模型商业落地面临的关键挑战
© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号