2024年中国AI大模型产业发展与应用研究报告
2024年中国AI大模型产业发展与应用研究报告
2024年,中国AI大模型产业进入快速发展阶段。从2018年OpenAI发布首个生成式预训练模型GPT-1至今,AI大模型技术经历了飞速发展。2023年,百度发布文心一言,拉开国内"百模大战"序幕。2024年,中国AI大模型产业落地明显加速,市场规模约157亿元,预计2022-2027年复合增长率达148%。
研究背景
AI大模型是指拥有亿级以上参数的深度学习模型,从应用场景角度可分为通用大模型和垂直大模型,其中垂直大模型又可以分为行业大模型和垂直场景大模型。通用大模型,聚焦基础层和技术攻关;垂直大模型,聚焦垂直领域解决方案,在通用大模型基础上开发行业和场景专用模型,面向政务、金融、医疗、教育、交通等垂直行业和营销、客服、运营等通用场景。
2024年以来,我国AI大模型的产业应用已经迅速展开,本报告通过调研中国AI大模型产业发展和市场应用,梳理AI大模型的发展历程、产业生态、商业模式、行业应用、市场规模、发展趋势等,并对典型垂类行业和场景应用案例进行剖析,以期达到以下目的:
- 通过研究AI大模型产业的发展历程、产业生态、商业模式、行业和场景应用等,帮助企业了解AI大模型产业的发展脉络和发展方向;
- 重点分析AI大模型产业的市场规模、发展驱动、市场应用、发展趋势,帮助AI大模型企业把握市场需求动向和发展趋势;
- 深入调研AI大模型的典型行业和场景应用,挖掘行业里应用相对成熟、落地价值度高、市场反馈良好的优秀服务商与实践案例,为客户产品选择提供参考。
发展现状
AI大模型可按照应用领域和输入数据类型进行分类
AI大模型是指拥有亿级以上参数的深度学习模型。AI大模型利用深度学习算法和人工神经网络技术等AI技术,通过学习大量的数据提升预测能力,其性能与模型的参数规模、 数据集大小和训练用的计算量之间存在幂律关系;AI大模型基于注意力机制,通过在大规模、多元化的无标注数据集进行训练,具有较强泛化能力,应用在广泛的场景和任 务。按输入数据类型,AI大模型分为语言大模型,视觉大模型、多模态大模型等;从应用领域角度分类,AI大模型分为通用大模型、行业大模型、垂直大模型。
按应用领域 | L0通用大模型 | L1行业大模型 | AI 大模型分类 | L2垂直大模型 |
---|---|---|---|---|
按输入数据类型 | 语言大模型 | 视觉大模型 | 多模态大模型 | |
在多个领域和任务上通用,具有基础的认知能力,各学科知识都懂一点;通用大模型就像完成了大学前素质教育阶段的学生。 | 针对特定的行业或领域的大模型,通常使用行业相关的数据进行预训练或微调,来提高在该领域的性能和准确度;行业大模型 就像选择了专业的大学生,对所在专业领域的知识有了更深入的了解。 | 针对特定任务或场景的大模型,使用更加专业的知识和数据进行预训练和微调,在专业任务上的性能和效果更优;垂直大模型就像研究生,在所在具体领域有了比较深入的研究。 | ||
通过处理大量文本数据来理解和生成人类语言的大模型,执行自然语言处理任务,如文本分类、问答、对话、摘要总结等;常见的语言大模型包括ChatGPT、文心一言、讯飞星火等。 | 是一种基于大规模数据和强大计算能力训练的深度学习模型,通过模拟人类视觉系统的工作原理,通过复杂的神经网络结构,实现对图像和视频数据的高度识别、分析和表达的效果;常见的视觉大模型包括智谱CogVLM、书生·视觉大模型等。 | 多模态大模型指的是将文本、图像、视频、音频等多模态信息联合起来进行训练的模型;典型的多模态大模型包括腾讯的hunyuan-vision、商汤科技的日日新等。 |
至2024年中国AI大模型产业发展加速进入商用阶段
1956-2006年,深度学习和神经网络技术的提出和发展,为AI大模型的出现奠定了技术基础,大模型技术萌芽开始出现;2006年后自然语言处理技术、Transformer架构 的发展,为大模型预训练算法技术和架构奠定了基础;2018年OpenAI和Google分别发布GPT-1与BERT,预训练大模型成为自然语言处理领域的主流;2022年底, OpenAI推出ChatGPT引发全球大模型发展热潮,2023年中国国内大模型训练开始井喷,出现“百模大战”现象;2024年中国政策加大行业落地推动力度,商业发展加速。
- 1956年:约翰·麦卡锡首次提出“人工智能”概念,标志着AI领域的诞生
- 1998年:法国学者YannLeCun等人构建LeNet-5,标志着机器学习从浅层模型向深度学习模型的转变,为自然语言处理和计算机视觉等领域的研究奠定了基础
- 2013年:Word2Vec模型诞生,提出将单词转换为向量的“词向量模型”,推动了自然语言处理的发展
- 2014年:对抗式生成网络(GAN)诞生,标志着深度学习进入了生成式模型研究的新阶段
- 2024年1-7月,中国央国企采购大模型项目数量已超过950个
- 2023年:GPT-4发布,具备了多模态理解与多类型内容生成能力,进一步推动了大模型技术的发展
- 2023年:中国掀起“百模大战”,发布各类大模型数量超过100个,涵盖通用大模型、行业大模型、基于通用大模型或行业大模型的应用服务型大模型等
- 截至2024年11月,中国获得备案的大模型数量达到309个,中国大模型开始在垂类行业众多场景落地
- 截止2024年底,中国大模型产品使用价格进一步下降,为大模型广泛商用落地提供了基础
2024年4月(第一批)2024年8月(第二批)2024年11月(第三批) 数据来源:第一新声研究院整理 120 100 80 60 40 20 0 95 2024年生成式人工智能服务备案数量 117 97 2023-2024年国产大模型价格走势(元/百万Tokens) 500 •2017年:Google提出了基于自注意力机制的Transformer架构,为大模型的预训练算法架构奠定了基础 •2018年:OpenAI和Google分别发布了GPT-1与BERT,标志着预训练大模型成为自然语言处理领域的主流 •2020年:OpenAI推出了GPT-3模型,参数规模达到了1750亿, 400 300 200 100 0 300 50201.5 在零样本学习任务上实现了巨大性能的提升 2023年H12023年H22024年H12024年H2 数据来源:第一新声研究院整理
AI大模型产业发展现状
大模型发展与应用结构
TOP5大模型应用行业:互联网、金融、医疗、教育、政务
我国AI大模型需要依照《生成式人工智能管理暂行办法》进行备案,截止到2024年11月,已有3批次共计309个大模型通过国家互联网信息办公室备案。从应用类型看,通用大模型占比28%,垂类大模型占比72%;从应用领域看,互联网行业、金融行业、医疗行业、教育行业、工业行业大模型占比均超过10%。
------模态结构------ ------类型结构------ ------行业结构------ 视频大模型12% 通用大模型28% 其他18% 互联网21% 多模态大模型10% 语言大模型78% 垂直大模型72% 工业10% 政务11% 教育12% 医疗12% 金融16%
洞察一:得益于语言大模型的能力和丰富的应用场景,语言大模型的数量明显多于其他模态;随着大模型多任务适应性和多模态能力持续增强,对齐视觉特征和文本特征,实现跨模态的统一理解,并根据指令创造新的内容或增强现有数据表达,成为当前大模型创新的焦点。
洞察二:闭源大模型的商业化输出和开源大模型的涌现,推动大模型落地门槛持续降低,垂直行业成为创新的重要赛道,吸引了产业资本支持;2024年,我国垂直大模型涌现,快速向垂直行业渗透。
洞察三:垂类大模型覆盖互联网、金融、医疗、教育、政务等众多行业;目前垂类大模型行业用户对知识助手、智能客服、智能营销、编码助手等应用接受程度高,同时对数据分析、办公助手等应用抱有较高期待。
产品发展
国产大模型已大幅降价,为广泛商业化应用奠定基础
当前AI大模型产品进化路线有两条,一是通过增加模型参数量、扩大数据集、提升训练计算量来获得性能更强大的大模型产品;二是通过优化模型架构适应性和计算效率, 获得更具性价比的产品,如70B参数的模型,通过优化架构和训练策略,可获得接近或超越更大规模模型的性能。随着大模型能力和性价比的提升,国产大模型厂商开始大 幅降价,截止到2024年底,我国典型AI大模型的价格下降至0.5元/百万Tokens以内,为大模型应用的广泛落地打下了基础。
中国AI大模型代表厂商及最新大模型
公司 | 模型名称 | 价格(元/百万Tokens) |
---|---|---|
智谱华章 | GLM-4-Air | 0.5 |
字节跳动 | Doubao-vision-lite-32k | 1.5 |
阿里巴巴 | Qwen-vl-plus | 1.5 |
百度 | ERNIE3.5 | 0.8 |
腾讯 | hunyuan-standard | 0.8 |
科大讯飞 | SparkPro | 0.5 |
中国AI大模型代表厂商及最新大模型
AI大模型代表厂商 | 大模型版本 | 模型特点 |
---|---|---|
智谱华章 | GLM-4- Plus | 4050亿参数,具备全面的语言理解能力,更好的智能遵循能力和高质量数据构造能力,结合跨模态能力和实时推理能力,适用于聊天机器人、内容创造、教育辅导、多模态交互等场景 |
字节跳动 | 豆包通用模型pro | 8000亿参数,基于DIT架构,在图像和语音处理方面性能突出,其视频生成能力可帮助用户提供专业级视频内容 |
阿里巴巴 | Qwen2.5-Turbo | 上下文处理的长度极限获得突破,推理速度显著提升,适用于文本理解、代码处理等场景,兼具高效性与低成本优势 |
百度 | 文心大模型 4.0Turbo | 训练速度相比上代产品提升数倍至数十倍,生成内容更具条理性,输入输出价格下降70%,适用于智能客服、智能助手、内容创作、数据分析等场景 |
深度求索 | DeepSeek-V3 | 参数规模6710亿,采用了混合专家架构(Mixture-of-Experts,MoE),这种架构使得模型在有限硬件资源下仍能实现高性能 |
科大讯飞 | 讯飞星火 4.0Turbo | 突出的数学能力和代码能力,新增多模态视觉交互及超拟人虚拟人交互功能,适用于智能写作、多模态交互、医疗、教育、司法和政务服务等场景 |
2024年中国AI大模型产业图谱
数据智能 具身智能 知识助手 客服 创意内容生成 营销 办公 应用 产业图谱 工具 芯片 基础设施 通用模型 智算中心 服务器 垂直模型 数据 商业化模式 AI大模型商业化落地
应用场景及案例
TOP5大模型应用行业:互联网、金融、医疗、教育、政务
国产大模型已大幅降价,为广泛商业化应用奠定基础
中国AI大模型产业图谱
AI大模型商业化落地:55%为定制化模式、40%-45%为API及订阅模式
五种部署方式:直接调用、能力嵌入、扩展应用、定制模型、全栈构建
2024年AI大模型应用市场规模约157亿元,2022-2027年复合增长率达148%
未来3年,中国AI大模型产业将逐步进入需求侧驱动阶段
AI大模型在互联网、政务、金融等行业应用场景日益丰富
金融行业痛点及解决方案
医疗健康行业痛点及解决方案
教育行业客服场景痛点及解决方案
政务领域市场监督管理场景痛点及解决方案
零售消费行业痛点及解决方案
制造行业知识管理场景痛点及解决方案
发展趋势及挑战
- AI大模型四个主要技术方向
- 融合应用软件、智能助手和AIAgent是AI大模型市场应用的三个主要方向
- 缺乏高质量数据集是大模型商业落地面临的关键挑战