问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

大模型商用格局雏形初现:Tokens用量决高下,火山引擎问鼎2024

创作时间:
作者:
@小白创作中心

大模型商用格局雏形初现:Tokens用量决高下,火山引擎问鼎2024

引用
腾讯
1.
https://new.qq.com/rain/a/20250121A07HU000

2024年下半年,国内大模型商用落地迎来爆发式增长,日均Tokens消耗量从1000亿级规模激增至10000亿规模,月复合增长率高达45%。其中,火山引擎凭借在AI原生应用领域的领先优势,成为市场份额占比超50%的行业领跑者。

Tokens使用量:衡量大模型商用落地的关键指标

量子位结合市场数据观察发现,2024年下半年国内大模型商用落地日均Tokens消耗量翻了近10倍,从1000亿级规模跃升至10000亿规模,仅用时6个月,月复合增长率高达45%。其中,10-12月的增长速度进一步加快。


初期市场变化迅速,整体估算会偏小。各厂商数据不包含各家自研模型服务商的应用消耗,比如火山引擎——豆包APP

值得注意的是,火山引擎的表现尤为突出。5月份,其日均Tokens消耗量还停留在百亿级水平,仅占全行业1/5;但到了8月初,已突破千亿Tokens大关,并在此后保持快速增长态势,至12月日均Tokens市场份额占比已超50%,超过其他所有竞争对手的总和。

这一增长速度意味着平均每秒并发Token数约为750万。按照一个生成式AI模型单次响应平均需要处理1000个Tokens计算,每秒就要处理7500个用户请求。

为什么Tokens消耗量成为关键指标?

在大模型中,Token是模型理解和生成的最小意义单位,是自然语言文本转换为可理解格式的关键步骤。随着技术发展,Token的概念已扩展到多模态领域,文字、图片、视频、语音等不同模态信息都可以通过Token被标准化为统一的符号系统。

在行业落地层面,Token的定义已被广泛认可。它不仅能衡量模型的预训练语料规模、上下文长度、推理长度等技术指标,还是大模型API的定价单位。目前,云厂商普遍采用"千输入Tokens"和"千输出Tokens"的定价模式,经过一年的价格战,大模型的价格已降至1元可购买百万Tokens的水平。

Tokens消耗量暴增背后的驱动力

2024年下半年,大模型Tokens消耗量呈现爆发式增长,这背后有多重因素驱动:

  • 技术进步拓宽应用场景:RAG(检索增强生成)、智能体、多模态等技术的兴起,进一步拓宽了大模型的应用场景。RAG解决了大模型在垂直领域和私域问题上的理解难题;Agent开启了新一代智能交互范式;多模态AI则利用人类80%的信息来自视觉的特点,极大拓展了大模型的能力边界。

  • 标杆案例带来示范效应:随着一些标杆案例的出现,大模型的商业价值已得到充分验证。IDC调研显示,大模型落地周期多在6-18个月之间,相比其他IT解决方案更快上线。预计未来一年,大模型可帮助企业降低18%成本、增加2%收入、缩短24%流程时间,提高17%员工工作效率、提高7%资产利用率、提高19%产品创新水平。

未来展望:成本持续降低,规模化增长可期

展望未来,大模型行业呈现出四大发展趋势:

  • Agent加速下AI应用开发门槛持续降低,模型将进一步在场景中深度应用;
  • 成本因素影响,大小模型协同将成为主流趋势;
  • 模型推理工具链生态的不断完善,将提高MaaS的模型部署效率;
  • "公有云+专有云"的MaaS部署模式将为企业用户提供安全与成本兼顾的解决方案。

业内专家预测,2027年豆包每天Token消耗量预计超过100万亿,是当前水平的100倍以上。这表明,当前Tokens消耗量的暴增可能只是大模型应用落地爆发的开始,真正的规模化增长远未到来。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号