2024 中国开源年度报告:AI 开源引领技术民主化,中国开源生态迎来新机遇
2024 中国开源年度报告:AI 开源引领技术民主化,中国开源生态迎来新机遇
「中国开源年度报告」由开源社从 2015 年发起,是国内首个结合多个开源社区、高校、媒体、风投、企业与个人,以纯志愿、非营利的理念和开源社区协作的模式,携手共创完成的开源研究报告。后来由于一些因素暂停,在 2018 年重启了这个项目一直至今,每一年参与协作的伙伴社区/单位和志愿者以及点评的开源大咖越来越多,还有更多的忠实读者表示每年年初都期盼能看到中立、客观、多元而优质的「中国开源年度报告」。我们希望今年呈现给所有关心、热爱开源的读者们更优质的内容,也欢迎大家给予这份报告建议、意见和反馈,让我们能精益求精,乘“巳”而上!
报告背景
自 2015 年开源社首次发布「中国开源生态系统报告」至今,「中国开源年度报告」已迈入第 10 个年头。除了 2017 年因故断更外,开源社每年都通过开放式协作的方式,邀请活跃在学界、业界和社区中的伙伴们一起,在下一年度的展卷之际,为大家奉上上一年度开源发展趋势的报告与洞察,共同描绘中国开源生态的全景图。
作为中国唯一由完全中立的非营利性开源组织发起的开源年度报告,它的意义早已超越了一份单纯的数据分析或趋势展望。报告记录了开源技术、文化与社区在中国的生根发芽与蓬勃发展,见证了开源在推动技术创新、产业升级和社会协作中的重要作用。同时,借助于社区力量陆续发布的英文 & 日文版本,也为想要参与和了解中国开源的全球开源力量打开了一扇窗,搭建起了连接中国与全球社区的桥梁。
报告内容
2024 中国开源年度报告主要由五部分组成,分别是问卷篇、数据篇、商业化篇、开源人工智能篇、大事记篇。
问卷篇
问卷篇关注开源社区中各个层级的参与情况,旨在通过多维度问题,深入了解受访者的个人信息、工作状况、开源社区参与情况以及开发者的技术背景等。本问卷根据开源社区的参与深度,设定了多个角色层级,包括使用者、参与者、贡献者、维护者和生态运营等,旨在全面反映开源社区内不同层级用户的参与情况与影响力。
数据篇
2024 中国开源年度报告以全面、深入的数据洞察为核心,通过九大篇章全方位展现中国开源生态的蓬勃发展。第一部分宏观洞察篇,从基础事件、活跃仓库、活跃用户和编程语言等维度,揭示中国在全球开源生态中的独特地位与影响力。第二部分 OpenRank 排行榜篇,通过全球与中国各领域的开源项目、企业、基金会、开发者及协作机器人排名,为业界提供权威、系统的 OpenRank 指标信息服务,成为衡量开源贡献的重要标尺。第三、四部分企业洞察篇与基金会洞察篇,通过动态演变图和趋势分析,深度解析全球与中国企业、基金会在开源领域的战略布局与演化路径。第五部分技术领域洞察篇,聚焦各领域 Top10 榜单与项目变化,精准捕捉前沿技术的发展方向与创新趋势。第六部分开源项目洞察篇,深入探讨项目类型、领域与主题的多样性,展现开源生态的活力与创新潜力。第七部分开发者洞察篇,通过开发者类型、工作时间分布、地区分布及机器人使用情况的分析,描绘开发者群体的多元化特征与工作模式。第八部分商业开源洞察篇,聚焦中国及全球商业开源企业与项目的发展现状,剖析其成长路径与成功经验。第九部分高校开源洞察篇,结合开源之夏 OSPP 活动与 OpenRank 社区算法,展现高校学生参与开源活动的活跃度与贡献度,揭示开源人才培养的新趋势。整体而言,数据篇以丰富的数据维度与深度的分析视角,勾勒出 2024 年中国开源生态的全景图,为行业提供宝贵的洞察与参考。
商业化篇
开源软件的商业化是指在开源软件的基础上,通过各种策略和模式,将其技术、服务等转化为可盈利的业务,从而实现经济价值和可持续发展。开源软件的商业化能力是软件及其生态可持续发展的重要动力,也是开源软件企业在发展过程中面临的最艰巨的挑战。
今年则以访谈的形式组织商业化篇的内容,内容访谈了四位专注于开源技术、基础软件、云服务的投融资专家,他们分别是徐至行(国方创新)、刘景媛(德联资本)、丁宁(INP)和刘超(Atypical Ventures)。在于他们的访谈中,总结和分析过去几年开源软件领域内的发展和对未来资本市场的展望。同时他们也坦诚地分享了个人职业发展中对于该领域的认识与理解,以及对于开源企业商业化与增长的经验与看法。
开源人工智能篇
2022 年底 ChapGPT 横空出世之后,2023 年堪称是人工智能发展最关键的一年,而在 2024 年,开源 AI 的井喷式爆发彻底改写了行业规则——从技术垄断到全民共创,从实验室创新到产业落地,一场由开源主导的 AI 范式革命已然到来。因此 2024 年中国开源年度报告的大事记篇决定将《开源人工智能篇》单列出来,以更为全面的方式,向读者呈现。
2024 年 7 月 27 日,Meta 首席执行官扎克伯格发表了【人工智能即将迎来开源的拐点】的重磅文章。他强调了开源 AI 发展对整个行业的巨大影响,表示随着 AI 技术的进步和社区合作的增强,开源将成为推动创新和普及 AI 的关键。文章里的几个要点,很好地总结了开源人工智能的现状与发展趋势:
- 开源 AI 的崛起:越来越多的公司和研究机构开始发布开源的 AI 模型和工具,这种趋势正改变着行业竞争格局。开源推动了技术民主化,使更多开发者和企业能够利用顶尖的 AI 技术。
- 商业与技术的平衡:企业通过开源 AI 吸引开发者生态系统,同时将闭源技术与开源技术相结合,构建独特的商业优势。这种双轨策略使企业既能从开源中获益,又能保持核心技术的竞争力。
- 社区与协作的重要性:开源 AI 成功的关键在于活跃的开发者社区和协作文化。这些社区为模型改进、问题修复以及新功能开发提供了强大支持,显著加速了 AI 技术的创新速度。
- 伦理与透明性:开源 AI 为 AI 技术的透明性和问责制提供了新的可能。开源代码使得模型的训练和决策过程更加清晰,帮助应对偏见和伦理问题。
- 未来的挑战:尽管开源 AI 充满潜力,但仍面临一系列挑战,包括版权保护、数据隐私、安全漏洞以及商业可持续性。行业需要找到应对这些问题的解决方案,才能充分释放开源 AI 的潜力。
正如扎克伯格所断言的 “开源是 AI 未来的方向”,2024 年,Llama、Mistral 等开源模型以惊人的速度逼近甚至超越闭源标杆,DeepSeek、通义千问、智谱等中国团队以 “开源彻底性” 和 “成本革命” 撼动全球格局,HuggingFace、GitHub 等平台汇聚数十万开发者,让协作与共享成为技术民主化的基石。开源,不仅是代码的开放,更是一种技术信仰的重构——它让创新从实验室走向街头巷尾,从巨头垄断转向全民共创。
但是,技术的狂飙突进也带来前所未有的挑战。性能趋同的背后,是基准测试的失效与数据污染的隐忧;开源模型的低成本与高可用性,掀起了全球 AI 价格战的腥风血雨;英伟达的芯片霸权与欧盟的严苛监管,折射出技术与权力的复杂纠葛;合成数据的滥用、深度伪造的泛滥,则让伦理与安全的警钟长鸣。我们不禁要问:当 AI 的能力逼近人类,我们是否做好了与之共存的准备?
为了优化读者体验,本章编者没有采用传统的新闻条列方式,而是综合了多份国内外报告及长文的内容,融合全球视野与本土洞察,从技术突破、商业激战、政策博弈到伦理反思,层层剖析这个时代的矛盾与希望。您将会看到:
- 开源如何打破技术垄断,让 Llama 3 与 GPT4o 在性能榜单上短兵相接;
- 轻量化与多模态为何成为 AI 落地的关键密码;
- 具身智能与 AI Agent 怎样重新定义人机协作的边界;
- 中国开源 AI 力量如何利用价格战与彻底开源“突出重围”。
站在 2025 年的门前,AI 技术正处于开源拐点,未来的行业领导者将是那些能够在开源与商业化之间找到最佳平衡的企业。通过拥抱开源,AI 技术有望更快地扩展应用场景,同时推动整个行业走向更开放和包容的未来。我们或许比任何时候都更需要清醒:开源 AI 的星辰大海,不应是少数巨头的修罗场,而应是所有人共建共享的智慧共同体。
愿这份报告成为一盏灯,点亮技术洪流中的理性与温度。
大事记篇
在编写今年的开源大事记的过程中,我们不断深切的感受到:开源 & AI,作为数字时代的创新引擎,正以前所未有的速度重塑全球技术格局。2024 年的开源大事记,既记录了中国开源力量的崛起,也聚焦国际开源生态的剧变——因为每一个全球性技术突破、每一次开源治理的范式转移,都与中国开源社区的未来息息相关。
由于章节重构的原因,我们今年的开源大事记,主要是梳理人工智能技术发展之外的大事,在 AI 之外,2024 年的开源世界也同样精彩,我们总结出以下特点:
- 开源技术突飞猛进:国产编程语言层出不穷、国产 AI 与大数据领域的进展令人惊喜、RISCV 芯片规模化落地,开源定义技术前沿。
- 安全风险触目惊心:XZ 后门潜伏三年、国家级供应链攻击频发,开源防线面临终极考验。
- 社区生态风波不断:Linux 内核驱逐俄籍贡献者、Redis 许可证变更引分叉,信任危机撕裂协作根基。
- 地缘博弈愈演愈烈:美国 AI 芯片出口管制、欧盟开源合规立法,技术主权争夺战白热化。
- 开源治理范式升级:中国最高法首判 GPL 效力、Redis 分叉 Valkey 崛起,规则重构决定生态未来。
- 开源教育百花齐放:百校开设开源课程、千万行代码实战育人,人才造血机制全面激活。
- 开源政策重塑格局:国家与各省市专项政策落地、全球合规框架角力,开源成数字经济战略必争之地。
这份报告不仅是记录,更试图揭示趋势:当 AI 开始编写代码、当地缘政治切割技术生态、当法律判决定义开源边界,我们正站在开源发展史的关键转折点。期待这份汇聚技术突破、安全警示、商业探索与政策思辨的《开源大事记》,能为中国开源参与者提供穿越变革的航标——因为明天的开源规则,将由今天的实践者共同书写!
编制团队
《2024 中国开源年度报告》的编制,一如既往,受到了众多开源界朋友、媒体和开源社志愿者的大力支持。在此向所有参与报告制作的人员表示诚挚的感谢!感谢你们为中国开源贡献出自己的一份力量。
感谢协作开源社区/单位
- 开源社
- OpenDigger/X-lab
- 飞致云
- KWDB
- Gitee
感谢合作媒体
- CSDN
- 思否
感谢编写团队
【召集人】:王伟
【卷首语】:江波
【问卷篇】:赵思嘉
【数据篇】:方蕴仪、游明东、赵思嘉、黄帆、赵生宇、彭佳恒、夏倍蓓、夏小雅、王婕、韩凡宇、娄泽华、王衍童、李鸿斌、史雪涛、毕枫林、黄温瑞、谢思怡、朱志炜、何德鑫
【商业化篇】:袁滚滚、徐至行、刘景媛、丁宁、刘超
【开源人工智能篇】:刘天栋、庄表伟、赵生宇
【大事记篇】:袁滚滚、INP、王峰、庄表伟、卫剑钒、梁尧、李明康
【报告汇总/编辑】:赵思嘉、刘天栋
【基础设施支持】:丁文昊
【设计/排版】:王军