DeepSeek继续刷屏 激发AI产业链创新浪潮
DeepSeek继续刷屏 激发AI产业链创新浪潮
DeepSeek大模型自推出以来持续引发关注。春节期间,多家国内外科技公司相继宣布上线DeepSeek大模型。本文将探讨DeepSeek的技术优势、商业价值及其对AI产业链的潜在影响。
整个春节假期,横空出世的DeepSeek继续刷屏。华为云、腾讯云、360数字安全、云轴科技等多个平台先后宣布上线DeepSeek大模型。海外方面,亚马逊AWS、微软Azure、英伟达等全球多家科技厂商也陆续宣布接入DeepSeek模型。
那么,DeepSeek能接住这“泼天的富贵”吗?
根据国内AI产品榜统计,DeepSeek应用上线20天,日活就突破了2000万。与此同时,DeepSeek应用上线5天日活就已超过ChatGPT上线同期日活,成为全球增速最快的AI应用。
不过,意外爆火的DeepSeek在面对源源不断的新用户方面,显得有些力不从心。春节期间,据网友反馈,DeepSeek应用屡屡陷入服务崩溃的状态。业内人士分析称,既要应对近期涌入的大批用户,又要继续提升模型性能,DeepSeek亟需扩充算力基础设施,以满足更多用户的访问需求。
为努力接住这份来之不易的机遇,DeepSeek在招聘网站上放出了一系列职位,涵盖客户端研发工程师、深度学习研发工程师、全栈开发工程师、自然语言处理算法、深度学习研究员等多种岗位。其中,“深度学习研究员”岗位月薪水平为8-11万元,年薪可达百万。
公开资料显示,DeepSeek成立于2023年7月,目前员工数量大约为150人左右。
受DeepSeek热潮影响,2月5日,在A股蛇年首个交易日,DeepSeek相关概念股全线上涨,不少个股涨停。此外,云计算、AIGC概念大幅高开。同时,DeepSeek也轰动全球资本市场,并对美股产生了一定冲击。特别是当地时间1月27日,英伟达大跌17.0%。证券分析指出,此次DeepSeek凭借低成本、高性能优势引发市场波动,或推动投资者重新评估中国科技企业在AI赛道的技术潜力,科技股有望迎来价值重估行情。
DeepSeek的“朋友圈”可谓持续扩大。那么,它为何能够持续爆火?
首先,DeepSeek在人工智能模型领域取得了显著的技术突破,在多项测试中表现优于OpenAI的ChatGPT。在仅有极少标注数据的情况下,极大提升了模型推理能力。
更令人惊叹的是DeepSeek极低的成本。公开信息显示,DeepSeek R1的预训练费用低于600万美元,不到OpenAI同等模型训练成本的十分之一。同时,DeepSeek还公布了API的定价,收费标准大约是OpenAI的三十分之一,因此,不少人戏称DeepSeek是AI界的“拼多多”。
此外,DeepSeek的开源策略也和OpenAI这样的国外大模型巨头的闭源路径形成鲜明对比,降低了AI应用门槛。短短几天,国内外主要的云厂商和芯片厂商接连宣布接入DeepSeek-R1模型。例如,腾讯云表示,DeepSeek-R1大模型可一键部署至腾讯云HAI上,开发者仅需3分钟就能接入调用。火山引擎则宣布,将支持V3、R1等不同尺寸的DeepSeek开源模型,可以通过在火山引擎机器学习平台veMLP中部署和在火山方舟中调用模型两种方式使用模型。
不过,DeepSeek也面临诸多挑战,其线上服务近期受到大规模恶意攻击。如何保证安全、平稳、可持续地运营,也将是DeepSeek未来的重要挑战。
在DeepSeek发布较低成本的开源AI模型后,被认为是其竞争对手之一的OpenAI近日表示,公司没有计划起诉DeepSeek。OpenAI首席执行官奥尔特曼称,“DeepSeek是一个令人印象深刻的模型,但我们相信我们会继续开拓前沿并推出出色的产品,所以很高兴能有另一个竞争对手。”此前,OpenAI在1月29日表示,有证据表明DeepSeek使用OpenAI专有模型来训练自己的模型,并暗示这可能违反了OpenAI服务条款,但没有进一步提出证据。
值得注意的是,当地时间2月3日,中国常驻联合国代表傅聪在被问及DeepSeek发布的模型及中美人工智能合作问题时表示,“从华为到TikTok,再到DeepSeek,美国还想禁多少?”“永远不要低估中国科研人员的聪明才智。DeepSeek引发全球轰动和一些人的焦虑恐慌,说明技术遏制和技术限制无法奏效,这是全世界、特别是美国需要学习的一课。”傅聪指出,“只有共同合作发展,才能弥合数字和智能鸿沟。”
低成本高性能,DeepSeek有望激发一波创新浪潮。这款技术“新星”对中国科技产业链的升级会带来哪些推动作用?对此,中国政法大学副教授朱巍表示,DeepSeek成本低且模型高效,颠覆了业界对AI的传统认知。从硬件来说,以前人工智能的发展都需要大量的芯片,包括电力在内,资源消耗极大,这是AI在美国方面形成的一种思维模式,也是实践上的一种商业惯例。但是,现在DeepSeek出来之后,大家认识到它使用的芯片,包括它使用的电力,相比此前的AI应用成本极低。此外,逻辑颠覆者DeepSeek的威力在于,它证明了AI模型不需要依靠堆积的算力就能取得卓越的性能。与传统的指令型AI相比,DeepSeek不再需要用户依赖复杂的提示词模板,而是通过理解具体场景和需求,提供更为自然和智能的对话体验,这种推理型AI在未来产业发展中具有巨大的想象空间。
朱巍指出,随着DeepSeek模型的广泛应用,未来,像云计算、芯片生产等产业可能会崛起;像一些生产型的企业以前可能都需要依靠某些大的平台,如今也可能极大降低了训练和推理成本。在开放创新的开源环境里,各个平台、各个企业包括实体企业都可以享受这波红利,去发展、去摸索。互联网产业与传统企业不同的是,它很难形成长时间的垄断,任何一个小公司,只要有科技创新能力,一旦爆发都是指数型的、颠覆型的。通过DeepSeek的发展,可以预见未来在AI领域有望涌现出更多的普适技术。