揭秘AI的局限性:我们距离真正的人工智能还有多远?
揭秘AI的局限性:我们距离真正的人工智能还有多远?
近年来,人工智能(AI)技术的快速发展一直备受关注。大模型作为AI技术的重要进展,在过去的一年半里成为热门话题。然而,虽然大模型取得了显著的成就,但AI仍在不断“钻木取火”,致力于突破更多技术难题。
大模型的兴起是AI领域的重要里程碑。通过使用更大规模的数据集和更强大的计算资源,大模型在诸多领域实现了突破性的进展。它们在自然语言处理、计算机视觉、语音识别等任务中展现出了强大的能力。大型预训练模型如GPT-3和CLIP成为了AI研究和应用的焦点,吸引了众多科技公司和研究机构的关注。
然而,大模型的火热并不意味着AI技术已经达到了顶峰。相反,这一现象更像是AI发展的一个里程碑,标志着AI仍在不断追求突破。尽管大模型在某些任务上表现出色,但它们面临着许多挑战和限制。
AI不是万能药
现在很多人都觉得生成式 AI 是个万能药,自己的产品加上AI就很好卖了,但事实上并不是这样。
最近一些中国做消费电子的企业加了 AI 后,都觉得消费电子产品变得很智能了,但实际体验和期望的差距还是很远。包括美国也是一样的,虽然AIGC看上去很惊艳,但真正落地上并不容易。
为什么AIGC很难落地?最主要就两个问题:一是幻觉问题;二是结果不可控。
一旦AI有幻觉就会出错,而且你不知道什么时候会出错,每次结果还都不一样,所以结果不可控。
随着大家对幻觉的研究越来越多,发现造成幻觉的核心问题是脏数据。很多训练大模型的数据都来自于公开的互联网,里面很多数据并不正确。
上个月谷歌就闹出一个笑话:
你精心准备好所有材料,把披萨放进烤箱,期待着美味的晚餐。但当你迫不及待地准备咬上一口时,却发现奶酪掉了下来。你感到沮丧,于是上网求助谷歌。
谷歌回答道:“加点胶水,混合大约1/8杯的胶水和酱汁。无毒胶水会更有效。”
这个回答其实是网友在十多年前编的一个笑话,但大模型觉得这是正确的。
杀手级AI爆款应用并没有出现
在深入讨论AI之前,可以略回顾一下互联网和移动互联网给人类带来的改变。
互联网和计算机一起,给人类带来了第三次工业革命即信息革命。互联网诞生至今50多年,几乎完成了全世界普及,给全球绝大部分个人、企业和政府机关的生活、生产和运行,带来了几何级别的便利。以微软为代表的大量专业软件系统供应商崛起,谷歌、亚马逊等搜索类、电商类企业崛起。
将移动通信和互联网二者结合起来的移动互联网,在2010年前后与智能手机结合,迎来爆发。在不到10年的时间内,移动互联网对全球大部分个人完成覆盖,大量企业和政府端为完成To C服务,进行了移动互联网变革。在中国,大部分60岁以上老人近年也成为智能手机用户。
全球范围内,崛起于互联网时期的科技企业,几乎全部利用移互技术进行升级,新出现了Facebook、YouTube、微信、抖音、淘宝等10亿级用户移动应用。移动互联网还催生了移动支付、共享经济、数字政务等,初步带来便捷的数字生活、生产方式。
AI技术的提出时间在1956年,甚至比互联网诞生的1969年都要早13年。长期以来,AI都是一门被认为重要但难得其法去使用的技术。
2013年至2017年,第一轮AI技术热潮——计算机视觉热潮掀起。在这轮热潮中,2016年,谷歌的AlphaGo成为第一个战胜围棋世界冠军的人工智能机器人,我国的“AI四小龙”——依图、商汤、云从、旷视诞生。但该轮热潮最终未能带来AI的爆发,大量资本投资失利,大量创业者艰难维持。
2022年11月30日,ChatGPT横空出世,基于Transformer架构的AI大模型自此被捧为AI技术的新未来。
人类通过20余年的继承式学习,才能具有一项或多项专有技能,胜任生活中各种角色,而人工智能则通过数月甚至更短时间的数据训练,拥有比人高得多的技能甚至是智能。
ChatGPT引发的震憾则是全方位的,机器通过类似人的神经网络一样的学习方式,将所见、所听、所看结合既有数据、记忆,在瞬间进行成千上万的并行计算,再以文本、图表、语音、视频等方式表达出来。似乎,人之所以为人的知、情、意,人工智能除了情、意之外,在认知的数量方面超过和辗压人类,质量方面正无限接近人,甚至是超过多数人。
至今,全球大多数科技企业均涉足AI大模型发展和训练,作为科技领先国家的美国和中国,更是各自诞生数百个大模型。这被形象地称为“百模大战”,甚至“千模大战”。
大量的资本冲向AI领域,席卷全球的AI热潮再次涌起。一年半的喧闹之后,人们暮然回首,与投资端的喧闹相比,市场对AI大模型的热情,还远远不及互联网、移动互联网。
除了训练AI大模型需要巨量GPU芯片,因此将芯片企业英伟达一度送上全美市值第一宝座外,这轮热潮下还没有诞生新的科技巨头。全球最好的AI大模型ChatGPT的日活至今只有数千万,国内大模型应用虽然均呈现向好态势,但C端日活和B端尝鲜者数量均不理想。
至今,全行业都在追问:杀手级、现象级或者说爆款AI应用,何时会出现?简单的问题,直击灵魂。业内回答,乐观者说1年内,中观者说2至3年,悲观者说“无法预计”。
6月13日,北京智源人工智能研究院院长王仲远接受媒体群访时说,回顾移动互联网时代或更早期的技术革命,每次新技术的出现都需要一定的周期,包括技术能力的提升、成本的降低以及硬件的支持。当这些条件具备时,能够解决真实用户需求的C端爆款应用才会出现。“因此,对于C端爆款应用,我们还需保持一定的耐心。未来,我们可能会先从B端看到非常好用的工具,然后C端应用会逐步出现。”
AI爆发或需更多等待
业内的一个共识是,从各方面看,AI技术可能已经接近首次爆发。但无法排除的可能是,AI也有可能需要一个更长的周期才能迎来爆发。
无论如何,有几个现实是AI大模型当前发展不容回避的。
首先,AI大模型十分烧芯片、烧数据,甚至烧电力。每一个大模型动辄需要上万块英伟达GPU,每块价值1万至1.5万美元以上。每次训练还需要规模达百亿、千亿级TOKEN的数据物料,无论英文数据物料还是中文数据物料,现有物料都难以接续。
很难想象,大模型的耗电量会成为能源专家的最新关注点。训练Open AI的GPT-3模型耗电量相当于120个美国家庭一年的用电量。在这背后,大模型的CPU(中央处理器)和GPU(图形处理器)等硬件在执行复杂计算时会消耗大量电力,同时大模型所需巨大内存带来的读写操作,同样需要电力。“这样集中、持续、稳定供应电力的地方并不好找,在这方面,中国的电力基础设施将比美国更容易支持本国的AI大模型发展。”
相比动辄数十亿级别的投入,AI大模型带来的收入还十分有限,甚至暂时可以忽略。
其次,AI大模型还有“硬伤”,即不够靠谱的问题仍然没有解决。虽然大部分时候,AI大模型的推理和判断结果令人欣喜,但时而“一本正经地胡说八道”还是会出现。目前任何大模型都不能幸免。在生活中,AI大模型的错误我们可以容忍,可以一笑置之,但这却关乎大模型商用的前途,例如金融系统和制造业的容错空间就极小。
再次,AI大模型目前的使用门槛还比较高。除了核心功能价格不够普惠外,内行与外行的使用效果差别明显。大多数模型的使用需要进行专门培训。而一个改变人类的基础技术,最终一定是像互联网一样低门槛的。
“AI技术已发展了30年,现在说它还处于钻木取火阶段可能有些夸张,但它仍然处于技术早期这不可否认。”一位大厂的AI专家表示。
科学技术发展带有不可确定性,没有人是先知。或许,AI爆发只差临门一脚。又或许,AI大模型并不是AI爆发的最终解。那么,我们可能需要继续等待。