自动驾驶简史:新技术来到人间的爬坡过坎
自动驾驶简史:新技术来到人间的爬坡过坎
自动驾驶技术正以前所未有的速度改变着我们的出行方式。从16世纪达·芬奇的奇思妙想,到今天遍布街头的无人驾驶出租车,这项技术经历了数百年的发展。本文将带你回顾自动驾驶技术的发展历程,探讨其未来发展方向。
自动驾驶只是成本高昂的玩具?
16世纪到1960年:在迷雾中摸索的萌芽期
广义的驾驶行为,是将人或者物,从A点运送到B点。人类在很早以前,就开始设想如何在无需人力的情况下做到这一点。为此所做的努力,最早可以追溯到汽车诞生很久之前的16世纪。
当时,达·芬奇在创作《蒙娜丽莎》的闲暇之余,设计了一辆能够自动行走的小型三轮推车。这辆推车由两个对称的弹簧驱动,还配备了可以预先设置行驶路径和转弯角度的控制机制,可谓“麻雀虽小,五脏俱全”。有人按照达·芬奇的设计图纸,重建出了下面这辆自动驾驶小车,在法国安布瓦兹的克洛斯·卢塞城堡展出。
当然,我们今天所讨论的“自动驾驶汽车”,是在 1886 年第一辆汽车诞生之后才开始出现的。1925 年 7 月,Houdina Radio Control 公司首次在纽约街道上,展示了一辆由无线电远程控制的 1926 年产钱德勒牌轿车。如下图所示,这辆车的顶部安装了天线,由紧随其后的另一辆汽车中的人进行远程操作。
不过,可惜的是,它很快就因为频繁车祸而中断了测试。显然,这种“自动驾驶”,更类似于遥控玩具,表明了人们对于自动驾驶的早期认知,即“没有人坐在驾驶座上”。
在 1939 年的世界博览会上,通用汽车公司推出了第一款真正意义上的自动驾驶汽车模型。它通过安装在前部的感性线圈,检测道路中预置电线中的电流,借由电磁场的作用实现方向盘的控制和行进,原理如下图所示。这种设计相当先进,甚至超越了今天的电动汽车(借助电磁场驱动而不是电池),但是这需要在公路上广泛铺设大功率感应电缆,成本过高,而且还需要人为预先设计好车的行走路线。所以,虽然在40-60年代,出现了多款基于同样原理的原型车,但是难以真正投入实用。
小结
经过了前期的新鲜感之后,在60年代末期,对于“自动驾驶”技术的可行性和必要性,开始引起了广泛的争议。如上所述,按照当时的技术路线,要想在城市道路上实现自动驾驶,需要宽泛地铺设地下感应电缆,虽然这也是一种早期的“车路协同”,或者叫做“车随路动”,但是这种协同成本极高,效率很低,因此很难走出试验场地。
更多消费者和媒体开始对这种技术嗤之以鼻,认为自动驾驶,只是一种代价高昂、不切实际的“玩具”。
可以跑,但是安全吗?
1961-2000年:人工智能开始登上历史舞台
在“车随路动”走入成本高昂的死胡同之后,“单车智能”的概念开始随着人工智能的发展逐渐登上历史舞台。
1956年,“人工智能”(Artificial Intelligence)的概念首次在达特茅斯会议上被提出,这标志着人类对机器智能的探索迈出了第一步(关于人工智能技术的发展历史,将另文专述)。人工智能学科的发展,逐渐形成了三个方向:
- 符号主义:以数理逻辑和逻辑推理为主,基于既定规则来做出判断,典型技术为“专家系统”,代表为纽厄尔、西蒙和尼尔逊等计算机科学家;
- 联结主义:用神经网络和连接机制,模仿人脑机制进行学习、训练和推理,典型技术为机器学习、深度学习和今天的大模型,代表为早期的麦克洛奇、皮茨、鲁梅尔哈特和后来的辛顿、杨立坤等;
- 行为主义:结合控制论和感知-动作型控制系统,专注于有机体行为的研究,典型技术为机器人和自动驾驶汽车。
作为行为主义的主要研究方向,人工智能和汽车行业开始融合。不过,首先的成果,不出意料的是来自于当时大国竞争的主要赛道——航天事业。
1961年,斯坦福大学的詹姆斯·亚当斯研制出了“斯坦福推车”(Stanford Cart),如下图所示,它装有一个摄像头,并通过编程,可以自动探测并跟踪地面上的特定线路行驶。这不仅是自动驾驶汽车首次使用摄像头,也是今天自动驾驶汽车视觉识别系统的起点。这辆车的设计目的是在月球上行驶,但是后续因为经费原因没有实际投入使用。
在此基础上,1969年,斯坦福大学人工智能研究中心的尼尔斯·尼尔森教授研发了一款名为“Shakey”的车型机器人,这是世界上第一台可以自主移动的机器人,它被赋予了有限的自主观察和环境建模能力,控制它的计算机非常巨大,甚至需要填满整个房间。制造Shakey的目的是用以证明机器可以模拟生物的运动、感知和障碍规避。
在这之后,自动驾驶车辆的研究开始从80年代开始加速,结合视觉系统的车辆运行速度也开始逐步加快,开始逐步引起学术界和社会各界的认真思考:
一旦这种汽车上路,在复杂的交通环境下,是否足够安全?
20世纪80年代,美国国防部开始通过国防高级研究计划局(DARPA),支持自动驾驶汽车的研究工作。
1995年,卡内基梅隆大学的NavLab 5从匹兹堡一路驰骋到加州的圣地亚哥,完成了2850英里的旅程,其中自动驾驶超过98%的时间,如下图所示。
小结
在这个阶段,人工智能开始替代传统的远程控制或者电磁引导等方式,成为自动驾驶的主流技术。但是,这个阶段所谓的“自动驾驶”,更多的是“实时数据采集——既定规则分析——做出逻辑决策”的过程,还难以对千变万化的路况做到实时的自我决策和处理。同时由于数据和算力的限制,也无法实现更高的速度。
正如在低谷中逐步走出的人工智能技术一样,自动驾驶也在这个时期积累了足够的势能,为在新世纪的爆发性发展做好了充分的准备。
2001-2023年:百花齐放,路线纷争
到21世纪初,随着人工智能技术开始逐步进入“快车道”,以深度学习为代表的神经网络在算力和数据的推动下,体现出一马当先的绝对优势,自动驾驶汽车也开始日趋成熟。
2004年起,美国国防高级研究计划局(DARPA)在2004年、2005年和2007年举办了三届“DARPA无人驾驶机器人挑战赛”(DARPA Grand Challenge),以大额奖金鼓励自动驾驶和无人车的研发。第一届比赛要求车辆在150英里的沙漠道路上自动导航,结果没有一辆车抵达终点。但是在2007年的第三届中,以60英里长的城市环境作为赛道,有四辆车完赛。
相对于在沙漠和山路中进行的前两届比赛,第三届要求参赛车辆要能遵守交通法规,还能检测和避让其他车辆。这意味着车辆必须根据其他车辆的行为实时做出“智能”决策。这标志着基于人工智能的自动驾驶车辆开始具备了真正的商用潜力。
这些研究成果很快就被商业公司所吸收和应用,谷歌公司于2016年将无人车部门独立出来,设立了Waymo公司。它成为了世界上首个获得美国机动车管理局合法车牌,可以在公共道路上实现L4级别无人驾驶(即无需安全员)的商业化企业。当然,大家更加耳熟能详的是特斯拉公司,马斯克在今年4月宣布,搭载其无人驾驶系统(FSD)的车辆总行驶里程已经超过10亿英里。
与此同时,与自动驾驶相关的标准和法律也在逐步完善。SAE(美国汽车技术协会)在2016年更新了对于自动驾驶等级的界定,目前已经被广泛应用于世界各国的行业监管之中:
目前,国内共有十家车企获得了L3级自动驾驶测试牌照,除了奔驰、宝马,还有比亚迪、智己、深蓝、阿维塔、极狐、问界、极越和广汽埃安。还有部分企业开始在限定空间内开展了L4级别的测试,最近引起广泛关注的“萝卜快跑”就是其中的例子。
在这个阶段,围绕了自动驾驶技术的发展路线,也出现了一些方向上的争议。
模块化还是端到端?
传统的自动驾驶方案,遵循的是一种所谓的“模块化”方式,即把整个驾驶任务进行切分,定义并划分出多个子模块,分别负责不同的任务,这些子模块通常包括 地图/定位、预测、决策、规划和控制。最后,通过系统集成来完成整个智能驾驶任务。
这样的好处,是各个子模块可以进行独立的开发和测试,等子模块开发测试完成之后,再进行系统集成,进行系统级的测试和验证。
这种方式虽然采用了神经网络(在决策和规划部分),但是仍然很大程度上依赖于预先定制的规则,即根据高清地图、交通规则,基于手动编码来引导车辆的行驶路线。
而特斯拉主导的“端到端”模式,则把整个智驾系统视为一个大的模块,不再进行模块和任务的划分。端到端系统接收到传感器的输入数据后,直接输出驾驶决策,包括驾驶动作和运动轨迹。
这种方式完全基于数据驱动,整个系统可以作为一个大模型,进行梯度下降的训练,通过梯度反向传播,可以在模型训练期间对模型从输入到输出之间的全部环节进行参数更新优化。整个系统作为一个大模块进行开发和测试,大幅度简化了开发和测试流程。
换句话说,前者依然“基于规则”,需要依赖于人为的规则设定,而后者则完全把汽车视为一位“老司机”,“基于学习”,根据大量的训练数据来决定自己的驾驶行为。
从目前的实践来看,“端到端”模式以其对于复杂路况的灵活适应性,开始逐渐成为业界主流,但是这后面意味着大量的训练数据和算力。这使得国内外的车企都大幅度加强了对于人工智能技术尤其是大模型的研发投入。
在2024年第一季度财报会议上,特斯拉对外透露,其已将训练AI集群扩展到35000块H100 GPU。按照计划,到2024年底,特斯拉将会在超算集群上再投入15亿美元,目标是将其超算中心的总算力提升到100EFLOPS。
“车路协同”,还是单车智能?
如前所述,在自动驾驶技术发展的早期,人们就开始考虑通过路的引导来左右车辆的行驶路线。今天,这种思路演变成了“车路协同”(或者“车路云”协同)的路线,即通过车辆与环境的连接和协同,实现信息的实时互动。
这项技术过去叫做“车联网”,现在叫做“智能网联”,核心是两件事情:智能网联 = 智能 + 网联
又称V2X,即 Vehicle to Everything,车联万物。车联网(V2X)的概念源于物联网,即车辆物联网,是以行驶中的车辆为信息感知对象,借助新一代信息通信技术,实现车(V)与X(车、 人、路、服务平台)之间的网络连接,总体的架构如下图所示,其中特别值得注意的是路边设备(RSU),起到了连接车辆和道路的边缘作用。
相比之下,特斯拉所主导的路线被称为“单车智能”。
“车路协同”的优势,在于通过道路来弥补车辆感知能力和自身智能、算力的不足,即通过“智慧的路”,让“聪明的车”,“看得远、看得广、 看得清”。我国目前在此领域处于国际领先地位,并主导了C-V2X相关标准的制定和推广。
小结
随着人工智能技术的发展,自动驾驶开始逐步走向大众,市场化的激烈竞争也给我们带来了各种不同的技术路线和方向,但是核心,依然是“安全”和“高效”。因为篇幅有限(本文旨在提供一个“小传”),还有其他一些技术路线上的争议,例如纯视觉和激光雷达之争,本文不再赘述。
2024年:自动驾驶的真正商用化是否会对就业带来冲击?
进入2024年之后,以“萝卜快跑”为代表的自动驾驶车辆开始逐渐进入商业化的轨道。
根据现在的报道,自动驾驶车辆的费用几乎只有普通出租车的 1/5,当然有前期促销的因素在里面,但是核心还是提高了效率,减少了对于人力的依赖性。体验接近甚至更好,因为避免了过程中不必要的互动。
目前看来,突出的问题是速度慢一些,因为无人驾驶车从安全规则角度会更合规,但是只要技术越来越成熟,越来越多的自动驾驶车辆上路,而且事故率保持在低于人类司机的水平(不可能万无一失,但是比人低就是进步),大部分消费者可能都会更加倾向于无人驾驶车。
现在,人们关于自动驾驶的讨论,开始越来越多地从技术层面,延伸到了社会影响层面:自动驾驶的真正商业化,是否会对就业市场带来冲击?
但是我们也应该看到,自动驾驶可以带来家和办公室之外的“第三空间”,因为车的类型会变化(取消驾驶座和方向盘),未来会出现很多的网约车咖啡馆、网约车餐厅、网约车便利店,让人们在出行过程中享受各种服务;自动驾驶也会提升对于车辆数量、质量和后台管理系统的要求,需要大量的运维人员。
我们有理由相信,正如人类在过去多次的技术变革中所获得的经验,新的技术革新,很可能带来的更多是机遇。当然,需要我们在应用、发展新技术的过程中,循序渐进,建好“护栏”,防范过程中可能带来的颠簸和冲击。