无图智驾为何选择BEV/Occ而非SLAM?多位专家解读技术优劣
无图智驾为何选择BEV/Occ而非SLAM?多位专家解读技术优劣
无图智驾方案为何选择BEV/Occ而非SLAM?本文通过多位专家的讨论,深入解析了两种技术方案的优劣和适用场景,为自动驾驶技术爱好者提供了有价值的参考。
问题背景
随着无图/轻地图的智驾方案逐渐兴起,业界普遍转向使用BEV/Occ+Transformer的方案。这种方案相比于传统的SLAM方法实时建立局部语义地图,究竟有何优势?以SLAM为基础做局部导航的缺陷又在哪里?
风吹青年心的回答
作为SLAM算法方向的研究生,我认为需要澄清一些概念:
SLAM主要解决定位问题,而BEV/Occ+Transformer主要解决感知任务(局部语义地图),感知是以定位为前提的,只不过这个定位可以不是SLAM定位。
一般SLAM算法的使用方法分为两步:先建图,后定位。在自动驾驶场景中,由于道路环境经常变化,高精地图的维护成本较高,因此采用了重感知轻地图的方案。轻地图并不是无地图,自驾中全局的路径规划问题可以依靠百度地图等来进行,定位问题可以使用轮速计、IMU、卫星导航组合的方式来替代。
在自动驾驶中,还是使用了SLAM中帧间位姿估计的方法,只不过没有采用基于先验地图的SLAM定位方法。多传感器组合定位的方法虽然没有被叫做SLAM定位,但本质上是相似的。
室内机器人(如扫地机器人、人形机器人、仓运机器人)还是采用SLAM+局部语义地图的方法,因为室内机器人要求更高的精度,而且GPS等传感器在室内无法使用。
小方同学的回答
这个问题涉及几个关键概念:
"无图"智驾并不意味着完全无图,而是因为商业和监管原因不使用外部提供的高精地图。
自动驾驶感知都需要输出带语义的检测结果(OD),这与BEV或Transformer无关。
无图方案都会使用SLAM技术进行建图,SLAM技术是一个建图和定位的技术集合。不管有图无图,都会使用SLAM技术进行融合定位。
规划与SLAM没有直接关系。自动驾驶系统都有先验地图,不会像扫地机器人那样需要先探索一遍。
"以SLAM为基础做局部导航"相当于"以定位技术为基础做定位",这是一个同义反复的表述。
Joanna的回答
"无图"并不意味着没有高精地图,而是指不使用外部提供的高精地图,内部需要自建图。
SLAM建图可以作为无图智驾的一种方式,即记忆行车。业内有大疆、小鹏的通勤模式,这种模式可以只用导航地图,但SLAM建图需要多次重复同一路线才能获得完整的道路信息。
BEV/Occ + Transformer不是单一方案,SLAM也可以使用BEV生成道路拓扑自建地图。SLAM并不意味着不需要Occupancy,对于没有激光雷达的方案,Occupancy对于检测异形障碍物是必要的。
仅依赖视觉BEV+Occ的方案没有超视距信息,这可能导致在变道汇入车道或遮挡时出现意外问题。
Frank Dellaert的回答
高速场景中基于高精地图的先验信息更新较慢,图商的地图车造价高,更新频率低,可能导致SLAM匹配结果不准确。
BEV可以实时感知周围20米甚至更远的距离,足以满足规划需求。
SLAM在自动驾驶领域的应用逐渐减少,作者本人也在考虑转向其他方向。