资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

自动泊车端到端算法 ParkingE2E 介绍

创作时间:

作者:

@小白创作中心

自动泊车端到端算法 ParkingE2E 介绍

引用

CSDN

https://blog.csdn.net/agorachenyun/article/details/143628554

ParkingE2E是一种基于模仿学习的自动泊车端到端算法，通过收集大量专家泊车轨迹数据，可以有效解决泊车任务。该算法在四个不同真实车库中的平均泊车成功率达到了87.8%。

自主泊车是智能驾驶领域中的一项关键任务。传统的泊车算法通常使用基于规则的方案来实现。因为算法设计复杂，这些方法在复杂泊车场景中的有效性较低。

相比之下，基于神经网络的方法往往比基于规则的方法更加直观和多功能。通过收集大量专家泊车轨迹数据，基于学习的仿人策略方法，可以有效解决泊车任务。

在本文中，我们采用模仿学习来执行从RGB图像到路径规划的端到端规划，模仿人类驾驶轨迹。我们提出的端到端方法利用目标查询编码器来融合图像和目标特征，并使用基于Transformer的解码器自回归预测未来的航点。

我们在真实世界场景中进行了广泛的实验，结果表明，我们提出的方法在四个不同的真实车库中平均泊车成功率达到了87.8%。实车实验进一步验证了本文提出方法的可行性和有效性。

输入：1.去完畸变的RGB图 2.目标停车位

输出：路径规划

算法整体架构

多视角RGB图像被处理，图像特征被转换为BEV（鸟瞰图）表示形式。使用目标停车位生成BEV目标特征，通过目标查询将目标特征和图像BEV特征融合，然后使用自回归的Transformer解码器逐个获得预测的轨迹点。

训练过程

注：训练数据集是去完畸变的图像，在数据处理时需要对4路鱼眼相机进行标定，获取相机内外参，对鱼眼图进行去畸变，去完畸变的图像会被制作成训练集

获取去完畸变的RGB图像和目标停车位做为输入：

（去完畸变的RGB图像示例）

目标停车位坐标示例：

{
"x": 83.93134781878057,
"y": -7.080006849257972,
"z": -7.404438257656194,
"yaw": 20.95510451530132
}

使用EfficientNet从RGB图像中提取特征；
将预测的深度分布ddep与图像特征Fimg相乘，以获得具有深度信息的图像特征；
将图像特征投影到BEV体素网格（特征的大小为200×200，对应实际空间范围x∈[−10m，10m]，y∈[−10m，10m]，分辨率为0.1米）中，生成相机特征Fcam。

BEV视图示例：

使用深度CNN神经网络提取目标停车位特征Ftarget
在BEV空间，将相机特征Fcam和目标停车位特征Ftarget进行融合，获取融合特征Ffuse
使用Transformer解码器以自回归方式预测轨迹点

预测的轨迹序列示例：

[
[-0.17014217376708984, -0.010008811950683594],
[-0.3298116556863353, -0.011956165423615472],
[-0.4854376561367579, -0.02052420170634236],
[-0.6337416331734281, -0.03509474854381417],
[-0.774850889165686, -0.05409092178920946],
[-0.9106318371186677, -0.07662342910150008],
[-1.0429499912911764, -0.10220288211346742],
[-1.1730293341546085, -0.130403150090076],
[-1.3014671109093938, -0.16081194272771432],
[-1.4284175031869575, -0.19315076247807056],
[-1.5537739117230407, -0.22739195648381574],
[-1.6773593831451739, -0.2637573983721455],
[-1.7991250198403412, -0.3025803813592571],
[-1.9192866870681176, -0.34410827406410627],
[-2.0383187092132995, -0.3883681895794497],
[-2.1567872059422366, -0.43518302389208097],
[-2.275088086162824, -0.4843281463722012],
[-2.393198715763861, -0.5357188397161318],
[-2.5105481374226417, -0.5894858888356189],
[-2.6260817537118184, -0.6458681996255287],
[-2.7385546018760474, -0.7049937228225489],
[-2.84701611529502, -0.7667346960596122],
[-2.9513409844272736, -0.8308041149223722],
[-3.0525702187102848, -0.8970783878192974],
[-3.1528531887709175, -0.9658913604113011],
[-3.25493913830157, -1.0379629359384206],
[-3.3612681922638727, -1.1139021444876271],
[-3.4725675825974993, -1.193842039192509],
[-3.58588491431963, -1.2783030155644421],
[-3.69307804107666, -1.3711423873901367]
]

实现过程图标表示：

推理过程

在RViz界面软件中使用“2D-Nav-Goal”来选择目标停车位

目标停车位停车轨迹示例：
position:
x: -6.49
y: -5.82
z: 0.0
orientation:
x: 0.0
y: 0.0
z: 0.0
w: 1.0目标停车位停车轨迹示例：position:x: -6.49y: -5.82z: 0.0orientation:x: 0.0y: 0.0z: 0.0w: 1.0

获取起始位姿，将以起始点为原点的世界坐标转化为车辆坐标

起始轨迹位姿示例：
position:
x: -0.16161775150943924
y: 0.018056780251669124
z: 0.006380920023400627
orientation:
x: -0.0002508110368611588
y: 0.0008039258947159855
z: 0.010172557118261405
w: 0.9999479035823092

组合数据输入到Transformer进行推理，预测轨迹序列

预测的轨迹序列示例：
[[-0.17014217376708984, -0.010008811950683594], [-0.3298116556863353, -0.011956165423615472], [-0.4854376561367579, -0.02052420170634236], [-0.6337416331734281, -0.03509474854381417], [-0.774850889165686, -0.05409092178920946], [-0.9106318371186677, -0.07662342910150008], [-1.0429499912911764, -0.10220288211346742], [-1.1730293341546085, -0.130403150090076], [-1.3014671109093938, -0.16081194272771432], [-1.4284175031869575, -0.19315076247807056], [-1.5537739117230407, -0.22739195648381574], [-1.6773593831451739, -0.2637573983721455], [-1.7991250198403412, -0.3025803813592571], [-1.9192866870681176, -0.34410827406410627], [-2.0383187092132995, -0.3883681895794497], [-2.1567872059422366, -0.43518302389208097], [-2.275088086162824, -0.4843281463722012], [-2.393198715763861, -0.5357188397161318], [-2.5105481374226417, -0.5894858888356189], [-2.6260817537118184, -0.6458681996255287], [-2.7385546018760474, -0.7049937228225489], [-2.84701611529502, -0.7667346960596122], [-2.9513409844272736, -0.8308041149223722], [-3.0525702187102848, -0.8970783878192974], [-3.1528531887709175, -0.9658913604113011], [-3.25493913830157, -1.0379629359384206], [-3.3612681922638727, -1.1139021444876271], [-3.4725675825974993, -1.193842039192509], [-3.58588491431963, -1.2783030155644421], [-3.69307804107666, -1.3711423873901367]]