
#优质创作者#2023 年,真正的自动驾驶离我们还有多远? 原创 精华
2023年自动驾驶有多远的概念有点大,不如我们来谈谈其具体的级别和关键技术,小伙伴自有判断
目前各大传统主机厂处在L2.5的驾驶辅助阶段,但是一些自动驾驶互联网公司甚至达到L3-L4级别,虽然消费者急于体验 L3/L4/L5 级别自动驾驶的汽车,保持L2的水准部分是安全的考虑。尤其是自动驾驶汽车是经过感知这个基石来实现,其中在场景语义分割、三维重建、目标检测、相机模型和标定、目标跟踪方面要获得一定的突破。
个人从工程师角度来说,暂时还没必要上L5自动驾驶,比较在国内的路况下,L5级别真的是成本和需求不对等,比如在非路面的场景下,没必要连地下车库停车都依赖L5自动驾驶。
那么来阐述一下自动驾驶水准最高的自动驾驶公司,比如小马智行,其与上汽AI LAB联合开发,其概念车搭载L4级别无人驾驶的解决方案,采用的是车规级传感器,可折叠性的方向盘,科技感和未来感的座舱。整辆车共运用17个传感器,实现视域的互相补充,它们构成冗余且来消除盲区,它的可视范围覆盖360度+200米的范围。
从自动驾驶汽车用户对于自动驾驶汽车的需求急切的。虽然主流用户的需求依旧是 L2 级别自动驾驶汽车。但是由于用车市场巨大,它的用户群体划分比较明显,用户换车的周期长,他们在换车时会有购买升级的想法,那么不同级别的自动驾驶汽车在每个阶段都会有相应的用户需求,那么必然有一些用户对自动驾驶目的技术会提出L3-L5的要求。
自动驾驶汽车的级别是由感知来实现,涵盖了场景语义分割、三维重建、相机模型和标定、目标跟踪、目标检测方面,除了感知还有驾驶行为决策。
其一来谈谈场景语义分割的技术,其为自动驾驶技术的核心,目的是把幅场景图像中的每个像素点归到某类别中,下面就是典型的分割示意。交通场景中一般把图像分割成行人、车、道路等一些元素,这是为自动驾驶车辆理解环境提供重要的依据。此问题的难度在于交通场景的复杂性和种类繁杂性。
其二来谈谈相机模型和标定的技术,在图片中观察到的光线是由物体来发出,通过透镜到达相机的平面,这个过程的几何关系的研究是计算机视觉和自动驾驶技术的关键。关于相机模型为一个简单且实用的相机模型,将其假定光线只能够从墙中的小孔中穿过,再在墙的后面成像。相机标定的目标为估计相机内参数和外参数,这些参数是联系像平面和三维世界的枢纽,同时它可以矫正使用透镜带来的误差。在自动驾驶技术中的核心还有建立相机和真实物理世界的关系。
其三,三维重建的技术,在自动驾驶中为常用的技术,并且其是建立在立体视觉的基础上。在立体视觉的基础上的三维重建模仿人眼成像的原理,由2台前向平行对准的相机来进行成像,由2幅图像中找到匹配点来估计深度信息,进一步重建三维的环境。这些深度的信息可以在自动驾驶中来探测障碍物距离及其安全区域。
其四,目标检测的技术,由于可靠性对自动驾驶非常重要。那么按照传统的目标检测技术和方法就是兴趣区域ROI提取、微调边框、图像预处理、候选区域分类,难度逐渐被降低。
其五,目标跟踪的技术,它就是及时得到交通环境中的要素,涵盖汽车的速度、位置信息、形状大小、行人的位置和速度的相关信息,由这些信息来预估周边要素下一步可能的位置,这个有助于按照位置来预估事故,能辅助自动驾驶的车辆规避事故。
其六为一个关键技术:驾驶行为决策的模型,这个决策过程是基于静态交通信息对整体行为集合来进行筛选,构造出候选驾驶的行为集,但是静态交通信息是反映在交通法规上,涵盖了道路标线、指示信号灯、限制标识、行为迁移约束。然后计算候选行为集中的类人车道选择、强制换道评价、风险预估、对后车影响,设计它的准入门槛,最后将综合有效的价值最高的驾驶行为作为车辆的输出。
