02
FSD依旧难去Beta
FSD的这一部分,没有太多惊喜。量产版FSD依旧遥遥无期,预想的Beta v11版本也没有到来。
不过从技术介绍来看,特斯拉已经开始专门针对长尾问题(Corner Case)下手了,自动驾驶团队详细解读了技术栈,好像在说,你看,自动驾驶这么难实现,也不能怪我总跳票。
通过这场AI Day分享可以看到,特斯拉已经搭建起了一个支撑FSD快速成长的自动驾驶技术栈。
2021年,有2000位特斯拉车主参与了FSD Beta测试,到2022年参与测试的车主已经达到了16万。
2022年对于特斯拉自动驾驶团队是非常卷的一年,全年进行了75778个神经网络模型训练,其中有281个模型对于FSD Beta进行了有效的性能改善。
这场分享,特斯拉主要围绕决策规划、神经网络训练(空间占用、车道&物体检测),数据训练(自动标注、仿真、数据引擎)等方面的提升进行介绍。
每一个自动驾驶决策的背后,都是基于诸多因素的平衡。规划选择是激进,还是保守,涉及到车辆本身的情况,也涉及到其他交通参与要素,这其中包含了非常多的“关系”处理,不同的物体指标也存在非常多的不同状态,包括速度、加速度、静态等,需要大量的边缘计算支持。
而随着交通关系量的增加,计算量就会越来越大。一组交互关系过程中,要考虑到所有交互指标,计算出最可靠的方案,形成一个决策树。
目前,FSD已经能够将每个操作的运行时间缩短到100微秒,但特斯拉认为这远远不够,后续还要将乘坐舒适度的分析、外界干预度因素加入进来。
特斯拉坚持纯视觉路线,但并非视觉方案就完美,尽管特斯拉有8颗摄像头,在实际交通场景中,也总是会存在一定视野盲区。
因此,在FSD的神经网络系统中,引入了空间占用模型。它以几何语义为基础,通过摄像头校准、减少延迟,分析体积占用如何占用,并渲染到向量空间中,以完整的3D方式来表征现实世界。
此外,复杂的道路结构对于自动驾驶学习来讲也是一道障碍,人类驾驶员在现实世界的通行需要车道线做指导,自动驾驶也是一样。
现实世界道路结构复杂,且有非常多的联结,这大大的增加了数据处理的难度,特斯拉通过车道检测网络,将这些问题转化成计算机能识别的语义。
视觉感知方案往往会产生非常大的数据量,特斯拉开发的数据处理编译器,正在通过更高效的算力利用、引入加速器、引入CPU、减小宽带损耗等方式,进行视频模型训练,已经实现30%的训练速度提升。
在数据标注上,特斯拉表示数据质量和标注质量同样重要,目前正采用人工标注和自动标注结合的模式,实现更细致的标注方案。
在模拟仿真的场景建设上,特斯拉也有了大幅能力提升,模拟场景生成比以前提升1000倍,边缘的几何形状建模更加精细,且可以快速复制现实环境,充分考虑不同的驾驶场景。