02 视觉方案
从大的方向看,自动驾驶的实现路径分为单车智能和车路协同,前者又可分为以激光雷达为主的传感器感知方案,以及以摄像头为主的视觉感知方案。除了特斯拉之外,几乎所有主机厂和自动驾驶公司都选择了单车激光雷达方案,并且国内在激光雷达方案的基础之上,同步在推进车路协同的基础建设。
之所以大多数厂商都选择了成本要高得多的激光雷达方案,是因为传感器天然就具备向量空间的探测感知能力,而激光雷达则能够应付高速实时条件下还原路况信息的必要要求,但传感器也面临多信号融合问题,并且容易受天气状况的影响。
图:蔚来ET7激光雷达夜间成像效果演示图,来源:网络
而摄像头无法直接还原三维空间信息,需要智能算法的大量学习过程后转化来解读,并且视觉方案对算力和算法延时的要求极高。视觉方案最大的难点在于这个系统拟人化的智能程度,例如基于开车经验为基础的预测能力以及举一反三的泛化能力。
车路协同,虽然能够在一定程度上降低单车的智能程度和算力要求,但另一方面则需要大规模新基建(如高精地图、5G、云计算、大数据、物联网等)的推进,所以短期内,车路协同的落地主要将依托于试运行区域的效果而定,目前离确定路径和大规模推广还相差甚远。
目前从L2级的使用体验看,特斯拉自能驾驶辅助系统autopilot的使用体验优异,大概不输于任何一辆量产车的智能辅助系统表现。特斯拉用一套低成本的方案,最终获得了规模上的先发优势。
随着其交付量的显著增加(大概400万辆特斯拉车和约10%的搭载FSD的车辆),以及背后基于正常激活运转和“影子模式”运转不断学习优化的一整套自动驾驶系统,其autopilot和FSD都在齐头并进做优化迭代。
在获得全球最多路况数据量后,特斯拉需要做三件事:
一是将2D路宽数据3D化,完成数据信息的格式化和标准化,这一过程的工作量极大,特斯拉除了有上千人组成的数据标注团队之外,还为此开发了自动化数据标注工具;
二是导入加工后的数据,训练控制决策系统的“聪明度”。为此特斯拉近年来重写了FSD基础构架,并用蒙特卡洛树搜索+神经网络相结合的方式,不断地读数据、看路况,挑出复杂路况或事故问题路况,模拟比对决策结果,再在虚拟环境中模拟构建现实世界的复杂路况,尽可能多的覆盖长尾路况信息,进一步训练决策系统应对小概率事件的从容度;
三是需要一个强大的算力模块及系统构架,为此特斯拉研制基于分布式架构的Dojo芯片,并且优化了芯片间的通讯带宽(即缩短延时),理论上能够实现无上限的算力拓展,这将随着数据量和算力的需要同步扩容。
图:特斯拉视觉感知效果图,来源:网络
图:特斯拉视觉感知效果呈现,来源:网络
图:特斯拉视觉感知架构,来源:网络
图:特斯拉展示的窄道会车场景,来源:网络
为了大幅精进这三件事情,特斯拉的核心聚焦点放在了AI领域,所以今年AI day的目的就是广泛的招贤纳士。
客观上,特斯拉有一套系统化的自动驾驶方法论,由于摄像头拥有标准的数据格式和通用数据接口,特斯拉只需要完成软件端的突破即可;但多传感器融合面临通用化和标准化的难点,其中激光雷达仍在机械、半固态、固态的路线争论中,加之车企和硬件供应商之间有强耦合的关系,会面临同步协调的系统性问题。
所以,在某种程度上,路径问题也可以简化成另一个问题,到底是一个人跑得快or一群人跑得快?