作者 | 朱世耘
编辑 | 邱锴俊
“我们有信心,在今年年内推出来的城市NGP效果,会相当程度上比FSD的效果要好。”3月26日,何小鹏在百人会论坛的访谈中向《电动汽车观察家》明确表示,小鹏汽车将于2026年开始向无人驾驶过渡的目标。
此时距离何小鹏喊话特斯拉创始人马斯克——“(要)在中国的自动驾驶领域打得(特斯拉)找不着东”刚过去16个月。
何小鹏2020年社交媒体发言
当然特斯拉也没闲着。
4月,马斯克表示可实现“完全自动驾驶能力”的FSD测试版已搭载在超10万辆特斯拉车型上。近日发布的特斯拉2021年影响力报告表示,美国所有汽车相比于使用Autopilot自动辅助驾驶的特斯拉汽车发生事故的概率要高8倍。马斯克表示,这项数据将趋向于超过10倍。
但在中国,由于开放功能过少,昂贵的FSD对特斯拉车主来说品牌标签的意义远大于使用价值。
2020年的小鹏科技日上,一段小鹏NPG VS 特斯拉NOA导航领航驾驶辅助系统的对比实验中,小鹏P7表现稳定,特斯拉Model3则有了一系列无故、违规变道和错误驶出的情况发生。
这一表现也与中国媒体屡次的对比测试结果一致:在北美开始测试完全自动驾驶的特斯拉,在中国结构化道路上仍水土不服。
晚七年出发的小鹏,现在的自动驾驶能力能否与特斯拉一较高下?何小鹏说要赶超特斯拉,是在吹牛吗?
更重要的是,以特斯拉和小鹏为代表的纯视觉和感知融合两大技术路线,在量产自动驾驶这一目标下的差异怎样,前景又如何?
01
在中国,特斯拉比小鹏“差”在哪儿?
本质上,如今的纯视觉感知的特斯拉车型,和依靠多传感器融合的小鹏车型已是运行模式大相径庭的两种“生物”,且“栖息地”也大为不同。
1.1 纯视觉VS多传感器融合
特斯拉FSD完全靠“看”。车身四周的8枚摄像头,以每个摄像头36帧每秒的速率采集,分辨率为1280×960、12-Bit的RAW格式图像。
原始图像数据直接进入名为“HydraNets(九头蛇)”的单一纯视觉神经网络算法中,进行图像拼接、物体分类、目标跟踪、引入时间序列的在线标定、视觉SLAM(定位与地图构建)等一系列能让机器明白“我拍的是什么”,最终形成一段路况时空的“向量空间”——对真实物理世界的虚拟映射。
“最困难的是建立一个准确的向量空间,”马斯克表示,“一旦有了准确的向量空间,控制问题就类似于电子游戏。”
向量空间,特斯拉AI DAY 2021年8月
“向量空间”是所有L3级及以上高阶驾驶辅助系统的必要条件,区别在于如何获取(感知)真实世界的数据。
从P7开始,XPILOT智能驾驶辅助系统(下称XPILOT)形成了“小鹏风格”的融合感知系统:前视三目摄像头+翼子板侧后视摄像头+反光镜前视摄像头+后视摄像头+5个毫米波雷达+4个环视摄像头+12个超声波雷达+高精地图+高精定位。
从P5开始,XPILOT又引入了激光雷达。
小鹏P5将适用城市NGP
雷达提供直接的速度、深度、距离和部分材质信息,其中激光雷达能够直接对现实场景进行3D点云的虚拟建模;摄像头则对行人、交通标志标线等多细节进行感知。之后,通过融合算法模式,将不同传感器的原始数据或感知结果进行4D一致化的融合,由此建立向量空间。
两套方案各有优劣。
视觉方案具有极大的成本优势。单目摄像头成本仅在150-600 元之间,较为复杂的三目摄像头成本也通常在1000 元以内。
特斯拉的8个摄像头成本在200美元(1400元)之内,加上自研的自动驾驶芯片,总成本不到1万元人民币。
多传感器融合方案在摄像头之外,毫米波雷达成本在50美元左右、半固态激光雷达普遍在几百美元,以及高精地图的费用。
2019年,高德地图宣布100元/车/年的标准化高精地图合作价格。但头豹研究院在报告中认为,除基础服务外,高精地图图商还收取辅助自动驾驶服务费,行业价格或为700-800元/车/年。
成本是技术量产规模的决定性因素,但技术的可靠性和可实现性更加重要。
距离/深度/速度探测是视觉方案的劣势之一,要通过2D的图像来构建3D+时间的向量空间,中间不但存在2D“翻译”到3D所带来的延迟问题,而且对图像处理算法、AI学习所用的场景数量/质量,和硬件算力都要求极高。
例如,去年特斯拉取消毫米波雷达之后,FSD测试版的自动转向功能设置了75 英里/小时(120公里/小时)的最高速度和最少三辆车的跟车距离。之后两个月,特斯拉将限速提高至80英里/小时(128公里/小时),跟车距离降低到两个车身长度。
多传感器方案则拥有雷达直接提供的距离/深度/速度数据,以及高精地图提供超视距的先验信息,以及高精定位模块提供的分米甚至厘米级定位能力。
“(由此)帮助AI理解,决策和规划接下来的动作,为基于其他传感器的感知能力提供辅助和冗余的信息来源。”小鹏汽车自动驾驶副总裁吴新宙向《电动汽车观察家》表示。
自动驾驶各级别对应像素数、数据量以及算力需求(估计值)《中金 | AI十年展望》
获得足够的冗余,是L4级自动驾驶公司和小鹏等公司,选择多传感器融合而非纯视觉路线的主要原因。
目前,由于纯视觉没有对速度、加速度的直接测量能力,幽灵刹车会是长期难以根治的问题。
未来,对高阶自动驾驶系统所需要的预期功能安全和功能安全来说,防止单一系统失效,收窄失效预期冗余是必须的,“目前纯视觉系统很难达到高阶自动驾驶所需的安全需求。”一位自动驾驶领域专家向《电动汽车观察家》表示。
1.2 美国的特斯拉与中国的小鹏
“栖息地”的不同进一步加大了两条技术路线的落地表现。
中国交通环境的复杂程度远超美国,需要大量视距之外的辅助信息提供给决策系统,才能顺利完成通行,也导致仅依赖实时、纯视觉感知系统,很难在中国落地。
例如,即使是属于简单场景的封闭高速路,中国相比美国路弯道更多、曲率更大,甚至有两圈叠套的路段,能“一眼看到”的路线非常短暂;中国的高速路还有更长的进出匝道,和更频繁变换的虚实车道线,甚至本不应出现在封闭路上的行人。
部分企业在实践中发现,由于交通参与者通行规范程度的差异,自动驾驶系统在美国过路口比中国“容易”近10倍。
不使用高精地图,缺乏先验信息,完全依靠视觉感知,神经网络占比超过98%的FSD,需要海量的高质量、差异性数据来进化。
因此,在北美数据的“喂养”下,FSD测试版实现了非结构化路段的部分自动驾驶能力,但特斯拉在中国还无法顺畅跑通高速路段——目前缺乏使用中国场景数据的能力。
受国家数据安全要求,特斯拉在华数据不能“出国”,这不仅意味着数据本身要存储在中国的服务器中,国外IP也不能通过网络访问,甚至在国内读取数据的人也有严格的国籍背景限制。
这意味着特斯拉要适配中国场景需要在中国“重建”组织。
首先是在中国的数据和研发中心。“负责数据采集和模型训练,以及产品经理等一系列配套组织,百人以上的团队。“一位新造车势力的大数据工程师向《电动汽车观察家》表示。
还需要重新构建工作流程。因为美国的数据同样不能进中国,所以只能从美国传递模型参数,而不能传递数据本身,“这对模型的训练工作会带来很大影响,需要重新在中国搭建训练用的pipeline(data pipeline:数据的采集、处理、脱敏、清洗、标注、分类和训练流程)。”上述大数据工程师表示,这又意味着数百甚至上千人的流程团队。
《电动汽车观察家》在访谈中了解到,2021年下半年,特斯拉已经开始在中国招聘自动驾驶研发的相关人员,但规模和用途仍不得而知。
而且,像所有跨国组织一样,海外分支机构从来不只是钱和人的问题。
“即使所有的研发导入,特斯拉中国和美国研发团队的融合也不一定那么顺利。” Thoughtworks物联网业务线总经理朱晨向《电动汽车观察家》表示:国际研发机构最痛苦的地方在于分支机构和总部的想法不一样。例如中国的研发团队根据中国国情做出一些特异化的判断,提交到总部后是否愿意批准。“到底用谁的代码,以及由此产生的一系列问题。小鹏则无需担心这些问题。”
XPILOT诞生之初,便是为中国场景服务的。
小鹏采用以高精地图为纲的决策逻辑,利用高精地图和多传感器融合,在感知和决策算法难度相对较低的情况下实现了高速导航领航这一L3级的高级别智能驾驶辅助能力的落地。
而且中国团队还能够针对本地场景进行专门的优化,由此在体验端超越了特斯拉NoA的在华表现。
据悉,小鹏对识别加塞、大货车等“中国特色”场景都进行了感知方面的优化:调整传感器的布局和感知范围;向XP的感知模型导入更多针对性场景进行训练。
针对高精地图“鲜度”不够的劣势,小鹏进行了地图系统的增强:对视觉感知到与高精地图不符的新路况,建模补充进地图;通过增强算法提升高精地图的精确性,以更适应道路起伏非常大的场景;通过技术将高精地图未拍到的细节部补完等等。
值得注意的是,对高精地图进行增强并不只是一个技术问题。
2021年,小鹏出资2.5亿元收购江苏智途科技有限公司,获得了稀缺的甲级地图资质。不仅使“补完”地图名正言顺,而且还获得了自建高精地图的入场券。
小鹏也是首家取得该资质的中国新造车势力。