全球汽车快讯 据外媒报道,对傲酷而言,与吉利的合作是“重要一步”——MorningBrew与傲酷公司的首席执行官展开对话,了解其技术详情。
在自动驾驶汽车领域,关于“常规摄像头还是激光雷达(发射光束的光学传感器)——究竟哪种视觉技术能够实现真正意义上的自动驾驶?”这一问题,一直存在着争议。
但这类争论通常会跳过雷达,因为雷达产品发射的是无线电波,而非光。然而,雷达却是当今最便宜、最普遍的检测系统。
傲酷公司简介
这家总部位于美国的初创公司成立于2015年,该公司将人工智能技术应用于雷达上,傲酷公司利用该设备赋予自动驾驶“视觉”能力。雷达是一种拥有80多年历史的感知系统。
傲酷公司的名称——Oculii是“魔环/眼”(“oculus)的复数形式,其灵感来自于该公司的目标:充当未来自动驾驶系统的眼睛。
此外,该公司的合作伙伴还包括:长城汽车、百度、英伟达。截止至目前,该公司的融资金额已逾7600万美元(约合4.92亿元)。
傲酷与吉利的合作
作为傲酷公司的联合创始人与首席执行官,Steven Hong在独家专访中向我们透露,该公司已与吉利达成合作,后者是中国的一家大型车企,也是迄今为止该公司合作的、规模最大的一家车企。
吉利控股拥有沃尔沃,该公司还向梅赛德斯-奔驰的母公司——戴姆勒投资了近90亿美元(约合581.98亿元)。
去年,吉利与英特尔的自动驾驶事业部——Mobileye合作增强版先进驾驶辅助系统。
通过该合作,吉利将傲酷公司的技术整合到其国产车辆中,但目前傲酷尚无法提供该合作涉及范围及合作周期的具体信息。
但我们从Hong先生处获得了许多信息,了解到傲酷公司的雷达技术是如何实现精准探测的。
请继续阅读以下有关讨论雷达历史的内容,了解傲酷公司将雷达这类旧技术重新用于新工作的原因。此外,我们还能了解到增强现实雷达与激光雷达之间的性能差距。
访谈纪录
问题1:您认为雷达应如何顺应感知堆栈?为何雷达的谈论热度不及激光雷达?
StevenHong:这是个很有趣的现象。任何自主系统——不论是自动驾驶汽车、机器人或是自动飞行无人机,且不论其智能程度多么令人置信,但该类设备首先要能感知到其周边的世界,从而确保其能够与我们实现安全的交互。因此,当您考虑自主系统将如何思考、视物及行动时,感知系统的锋芒就显露出来了。
感知有三大主流模态:有基于摄像头的系统、基于发出的光脉冲并借此实现测距的激光雷达以及基于无线电波来创建环境信息的雷达。
通常,基于光学的系统——摄像头及激光雷达的谈论热度最高,因为上述两类设备的空间分辨率向来比雷达设备强得多。借助上述两款设备,看事物时,您可以发现更多明细信息,画面也更清晰,能够像人类的视觉系统一般,感知周边的事物。
如今,雷达的使用时间累计达数十年,特别是在车载系统上的应用,该类设备可助力巡航控制及紧急制动等关键性安全系统。如今,已有数百万颗雷达被部署到车辆中或应用于道路设施中。
但这类雷达的分辨率向来很低,尽管其成本效益很高,也确实非常高效,但由于分辨率太糟糕了,很难从雷达影像中获取太多信息。看东西很模糊。
问题2:就现有的雷达传感器而言,傲酷的技术是如何与融入雷达的?
Steven Hong:我们在研发的技术能够使雷达产品的分辨率及性能提升百倍,该技术适用于经过市场验证且已部署到车辆上的数百万颗雷达产品。
此外,该技术使雷达拥有与摄像头及激光雷达相同类型的空间分辨率及性能,但这类雷达在价格上便宜了2-3个数量级,且该类雷达已经过市场验证并部署到车辆中。因此,这款软件所实现的是大规模的自主性与安全性。
如今,如果您关注激光雷达,就会发现该类产品的售价太过昂贵,以至于无法配置到您的消费型乘用车中。
您将会在美国硅谷及美国亚利桑那州凤凰城的郊区看到Waymo的自动驾驶车辆,其成本通常高达数万美元,但您却不会在本田思域(HondaCivic)等日常通勤类车辆中看到激光雷达。
那是因为激光雷达技术依然非常昂贵,且尚未被证实该产品适用于乘用车(消费型车辆)。
然而,本田思域配置了多颗雷达。若再加上我们的软件,您就会发现,相较于其他光学传感器,其分辨率及性能将与之相近,甚至在未来远超光学传感器。
因此,该技术未必要改变量产及扩容所需遵循的成本-尺寸-耗电量设计定律。
问题3:您能谈下自二战时代起,在过去70余年里,雷达技术是如何发展变化的吗?
Steven Hong:在过去15年内制造出的各款雷达,都遵循一个极为相似的定律,在某种意义上,雷达向来是我们所谓的“哑巴”传感器。他们需要一次又一次地发出相同的信号;该类信号是持续的、重复的且永不改变的。
为此,您可以凭借一颗雷达而获得出色的性能,但为了要获得更出色的性能,雷达自身的体积需要非常大。而且,该雷达必须有数千乃至数万根天线。
若雷达体积足够大,那么光圈需要足够大,这样才能提供比光学传感器强上数个数量级的分辨率和性能。
若您关注军事,就会发现一件趣事——空军、海军甚至在太空俯视地面的卫星都采用雷达设备,实际上其提供的分辨率和性能远超任何光学传感器,但为了获得该性能,其尺寸无疑是巨大的。
然而,尺寸大,就意味着用电成本较高。对于汽车业而言,大尺寸的雷达并无吸引力。
因此,在雷达设计方面就需要做出妥协:若您愿意花大价钱造一颗体积大的雷达,且配置大量的天线,那您就能获得高性能,但尺寸越大,该设备的耗电量也就越高。
不过老实说,如今之所以有数百万颗雷达被配置到车辆中,其在于这类雷达尺寸很小、设计紧凑,价格也便宜,且天线数量较少。所以,您要用二分法来看待,这类在设计雷达时,势必有所取舍。
这就是车载系统需要遵循成本-尺寸-耗电量设计定律的原因了:这类雷达传感器的成本在50美元(约合322.95元)左右。
以本田思域为例,即便配置4-6颗雷达,雷达传感器的成本也相当便宜——您总不能让雷达的成本占到整车成本的三成。
这就是目前许多车载雷达的性能很差,且提供的影像十分模糊的原因了,这是因为在设计雷达时,其整体尺寸及天线的数量受制约。
问题4:您在使现有传感器更智能方面,您的软件究竟如何融入的?
Steven Hong:我们的软件打破了雷达中的这种基本设计选择——您的雷达需要一次又一次地发布相同的信号。
我们采用了基于人工智能的自适应波形,可在不同时间发送不同的信息,并从环境中学习,以便您始终根据所处场景对所需信息以最佳方式进行编码。
在雷达范式里,这是一个非常大的转变,但在通信行业,却是很平常的事情。我在斯坦福大学攻读通信领域的博士学位。直到近六年前,我才对雷达仍一无所知。
在通信领域,我们一直在做自适应调制编码;这就是在过去的二三十年内,即使您没有拥有某款配置了数千个天线的超大型电话,但电话网速却能从千比特/秒的拨号上网速度飙升至5G网络千兆比特/秒的重要原因了。
其原因可能是编码处理技术变得更成熟,且您能够在不同时间嵌入不同的信息,以利用该信道。
因此,我们将该理念从通信引入到雷达领域,并高效地解锁了雷达的功能性——使用软件来提升分辨率,而非采用更多的天线。
该方法使我们能向任何雷达平台提供更高的分辨率,无论是用于车载安全系统(如:巡航控制及碰撞警示系统)的小型雷达,还是为下一代自动驾驶平台乃至为配置了大型天线矩阵的军事系统而打造的高端雷达,均能实现高分辨率。
我们的雷达本身就能感知它所测量的移动点的速度和方向。
若多雷达结合使用,可实现所需的360度全景、高分辨率及高性能感知堆栈。相较于激光雷达等基于光的测距系统,其成本将要便宜两到三个数量级。
我们收到了很多有关雷达与激光雷达间性能比较的问题。如今,激光雷达尽管非常贵,但性能确实不错,提供的分辨率相当好,特别是0-75米间的测距范围内。
我想说的是,从分辨率角度看,在0-50米测距范围内,我们的雷达确实没那么好——但从50到450米或50到500米的测距范围内,我们雷达的表现确实优于中高端激光雷达。
问题5:我们的听众对人工智能技术相对精通,您能否描述下,人工智能建模是如何精准工作的?
Steven Hong:举个例子,相较于传统上被应用到基于摄像头系统的人工智能,我们的人工智能与之截然不同。
事实上,相机乃至是基于音频的人工智能都是完全被动的——在某种意义上,您可以采集海量的数据,然后离线应用,而且因为您的摄像头和麦克风都是被动型设备,您只是在听。
您的人工智能完全是单向接收,且接收的所有信息并不依赖于环境中正主动发生的任何事情。
另一方面,我们的人工智能即我们所说的“在环人工智能(in-the-loop AI)”。其工作方式是:我们采用自适应主动传输,该传输是在环内进行的,可根据刚刚收到的内容来确定待发送的信息内容。
所以,这类人工智能非常不同,因为您不仅要基于接收的信息做出明智的决策,然后还必须积极利用这类信息来决定下一步做什么。
所以,这类高水平的人工智能所接受的训练及建模是截然不同的。由于我们部署的系统类型——其被嵌入到微型、廉价、低成本、轻量化的车载雷达中,而该类雷达有限制了内存和运算——在执行任务时,该类雷达务必极为高效,否则无法与云端的超级计算机相配合。
若您看下整个雷达行业,我们是全球唯一一家从事这项雷达技术的公司。其他的所有初创公司及大公司都试图通过新增更多的天线,以此来提升雷达的性能。
我们是唯一一家采用自适应类型的波形来改善分辨率的公司,不论是空间分辨率还是感知性或是视野,性能均有提升。
问题6:所以,您说这类系统可基于接收的内容来决定发送略有不同的波形。那您能否详细说明这与传统系统相比,有何不同呢?
Steven Hong:如果您关注某一款传统的系统,就会发现该系统之所以需要那么多东西,是因为各根天线同时对同一信号的测量略有不同。
所以这个想法是你一遍又一遍地重复发送相同的信号,但你要测量它一千次。如果您有一千个天线,并且每次测量都稍微好一点,那么“相位”的细微变化就是您确定目标方向及其来源的方式。
所以,这个想法是,您一次次地发送相同的信号,但您要测量一千次。如果有一千根天线,且每次测量的效果会略好些,那么“相位”的细微变化是您如何确定目标方向及其来源。
因此,我们在做的事情不仅是发送相同的信号,还包括嵌入在不同时间嵌入不同相位。这意味着并非发送相同、恒定的信号,我们所发送每个信号的相位都略微不同,我们根据接收到的信号在略微不同的时间偏移。
这里的整体理念是,我们使用元件来生成物理测量方式所没有的附加信息,而非用物理天线进行一千次的测距。
若您熟悉计算摄影学(computational photography),有点像那样。例如,在您的苹果手机内,您的每个手机镜头都会给您一个略微不同的视野、略微不同的分辨率、光圈、照明条件场景等,但您的系统会同时从三个镜头中选取所需数据,然后再融合。
通过这样的方式,您就能从三个镜头中获取更多的信息。相较于比从各个镜头单独选取数据后再叠加,前一种方式所获取的信息要多得多。
从某种意义上讲,我们做的事情与之类似,各个天线给我们的数据略有不同。
在某些计算摄影系统里,特别是基于视频的系统里,该类系统采用信息来主动调整光圈、视野及下一帧截取内容中的不同设定。值得一提的是,这样您就能聚焦目标了,或者您可以使不同区域的目标物模糊化。
在许多方面,这很相似,因为我们用信息来改变我们在下一帧所获取的信息。
问题7:所以,在某种程度上,这类描图纸上有不同层面的地形图,您可以选择将其叠加,对吗?
所以,也许一层显示陆地高度,一层显示海洋深度,等等。当您把上述不同层面地形图彼此叠加后,就能从中获得地形图的新信息。
此外,若您想要获得更多的相关信息,只需要仔细查看某个区域即可?
Steven Hong:这样来描述确实不错。在您的比喻中,各个测量点都像一张不同的“表格”,而每张表格都无法单独给您提供足够的信息。
但当您将其汇总后,您就能获得一张完整的画面,相较于由每张表格单独提供信息,显然前者获取的信息更丰富。
这种集合汇总的数据将为您提供更多信息,因为每张表单对环境的理解都不同。
问题8:另外,您说传统的雷达就像其中的一张表格,对吗?
由于其总是一次又一次地发送相同的信号,您无法“放大”某个区域,以便获取更多的信息——或者,在这种情况下,无法(测定)从某个方向接近的目标?
Steven Hong:非常准确。绝大多数的大型雷达制造商,他们极度地从以硬件为核心,因此其总是想着从硬件角度来解决这类问题。
举个例子,您不妨看下自己爱车的车载雷达,制造商会在发货前的五年就锁定软件,而且是相同的软件——从工厂生产到20年或30年后车型过时,该软件从没变过。
该软件从未改变、适应需求变化或学习。但如今,您会看到像特斯拉这类将车辆打造为一款软件系统的车企,其车辆将不断更新升级并做出调整。
所有,我们已经看到了逐渐向以软件为中心的架构转型,这是目前汽车业中真正令人兴奋的事情。
鉴于采访时长及内容清晰,作者对采访内容进行了编辑。(本文为编译作品,所用英文原文和图片选自morningbrew)