4 月的广州,终于来了一场久违的大雨洗礼。
在驱车前往小马智行位于南沙的总部时,我的耳边依旧回想那句话,毕业于首届清华姚班的楼天城,在大学军训期间说:“让我休息下,我要去机房做几道题。”他借着辆单车,做完题又趁着夜色赶了回来。
这类「极客」精神也映衬着整个 Pony 事业部,这是让我最好奇与着迷的。
面对外界「Robotaxi 的终局质疑论」以及当前面向 C 端「L2+」「城市自动驾驶」等商业论据,在多次追问后团队仍旧浅浅而谈。
面对 Robotaxi 质疑论,Pony AI 团队只回答一句“给 100 年前的人说你以后出行可以在天上飞,我觉得所有人都会说你肯定疯了。”
面对当前的最热的商业逻辑,Pony 团队这样评价楼天城:“他的目标是是实现 Robotaxi 的最后一步,这个圆才会完整,其它都不是他追求的。”
独到儒雅的办公环境,泛泛而来的文艺气息,Pony 团队如坐落在深林,如「孤独」的前行者,也如一个极客主义者的城市「摆渡人」。
雨又接着下了….
一、「正题」:小马智行 Robotaxi 上路案例分析
为了更直白和大家呈现场景,我们综合实际小马智行 的 Robotaxi 场景,结合每个视频和大家做解读。而此次更具对比性的是,我们这次不体验打车流程,而是直接上车,由安全员设置导航。
场景是「南沙中心」「大雨」「高峰期」,具有很多随机事件。
Now,Let's witness it !
基础场景一:「开启自动驾驶」
此次由于没有线上打车的导航预设,所以在车内安全员会设定好目的地,线路为动态寻路,并且是支持在内部道路场景、静态直接开启自动驾驶。
基础场景二:「雨天道路标线不清晰」
而此次我们刚好遇到一个大雨天的高峰场景,雨水光线的折射肉眼基本不能识别标线,特别在一些凹凸路面,车道线内有积水,而得益于高精地图以及多传感器融合,这些基础场景表现都比较稳定。
基础场景三:「识别红绿灯」/「识别黄灯切换」
目前小马智行在 Robotaxi 上搭载了一颗自研的红绿灯识别摄像头,覆盖范围为 180 米,而摄像头不只是考虑像素级,它还可以根据部分恶劣环境、不同红绿灯样式结合曝光、FOV、防水能力、防震等指标进行场景调整识别。
而我们在另一个场景下能够识别到黄灯,并且系统会做提前刹车动作。
基础场景四:「无跟车左转场景」
作为另一个基本的左转场景,Robotaxi 的整体表现也比较顺利,遇到隔壁车道慢车贴进时,也会做缓刹动作。值得一提的是,小马智行的团队会根据用户体验后的不同场景结合舒适性考量,做调整。
基础场景五:「识别慢车超车」
我们在途中遇到前车打转向灯变道,此时 Robotaxi 也随即打灯变道超越慢车。
基础场景六:「基础物体识别能力」
在这个场景下,我们看到有行人、电瓶车、小车、大车等系统对于路面信息的识别。另外界面中还能够对临近车辆做行为轨迹预测。
场景七:「通过复杂十字路口」
我们通过一个较为复杂的十字路口,无人车的系统也会出现犹豫,随后它顺利回到车道线上。
场景八:「连续跟车场景」
在连续跟车刹车场景下,无人车通过多场景的优化后,车内乘客的舒适性基本贴合日常乘坐体验。
场景九:「加塞场景」
在加塞场景下,我们遇到前车连续变换两个车道的场景,系统依旧能够识别,完成降速。
场景十:「过减速带提前减速」
让我们意外的是,在通过减速带前无人车可以提前识别,并减速通过。
场景十一:「通过 S 型无标线路段」
我们通过一段道路维修路段,是一条 S 型的不规则道路,并且路面未有任何标线,而系统也能够顺利识别通过。
这个特殊场景,是基于小马智行车辆团队自主识别场景变化,然后上传到云端,云端会将不同的车端信息综合做分析,在分发到不同的车辆做实时更新。
所以只要有单一车辆通过新的道路场景或事维修道路,整个系统也会做更新。
场景十二:「遇前车慢速加塞」
我们也遇到常见的前车犹豫慢速加塞的场景,系统在识别车辆后采用缓慢刹车的动作,整个过程较为线性。
场景九:「红绿灯左转遇障碍物」
这个场景值得讲的是在普通左转道路中,突然出现一个电瓶车的场景,和前几个场景体验的一样,系统没有「突然识别」的急刹动作,反而是先降速预测电瓶车行走路线,随后提速正常行驶。
场景十:「自主进入非主干道」/「通过抬杆」
而在我们导航中,最后的路段有一个进入非主干道以及抬杆的场景,而系统能够根据导航的识别自动进入辅道,并且在抬杆后可以等待后通过。
场景十一:「识别障碍车避让」
我们在辅路中也遇到一台停在路边的车辆,此时系统识别后重新规划路线,完成超车。
Pony 坚持 Robotaxi 的核心目的在哪?
二、「前提」:无人化与规模化
而无人驾驶的技术发展中,无人化和规模化是不容分割的关系,无人化是考验不同场外场景的处理能力,规模化则是一个前提。
之前具争议的 Robotaxi 的终局质疑论,是由于有 99% 的场景目前无人车可以解决,但是剩下的 1%的场景,需要付出过去超过 10 倍以上的代表才能完成。
这百分之一就包括「长尾场景」。
在我们上述的基础场景中,我们看到自动驾驶在换道超车、通过红绿灯、右转、加塞场景等,都有稳定的表现。
而长尾场景更为复杂,发生概率虽然比较低,但情况复杂。例如横穿车道上的行人、在左转车道上有直行车辆、故障以及违章车辆违停等场景,特别是中国的复杂工况下存在着很大的不确定性。
如何在无人化与规模化的基础上解决呢?
这需要通过无人车在「不同地区专门捕捉复杂场景」,利用不同场景数据组合达成综合性能力。
而如果车辆再去一个陌生地方的时候遇到的 corner case 下,则能够在之前去过的地方找一个类似的场景出来,然后仿真系统可以达到迅速迭代的能力。
这就引出 Pony ai 非常需要重要的论点,「corner case 是具备泛化能力的」!
三、「技术关键」:数据的泛化
与传统的数据采集与训练方式不同。
目前主流的方式是根据驾驶者的不同行为与习惯,去匹配机器的处理机制做对比校正,由此达到一个训练的结果。
而小马智行采用的是利用「仿真系统」将收集的场景储存进系统里,通过仿真将关键信息提取再泛化到不同的场景中去。
以此类推,「不断优化机器处理长尾场景的能力」。
如我们看到 的 S 型维修路面,作为一个突发行性事件,也不在高精地图迭代范围内,无人车第一次看到一个自主识别变化场景,然后上传到云端,将不同传输而来的信息综合在一起做泛化。
而更为典型的例子是我们遇到的中国本土不同加塞场景,例如不同是不同速度、不同角度、不同行为、不同距离、不同车辆等,而这些数据的提取后也可以利用仿真系统将其泛化。
所以仿真系统并不是围绕「一个事件」或者「多个事件」做训练,而是通过综合性的场景仿真,通过推演、分裂出新的数据,最后对车辆新的自发行为优化做校正,以此循环。
而讲到这里,我们还忽略了一个前提。
什么数据才能进入仿真的圈子里呢?
四、自动驾驶的两大伪命题
「伪命题一:低成本的数据采集」
数据的采集不只是需要精度高,还需要基于多维度的场景下。
目前主流的观点开始变化,利用低成本的方式采集的数据意义其实并不大。
算法、自动驾驶的技术迭代意味着对场景数据的要求会更高。
而缺乏维度的数据很难重构场景,也就意味着缺乏参考以及训练的意义。
而多维度信息的采集也意味着采集成本的提高。
这两个成本则建立在采集车辆的硬件成本以及软件算力成本。
「伪命题二:高算力处理场景更强。」
软件算力的成本核心是你能如何以 minimu 最低的算力处理好哪些场景,处理能力则是建立在你的软硬件融合、采集的维度信息等。
而目前大部分车企都宣布 1000TOPS 的即将上车,而算力的分配还暂未有实质性的应用。
优化算法处理更多复杂场景显然未来的核心竞争力。
自动驾驶最终考验是如何做数据分析、处理,以及对数据的理解力。
而不是利用高算力成本,因为高算力并不意味着处理场景能力更强。
三、 楼天城:一件事情在做到之前终究是一个概率
楼天城在接受采访时提到,“ AlphaGo 跟李世石下棋之前我还是给了一个大概 50% 的概率,严格来讲也可以认为我不看好 AlphaGo,其实科技发展很多实时候是一个尝试和概率,而不是我们一定要做这个概率的事情。”
这个概率事件在楼天城身上不是一场博弈,而是一次科技发展的挑战与尝试,不是做这件事情本身。
楼天城的逆向思维是无人驾驶是必然条件,只有将无人驾驶的「圆」闭合,就能实现任意场景、商业模式的自动驾驶,这其中不止是 Robotaxi。
楼天城提到目前高峰上下班、雨天等恶劣场景,其实感知、决策、融合、控制是共同配合完成一个安全、舒适性的体验。而不是像过去一样集中在某个模块中,例如过去的感知挑战,如今不同的模块会对复杂场景做分担,这也是自动驾驶能力提升的根本。
构建一个安全可靠、高效的模式,对复杂场景的处理能力,提高泛化能力,小马智行始终认为,只有技术的更新,才能推动整个软硬件的迭代能力。
小马智行联合创始人兼 CEO 彭军拿出「上半场」成绩,包括 5 个城市布局、 850 平方公里路测、500 万公里的总里程以及 200 辆测试车。
而下半场的开始是推出 PonyPilot+ 以及扩大 300 平方公里的覆盖范围。
而在大家高谈下半场的期许与成就时,楼天城则表现得轻描淡写:上半场最重要的结果就是进入下半场,这是上半场最重要的成就。
最难的 Robotaxi 的无人化和规模化,小马智行始终认为,必须拿下。
而对于楼天城而言这场「概率事件」不是你争我夺、互争高下的过程,而是一场他还未完成的一场挑战赛。