这次,我们想谈一谈智能驾驶圈两场别开生面的“AIDAY”。
对于那些并非科技圈的极客们和技术宅而言,刚刚谢幕的特斯拉AIDAY,大概是没有什么足够有吸引力的东西,能够让他们抵抗得了时差颠倒带来的生理反应,坚持看到最后一刻的。
就连马斯克那标志性的开场舞蹈,这次也都让那个和“擎天柱”撞了名,并且还明显是个半成品的机器人代了劳。所以,如果不在机器人谢幕的前一秒就关闭电脑,那么接下来就将是宛如灾难一般的“智能驾驶专有技术名词分享大会”,还是全程考验你托福听力的全英文版。
相比较而言,国内智能驾驶公司——毫末智行举办的这场AIDAY,也并没有更接地气到哪里去。
不仅在正式开始前就铺垫了一连串业行内大佬们的应援发言,直播屏幕下方贯穿整场的“中英互译及时字幕”也是出奇的秀。不得不让人感叹,在人工智能技术高速发展的今天,即将要失业的不仅有司机师傅还有速记员。
好了,调侃归调侃。
如果你真的将这两场AIDAY认真从头看到了尾,那么就会发现一些出乎意料的共性。
首先从行业的角度上来看,这两场前后间隔只差了不到半个月的中外能驾驶交流盛会,选择的时间节点都甚是巧妙。
马斯克借着会议的热度终于实现了他一直以来的心愿,进一步扩大了FSDBeta版本的测试用户群体;毫末智行则在WEY牌摩卡激光雷达版首发,且中国首个量产版本的城市NOH正式落地的契机之下,再来一次硬核的技术分享显然更有利于行业地位的巩固。
其次从技术的角度上来看,特斯拉和毫末智行不约而同地分别围绕感知。大模型、云端大算力平台、场景仿真以及数据驱动等核心技术领域进行延展。
尽管在技术分享的具体细节上不尽相同,但总体而言,在这两场AIDAY结束过后,更高级别智能驾驶技术的实现方向和路径,已经基本被上述这两家企业所确定。
时间共性
时间共性,隐喻着这两家企业对行业未来发展趋势的洞察。
它们回答了一个困扰整个行业共同的问题:我们现在在哪?我们下一步该迈向哪?
在毫末智行举办的AIDAY上,毫末智行顾维灏深度阐述了他对于智能驾驶技术何以发展到今天这般程度的理解。他将智能驾驶在十余年间的历史总结为三个阶段,分别是以硬件驱动的1.0时代、以软件驱动的2.0时代(我们现在所处的时代)和以数据驱动的3.0时代。
自动驾驶技术,或者说是智能驾驶技术(业内普遍将现阶段应用于乘用车上的技术称作智能驾驶),诞生的源头都是年前后,美国国防部高级研究计划局(DAPRA)举办的无人车挑战赛。赛事的初衷,则是希望通过无人车技术来减少阿富汗战争中的军车伤亡。
那个时候的无人车放到现在来看,简直充满了“赛博朋克”风格的既视感。
宛若巨大探照灯一般的远古激光雷达,塞满整个驾驶室的电路板与混乱不堪的线束,就连车身涂装也是生动地诠释了何为“美式拉力赛”的原汁原味——但凡是能找出空地儿的地方,全都一块不落地印上了赞助商们的LOGO。
顾维灏回忆1.0时代的无人车并将其描述为“车上挂满了各种大大小小的硬件,武装到了牙齿”。但受困于时代科技水平的局限性,不同于夸张的“面子”,这个时候无人车的“里子”,及在规划和决策上通通依赖的都是人为既定的规则,总里程数也被最终定格在了几百万公里。
随后那些当年参赛的高校学生们摇生一变成为硅谷精英,在谷歌旗下继续深入研发无人车技术。而在中国,年,遗憾错过移动互联网革命的百度却歪打正着地闯进了国内自动驾驶这片“处女地”。大家都看上了自动驾驶技术在Robotaxi领域中巨大的商业价值。
特斯拉也是在差不多同一时间出发。
随着摩尔定律继续在半导体行业发光发热,更大算力的芯片被搬上了车;传感器的布置也渐渐像人类可以理解的审美屈服。但各个传感器的识别仍然各自为战,仅能用一些小模型和少量的数据做做训练;在规划决策上仍然以人工编程为主;总里程数也开始以千万公里计。
顾维灏将其称为2.0时代。这也是目前整个行业和绝大部分参赛玩家所能达到的阶段。
但总有骨骼清奇的人想要超越时代的桎梏。
3.0时代,在顾维灏的构想之下,“是一个完全不同的时代,是数据自己训练自己的时代”。在感知方向,各个传感器、不同模态的传感器的原始数据可以联合输出感知结果;更为高精的感知结果输送到下游的决策模块,更多、更大的神经网络模型将取代人为设定的规则;拥有智能驾驶技术的车辆也真正做到全民普及,总里程数达到上亿公里级别。
这和特斯拉对数据驱动时代的发展愿景不尽相同。
特斯拉Autopilot研发总监Ashok,在AIDAY上介绍了特斯拉近一年以来的研发成果。特斯拉扩大了FSDBeta版本的用户数量,从一年前的人暴涨到今天的16万,这对于特斯拉收集大量的用户数据从而提升神经网络性能有着奇效;
特斯拉用一年的时间训练了个神经网络模型,其中,已经发布的个模型经过检测确实提升了车辆的性能。Ashok还表示,这样的创新速度处在在规划软件、基础设施、工具等整个技术栈的方方面面。
特斯拉在AIDAY上提及,之所以在数据驱动的人工智能时代,产业界和学术界产生了巨大差异,是因为学术界总是保持数据不变,在稳定不变的数据集上不断迭代新的算法,以求提高模型性能。然而,产业实践的核心在于寻找问题,通过主动获取相应数据,添加到训练集中,利用数据去驱使模型解决问题,
数据驱动本质上所学到的信息全部来自于数据,而不同的模型仅是在学习速度,效率等方面有差异。最终是数据的数量和质量,决定了模型的上限。这才是如今特斯拉等产业界的巨头得以在数据驱动的人工智能时代,反过来引领学术界的根本原因。
毫末智行和特斯拉共同认为,对数据的处理能力和使用能力,才是智能驾驶技术迈入下一个时代的解题秘钥。
技术共性
技术共性,则是两位企业在踏入“迷雾区”后,为其他玩家提供的解题范例。
特斯拉有特斯拉的做题风格,毫末智行也有毫末智行的解题思路。但在关键问题上的处理意见上,两场AIDAY的技术分享让两家企业踏入了同一条河流。
早期应用于乘用车的辅助驾驶解决方案,其实并没有如今呈现出来的这般晦涩难懂。一颗摄像头,一颗算力不大的芯片,还有传统的视觉算法足以解决问题。
因为在技术上,如LDW车道偏离预警、LCC车道剧中控制等功能都是仅基于对路面车道线的检测就可以实现;行业上,辅助驾驶功能也并不像现在这样一般被企业大包大揽,而是分给数不清的供应商去做,车厂最后只负责集成,无需完整地把所有的技术路线。
外部环境的局现性也并没有将智能驾驶技术的难点暴露出来。
摄像头+毫米波雷达的传感组合拥有成熟的供应渠道,便宜又好用;车载计算平台只需要处理2D投影平面的图像数据,无需执行复杂的视场角转换;严格限定的使用场景也大大简化了交通参与者的复杂程度。
但当智能驾驶的应用场景越来越广泛,逐渐从封闭的道路场景驶上高速路,甚至是交通复杂度成几何增长的城市道路,一切的简单与美便都在此刻戛然而止。
摆在智能驾驶技术面前最大的难题就是如何进行感知。这更加复杂的道路场景下,车辆不再只需感知车道线,还增加了对动、静态交通参与者感知,对红绿灯和指示牌的感知,对可视范围内车道结构的感知等等。
在这样的状况下,2D投影平面下的图像数据无法继续支撑感知需求。如何将如此之多的物体统归到统一坐标系下进行感知,成为了各路玩家们的首要任务。
年,特斯拉率先提出了基于Transformer模型的BEV(鸟瞰图)视场角的构建。而毫末智行也早在年前后就基于上述技术路线开展了相关研究。
Transformer模型最大的特点就是利用注意力机制提取图像当中的特征值,并通过视场角的转换将物体转移到BEV视场角下,而BEV视场角没有投用平面视角下的距离尺度和遮挡问题,对后续的规划和控制模块的任务都更加方便。
在本次特斯拉AIDAY上,特斯拉分享的OccupancyNetwork(栅格网络)就是在BEV视场角下对感知技术上的进一步扩展。不同于过去BEV市场角的2D平面,OccupancyNetwork在高度方向又增加了一个维度变成了3D栅格。
相关业内人士对星车场APP表示,OccupancyNetwork是纯视觉自动驾驶领域的又一里程碑,是纯视觉领域最为重要的技术突破。
在过去,特斯拉的纯视觉方案由于无法识别未知的交通参与者而饱受诟病。就比如,一辆特斯拉ModelY因为无法识别侧翻在路上的白色货车而径直撞了上去。也正因为如此,无论视觉感知算法如何强大,激光雷达一直被一些人视为安全的自动驾驶不可或缺的传感设备。
但特斯拉这次分享的OccupancyNetwork除了能感知物体的高度信息之外(有高度的识别即便无法识别物体的具体类型也可当做障碍物处理),相比激光雷达在语义方面的能力上更加强大,可以更好地将感知到的3D几何信息与语义信息融合,且不需要对激光雷达和相机进行时间同步,外参对齐等工作。
除了OccupancyNetwork这枚重磅炸弹之外,特斯拉还分享了一系列关于自动标注、仿真场景定义以及大算力平台的相关内容。
其中,特斯拉和毫末智行都提到了定义仿真场景的重要性,并且都选取了流量极大并且道路场景复杂的路口场景。特斯拉选择利用自动标注的相关工具来完成具体场景的生成,将原来要用两周才能设计好的场景缩短到只有5分钟;而毫末智行则是选择用路端设备将路口每时每刻的真实交通流都记录下来,再倒入到仿真引擎里面。
顾维灏表示,这种方式对毫末智行得到的路口场景比车辆采集丰富的多,也真实的多,对车辆在路口的通过能力帮助很大。
在关键性问题的解法上,特斯拉和毫末智行出奇地一致,为高阶智能驾驶技术的实现路径定义了基本的框架。
写在最后:
从两场AIDAY上可以明显看到,智能驾驶下半场的竞争是一场关乎于大数据、大模型和大算力的终极之战。
从数据量上来讲,特斯拉年销售量高达百万辆,而毫末智行则背靠长城汽车,收集到以亿公里为单位的里程数据对双方而言都不是什么难事。
从大模型上来讲,国内某头部新新势力算法工程师对星车场APP表示,特斯拉在这方面的技术积淀目前仍然是无法撼动的,而对毫末智行等国内智能驾驶企业来讲,其在相关技术上的模仿无疑是快速且正确的,并且决策规控方面的优化一定是大家接下来的主攻方向。
从大算力上来看,特斯拉自建了超计算机,而毫末智行则是和阿里云合作打造了数据智能体系MANA。但该名工程师同时也表示,特斯拉和毫末智行的技术路线并非适用于所有的智能驾驶企业,“大算力平台是有钱才能玩的东西,国内绝大部分公司模仿不了,估计很难成为趋势。”
这意味着一大批中小企业需要在下个时代来临之时探索出“无需过大算力支持”的技术路径。