特斯拉发布 V12 版 FSD 智能驾驶系统,智能驾驶进入端到端时代

进不了网站?换个网络试试!

“端到端大型模型的下限能力预计明年会快速提升,一旦提升,不到两年就有可能在全球范围内超越L4标准。”在2024杭州云栖大会上,小鹏汽车董事长何小鹏表示,采用端到端大型模型之后,特斯拉的FSD会和以前完全不一样,明年可能就会比人类司机驾驶的更好。

小鹏汽车是国内首批跟随特斯拉的车企之一,今年7月底,小鹏汽车开始向用户推送基于端到端大模型的XNGP智能驾驶系统;到今年9月,华为、理想等车企也开始向用户推送基于端到端大模型的相应智能驾驶系统;蔚来则将端到端大模型应用到AEB系统上,并发布了自研的世界级模型。

随着端到端大车型的推出,车企在智能驾驶方面的推广也愈发积极。曾经风靡一时的智能驾驶、高精度地图不再吃香,门到门、点到点的驾驶辅助系统的推出也正式提上日程。小鹏汽车甚至宣称,能用L2级智能驾驶的硬件成本,实现L3+级自动驾驶的用户体验。

一时间,不具备端到端能力的智能驾驶系统似乎注定要落后。“所有不使用大模型的智能驾驶系统都会被淘汰。”何小鹏也表示,所有L4级自动驾驶公司都应该尽快转向大模型。

辰涛资本联合其他三方发布了《端到端自动驾驶行业研究报告》(以下简称“报告”)。报告显示,在受访的30多位自动驾驶行业一线专家中,90%的人表示自己所在的公司在端到端技术的研发上进行了投入,多数科技公司认为不能错过这场技术革命。

不过,并非所有“玩家”都同意端到端大模型是当前智能驾驶系统格局的颠覆者。

轻舟智航CTO侯聪向《第一财经》记者表示,自己在美国体验过特斯拉的FSD V12.3系统,虽然比特斯拉上一代FSD有了很大提升,但与主要依赖监管管控的Waymo相比还是有明显差距。图森未来前创始人侯小迪则呼吁行业要理性,不要将端到端神化。

在这场技术争议中,马斯克、何小鹏等车企负责人支持端到端;而侯聪、侯小迪、楼天成(小马智行CTO)等L4智能驾驶企业高管则认为,端到端大模型无法将L2智能驾驶辅助技术直接升级到L4自动驾驶。

报告还显示,由于该技术尚处于早期发展阶段,端到端大模型在车辆上落地还存在技术路线差异性大、数据和算力需求大、测试验证手段不成熟、资源投入巨大等诸多应用难点和痛点需要解决。

在自动驾驶迈向最后阶段的道路上,端到端大模型成为继纯视觉感知、雷达融合感知等之后又一备受争议的技术路线。

特斯拉再次引领技术革命了吗?

从一体化压铸、电池车身一体化起步,特斯拉成为新能源汽车技术的行业标杆,不少中国车企被认为是“摸着特斯拉的路过河”,端到端大尺寸模型装车,特斯拉再一次引领了新能源汽车的变革。

在端到端大模型上车之前,智能驾驶辅助系统多分为感知、规划、决策、控制等多个模块,感知、规划等方面多采用人工智能、机器学习,但模块之间主要以手写规则定义,即所谓的“基于规则”。

但在系统实际运行过程中,车辆经常会遇到无尽的拐角问题(长尾问题),解决此类问题需要工程师根据具体场景编写代码、设定规则,在这种模式下,智能驾驶辅助或自动驾驶系统往往需要人工输入大量规则。

英伟达全球副总裁、汽车业务部门负责人吴新洲认为,现有的自动驾驶算法大多是基于规则的,说起来简单,从看到什么到做什么,但要制定好规则却很难,需要大量人类工程师尽可能地思考所有可能性,而且这种方法有上限。

特斯拉发布 V12 版 FSD 智能驾驶系统,智能驾驶进入端到端时代插图

与传统基于规则的智能驾驶辅助系统不同,端到端的自动驾驶解决方案意味着从感知到调控的整个过程都通过先进的算法和深度学习技术来处理。

端到端技术在自动驾驶中的应用,将原来感知、预测、规划等多个模型相结合的架构,转变为“感知决策一体化”的单一模型架构。

中国信达证券发布的研报指出,“端到端”是指一端输入图像等环境数据信息,中间经过类似“黑匣子”的多层神经网络模型,另一端直接输出转向、刹车、加速等驾驶指令。

相比传统规则驱动的模块架构,端到端的实现将带来一系列优势:完全基于数据驱动的全局任务优化,拥有更好更快的纠错能力;能进一步减少模块间信息的有损传输、延迟和冗余,避免误差积累,提高计算效率;具有更强的泛化能力,从Rule-based转向-based,具备零样本学习能力,面对未知场景有更强的决策能力。

有了端到端大模型的支撑,智能驾驶系统能够实现更快的迭代和进步。以小鹏汽车的XNGP为例,在应用端到端大模型后,其三合一神经网络XNet+调控大模型+AI大语言模型每2天就能迭代一次,18个月智能驾驶能力提升30倍;数据系统能力与神经网络架构能够实现数小时快速诊断、解决长尾问题。

随着特斯拉端到端大型车型的推出,中国车企的智能驾驶技术路线也将在2024年开始发生重大转变。

过去几年,中国汽车厂商的智能驾驶辅助系统技术路线之争,多集中在视觉感知、融合感知上,终端的竞争更多是城市开通速度和数量。2024年伊始,华为、小鹏等企业还在争夺没有高精度地图、真正的“全覆盖开通”。

端到端大模型上车后,智能驾驶辅助系统的泛化能力大幅提升,单一区域验证和开放的重要性下降。同时端到端弱化了此前感知、规划、决策、控制等模块的区分。不少车企也开始根据端到端大模型的需求,重新调整自动驾驶团队的组织架构。

2023年底,理想汽车对智能驾驶团队组织架构进行了调整。在这次调整中,理想汽车将大模型改组为团队,划归前端算法研发团队,负责端到端架构的整体研发和上车。2024年,蔚来汽车成立了大模型部、部署架构与解决方案部、时空信息部,撤销了原来的感知部、规划管控部、环境信息部、解决方案交付部。

虽然端到端驾驶正在如火如荼地开展,但大多数中国车企还未实现理论上的“One-Mode”端到端智能驾驶。

某自动驾驶公司CTO向记者表示,端到端的智能驾驶应用可以分为两个阶段:第一阶段是双模型方案,由端到端的感知、端到端的调控组成,这是目前业界比较主流的方向;第二阶段是一模型方案,大模型解决信息输入到决策输出的问题,这更接近AGI的方向,但这个方向难度更大,估计还需要3-5年才能实现一些规模化的应用。

目前,业界普遍认为,国内车企与特斯拉的研发进度差距大概在1.5至2年。奇瑞汽车股份有限公司副总经理顾俊礼认为,要想在商业模式上追上特斯拉,必须形成规模化的产品。“当数据达到百万以上特斯拉级别时,通过模型的强化训练,智能驾驶可以学习视频流,直接告诉驾驶员行驶方向,就像现在的趋势一样。”顾俊礼说。

整车厂与供应商的路线有差异吗?

在众多车企纷纷推出端到端大屏车型、宣扬自动驾驶时代到来的同时,不少专注于自动驾驶的供应商却表达了不同的看法。

“特斯拉推出端到端FSD之后,出现了一些问题,车子总是容易冲到路肩上,尤其是在晚上,有时候会出现划痕,有时候会直接冲到路肩上爆胎。”侯聪告诉记者,同样在美国,Waymo虽然没有采用端到端的大模型,但已经能在很多城市实现无人驾驶运营,用户反馈也相当不错。

端到端大模型本身并不是一项近几年才取得突破的新技术。

“2010年左右深度学习出现之前,都叫模型分析算法,当时我们在清华大学做行人检测,要从图像里提取一些特征信息,比如人肩膀的弧度,眼睛的颜色等等,这些特征都是我们人工总结出来的,也就是rule based;而深度学习出来之后,我们输入图像,让深度学习自主学习,最后每个人不同的特征都是深度学习学到的,不是人定义的。这跟今天的end-to-end是一样的,都是基于规则的。”侯聪告诉记者,这个系统和现在端到端的智能驾驶辅助一样,都需要海量数据支撑。

这也被认为是汽车厂商竞相选择端到端大型车型的重要因素之一。

相比L4自动驾驶供应商仅运营百余辆测试车,车厂上路的产品数量通常达数十万甚至数百万辆,用户在驾驶过程中会产生海量数据,帮助车厂端到端训练智能驾驶系统,实现系统的快速迭代。

此外,某L2+级智能驾驶辅助系统供应商工程师董俊告诉记者,对供应商而言,端到端的智能驾驶很难成为标准化的产品;车身形态的变化、传感器安装位置的变化等都需要整个系统重新训练模型,需要花费大量的成本和时间,效率低下。

端到端大模型对于L2级驾驶辅助的意义在于,可以加速城市开通,加速实现车企口中的“全民驾驶”。不过对于L4级自动驾驶企业来说,端到端大模型在运营初期也能降低系统对高精度地图的依赖,让企业能够更快速地拓展运营范围;但在运营的中后期,高精度地图依然有着重要的影响,可以进一步提升自动驾驶系统的可靠性、安全性和流畅性。

另一方面,相较于已经实现盈利的特斯拉、理想汽车,目前大部分自动驾驶公司主要依赖融资,端到端的大模型不仅需要海量数据,也需要大量的资金投入。

“未来智能驾驶进入L4阶段,数据和算力每年都会呈指数级增长,这意味着每年至少需要10亿美元投入,5年后还需要不断迭代。在这样的规模下,一家公司很难盈利,无法支撑投入的利润。所以,在自动驾驶上,没必要关注投入了多少个亿,而是要从本质出发,看是否有足够的算力和数据支撑,再看需要投入多少钱。”理想汽车智能驾驶研发副总裁郎先鹏对记者表示。

极岳汽车CEO夏一平认为,200亿元曾被公认为造车的资金门槛,但现在企业没有500亿元也做不好智能驾驶。

更重要的是,对于Waymo、小马智行等以实现L4为目标的自动驾驶公司来说,其对系统重量、成本等方面的考虑与整车厂有很大不同。

与L2级驾驶辅助不同,对于L3级及以上自动驾驶,事故的主要责任将转移到车辆身上,这对自动驾驶系统的稳定性和安全性提出了极高的要求。端到端大模型黑匣子的不可解释性给自动驾驶系统带来了一定的风险。

“车企纷纷推出端到端的大规模智能驾驶模型,并大力推广,核心目的就是为了打造差异化,把车卖出去。”董俊说。

侯小迪在接受媒体采访时表示,如果特斯拉的 FSD 导致事故,司机还是有责任的。特斯拉要求司机全程双手不离方向盘,事故与特斯拉无关。另外,特斯拉的业务是卖车,FSD 是卖车的附加值。如果要考虑如何卖出更多的车,就不能像 L4 一样只关注一个有限的领域,解决这个领域里的所有 case(极端情况)。

侯聪等自动驾驶公司受访人士指出,L4自动驾驶要求100%安全,无法接受端到端“黑箱”带来的无法解释和不确定性,另外L2与L4在商业逻辑上存在巨大差异。

对于整车厂来说,卖车是主业,成本决定利润和市场竞争力,产品不能有过多的安全冗余。L4更具操作性,在相当长的一段时间内会以to-B业务为主,不会直接服务消费者。因此,相关企业需要考虑的不仅仅是汽车,还有

本站候鸟号已成立2年,主要围绕财经资讯类,分享日常的保险、基金、期货、理财、股票等资讯,帮助您成为一个优秀的财经爱好者。本站温馨提示:股市有风险,入市需谨慎。

相关推荐

暂无评论

发表评论