● 我們的目標是實現可規模化的L4級自動駕駛。
● Momenta也一直提出對行業發展趨勢的思考——“智駕摩爾定律”:軟件體驗每兩年提升十倍,硬件成本每兩年下降一半。
[汽車之家 行業] 伴隨L2級輔助駕駛的加速普及,智能駕駛技術迎來關鍵的窗口期。行業內既涌動著對技術突破的期待與積極探索,也存在對技術落地、安全應用等方面的審慎討論。
為凝聚共識、共促發展,汽車之家于9月21日舉辦“汽車之家全球AI科技大會”,以“Hi Future”為主題,匯聚行業頂尖技術專家、車企領袖及生態伙伴,探索智能技術如何筑牢安全底線、重塑競爭邊界。在本次大會上,Momenta全球解決方案首席架構師饒慶分享了主題為《通往自動駕駛的可規模化路徑》的演講。
在饒慶看來,行業在實現規模化自動駕駛方面的目標是一致的:就是要為用戶帶來真正可規模化的L4級體驗,實現全國都能開、全球都能開。
Momenta的目標是實現可規模化的L4級自動駕駛。何謂“可規模化”?并非指幾百輛Robotaxi的示范運營,而是指在全世界各類路況與場景下均能實現真正意義上的L4級自動駕駛,即駕駛員可在車內完全解放雙手甚至雙眼。要實現可規模化的L4,安全性必須達到人類駕駛水平的十倍。根據美國國家公路交通安全管理局(NHTSA)的數據,人類平均每1億公里發生一次致命交通事故。因此,要實現十倍于人類的安全水平,就需要做到每10億公里僅發生一次致命事故。然而,在日常實際駕駛中,罕見場景(Corner Cases)大約每100公里就會出現一次。Momenta從設計之初就確立了要實現10倍于人類的安全性,需要積累1000億公里的訓練數據。
Momenta也一直提出對行業發展趨勢的思考——“智駕摩爾定律”:軟件體驗每兩年提升十倍,硬件成本每兩年下降一半。2022年,一套城市NOA硬件成本超2萬元,2024年行業方案趨于收斂,成本降至8000-10000元。饒慶預計2026年以后,一套高性價比城市NOA方案成本將進一步降至4000-5000元,這將推動智能輔助駕駛走進千家萬戶。
以下為演講實錄,經汽車之家精編整理:
大家好,今天我分享的主題是“通往自動駕駛的可規模化路徑”。剛才聆聽了前面幾位的發言,我深有感觸。行業在實現規模化自動駕駛方面的目標是一致的:就是要為用戶帶來真正可規模化的L4級體驗,實現全國都能開、全球都能開。
我們的目標是實現可規模化的L4級自動駕駛。何謂“可規模化”?并非指幾百輛Robotaxi的示范運營,而是指在全世界各類路況與場景下均能實現真正意義上的L4級自動駕駛,即駕駛員可在車內完全解放雙手甚至雙眼。要實現可規模化的L4,安全性必須達到人類駕駛水平的十倍。根據美國國家公路交通安全管理局(NHTSA)的數據,人類平均每1億公里發生一次致命交通事故。因此,要實現十倍于人類的安全水平,就需要做到每10億公里僅發生一次致命事故。然而,在日常實際駕駛中,罕見場景(Corner Cases)大約每100公里就會出現一次。Momenta從設計之初就確立了要實現10倍于人類的安全性,需要積累1000億公里的訓練數據。
我們看一個長尾場景的例子。2024年初,我們剛好已完成端到端模型的內部研發與路測。適逢清明節,路邊常有祭奠焚燒紙錢的火堆。我們在測試中觀察到,車輛通過大模型能力實現了對火堆的成功識別與繞行,整個過程流暢自然。這不僅體現了對明火場景的應對,也反映出模型對未事先定義的通用障礙物(如積水、落石、野生動物突然穿行等)已具備良好的泛化能力。
那么,如何實現1000億公里的數據積累與可規模化L4自動駕駛呢?我們有兩個核心洞察:第一,必須依靠數據驅動的算法。與傳統的規則驅動不同,數據驅動通過真實場景中海量數據的收集與迭代,持續優化模型性能,應對更多長尾場景。規則驅動在面對諸如火堆、落石等未知場景時需逐一編寫規則,而真實世界的復雜性與多樣性決定了其明顯較低的上限。
第二,必須通過量產車輛采集真實世界數據。僅靠Robotaxi難以滿足千億公里數據需求。基于這兩點,Momenta制定了“一個飛輪、兩條腿”的戰略:“一個飛輪”代表數據驅動算法的持續閉環優化;“兩條腿”指量產輔助駕駛與完全自動駕駛,通過量產車回收真實數據,持續迭代模型,并反哺至自動駕駛平臺;目前,搭載Momenta輔助駕駛的量產車已超40萬輛,我們預計到2028年將實現1000億公里的數據閉環,從而支持可規模化自動駕駛的實現。
從2020年起,我們就堅定推進端到端算法架構。這一路徑體現兩大趨勢:一是規則算法逐步被數據驅動算法取代,二是分散的小模型逐漸融合為統一大模型。2022年,我們的首款量產車型仍基于規則規劃與多個專用模型(如紅綠燈識別、動態物體檢測等),并依賴高精地圖。到2023年上半年率先應用了基于Transformer的預測模型(FTP),這也是全球第一個用Transformer進行預測的算法。2023年下半年實現了感知與規劃的兩段式端到端,推出基于Transformer的規劃算法(DLP)。當時特斯拉FSD V11 仍采用一個基于規則的規劃算法。2024年,我們進一步將感知與規劃融合為一段式端到端模型,實現從傳感器原始信號到規劃軌跡的端到端輸出。
一段式端到端方案顯著提升了通用障礙物處理與復雜場景擬人化表現,但其局限性在于依賴模仿學習,行為上限受制于人類司機數據,且模型學到的一些不好的行為難以完全抑制。2025年,Momenta推出第六代飛輪大模型R6,引入強化學習機制。正如AlphaGo通過自我博弈實現超越人類最好的棋手,R6通過在云端仿真世界環境中的閉環訓練,不斷抑制風險行為、強化安全性、舒適性與高效通行能力。
R6模型在產品層面帶來三大優勢。第一是極致安全安心,通過對不安全軌跡給予負反饋,顯著提升對鬼探頭等危險場景的應對能力;第二是絲滑流暢的擬人體驗,在多目標博弈場景(如無保護左轉)中,比如在過十字路口左轉的時候既要考慮對象來車,也要考慮人行橫道穿越的行人和外賣小哥,要綜合優化安全、舒適與效率;第三是高效通行,通過獎勵機制激勵模型在通行效率上超越人類司機,例如在擁堵路段智能選擇車道、精準下匝道等。
以下通過幾個場景來說明R6大模型的實際表現。在雨天反光、窄道會車、積水無車道線等復雜條件下,車輛可依據前車與對向車輛軌跡實現平穩通行;在ETC通行場景中,通過飛輪大模型一段式端到端的能力,采用純視覺系統能準確選擇車道、實現多輪博弈并識別抬桿;在跨場景銜接方面,Momenta通過R6飛輪大模型的能力,實現了從停車場到城市道路的“車位到車位”全程無縫銜接。
此外,Momenta也在積極推動全球化落地。我們在2021年就開始布局歐洲,在2025年9月的IAA慕尼黑車展期間,我們在慕尼黑城區內環復雜路段共完成228次測試,實現零接管的效果,獲合作伙伴的一致高度評價。基于R6飛輪大模型的強大泛化能力,我們僅用三個月就完成在日本市場的初步適配,在復雜路段已經可以體驗到與國內相當的城市領航能力。我們也期待與更多伙伴共同開拓全球市場,為用戶提供卓越的L2++體驗。
Momenta也一直提出對行業發展趨勢的思考——“智駕摩爾定律”:軟件體驗每兩年提升十倍,硬件成本每兩年下降一半。2022年,一套城市NOA硬件成本超2萬元,2024年行業方案趨于收斂,成本降至8000-10000元。預計2026年以后,一套高性價比城市NOA方案成本將進一步降至4000-5000元,這將推動智能輔助駕駛走進千家萬戶。
Momenta始終秉持“Better AI, Better Life”的愿景,期待與行業伙伴共同超越智駕摩爾定律,打造卓越產品,成就極致體驗。(編譯/汽車之家 秦超)