[汽車之家 行業(yè)] 10月21日~24日,第三十二屆中國汽車工程學會年會暨展覽會(SAECCE 2025)在中國重慶·科學會堂召開。SAECCE 2025通過匯聚行業(yè)智慧、展示前沿技術(shù)、搭建合作橋梁,并攜手全球汽車科技力量,服務全球汽車科技發(fā)展,共創(chuàng)世界級汽車科技創(chuàng)新平臺。
在SAECCE 2025于10月23日下午召開的“人工智能主論壇”上,百度智能云汽車業(yè)務部副總經(jīng)理肖猛以《云智一體:構(gòu)筑智能汽車的創(chuàng)新底座》為主題進行了演講。

肖猛表示,VLA對算力的需求會更大,一方面在訓練上有更大的算力要求,比如需要多模態(tài)的融合,同時多階段的訓練,同時VLA末尾有一段強化學習的過程,需要非常大的算力支撐它。推理端需要更多算力支持它的推理,包括數(shù)據(jù)處理、訓練場景的合成、仿真測試都需要更多的算力,這些算力也是近一兩年整個智能駕駛在市場上算力規(guī)模爆發(fā)式增長的原因。
以下為演講實錄(汽車之家精編):
大家下午好!
很高興在這個場合能跟大家分享一下我們的一些現(xiàn)狀和一些思考。
目前來講,云+AI是汽車創(chuàng)新的一個新的動力,不論是智能駕駛也好還是智能座艙也好,是通過大量的算力和新的模型技術(shù)提供對應的服務,汽車領域在駕駛、座艙和企業(yè)內(nèi)部提效都有非常重要的應用。
我們先看云平臺如何來支撐自動駕駛的研發(fā),百度是主流的云服務商,百度今年在智能駕駛云市場排名第一,整個汽車云市場這幾年有非常大的增長。VLA目前已經(jīng)開始逐步量產(chǎn)了,我們在云平臺上面對VLA的支持是非常重要的,之前自動駕駛是從規(guī)則的范式慢慢過渡到端到端的范式,今年VLA的范式已經(jīng)在某些車型上得到了落地的應用。
VLA對算力的需求會更大,一方面在訓練上有更大的算力要求,比如需要多模態(tài)的融合,同時多階段的訓練,同時VLA末尾有一段強化學習的過程,需要非常大的算力支撐它。推理端需要更多算力支持它的推理,包括數(shù)據(jù)處理、訓練場景的合成、仿真測試都需要更多的算力,這些算力也是近一兩年整個智能駕駛在市場上算力規(guī)模爆發(fā)式增長的原因。
百度的百舸5.0發(fā)展了很多,從百舸1.0到5.0不斷改進,它能整體提升訓練的效率,目前很多頭部自動駕駛研發(fā)團隊在用百度的百舸進行模型開發(fā)和加速。百舸5.0也是我們今年發(fā)布的,它內(nèi)置了很多種智能駕駛模型的深度優(yōu)化,它對端到端的模型包括感知模型都做了很多優(yōu)化的處理,最大能提升100%的效率。大家都知道GPU卡也很貴,能夠提升一部分的效率就是節(jié)省了費用。
百度昆侖芯的集群已經(jīng)做到了萬卡的集群,圖上看到的東西是32卡和64卡的超大集群規(guī)模,對卡間的互聯(lián)帶寬、單機能力和集群推理能力都得到了很大的加強。
同時,百度在VLA支持上我們還有很好數(shù)據(jù)方面的支持,大伙兒知道數(shù)據(jù)標注是一個非常大的工作量,我們跟很多團隊交流的時候發(fā)現(xiàn)他們進度要求都很著急,因為看到友商們都在快速發(fā)展,每個團隊都希望更好的、更快的拿到優(yōu)質(zhì)數(shù)據(jù),百度可以用高精度地圖做數(shù)據(jù)反投,基于地圖和車輛傳感器幫助客戶把數(shù)據(jù)標注做的更快、更好。
LD地圖也可以用來做VLA訓練的數(shù)據(jù)來源之一,我們知道LD地圖比高級別地圖成本低很多,而且鮮度和覆蓋度都高了非常多。百度LD地圖覆蓋全國所有城市,一周左右就有比較好的更新。
它在支持VLA的時候有幾點,VLA本身在推理過程中是通過思維鏈,我們可以通過地圖本身提供一部分的增值信息用來加強推理。在訓練的時候,VLA后面有一段是來做強化學習的,強化學習通過LD地圖的經(jīng)驗圖層,這個彎道上沒有標限速是多少,但我們能夠拿到大部分的車在彎道是什么樣的速度,這個值就是人的經(jīng)驗圖層,把它做增值就可以引導VLA訓練過程中強化學習數(shù)據(jù)的部分。
同時,VLA開發(fā)過程中需要非常多的數(shù)據(jù)支撐,這些數(shù)據(jù)通過采集很難達到很完美的程度,我們可以通過數(shù)據(jù)合成的方式去做支持。
這是場景的重建,采集的場景重建的3D場景,我們把一輛車放進去,放進去之后可以在各個不同環(huán)節(jié)重新生成它的模型。同樣車的視角里面可以生成不同樣的素材,這是過水的,剛剛是過夕陽的,這是過雪地的。這樣我們可以通過合成的方式創(chuàng)造更多的數(shù)據(jù)用于VLA的訓練,這塊也是需要比較大的推理算力來支持。
在開發(fā)過程中需要一套更好的工具鏈,百度數(shù)據(jù)閉環(huán)的工具鏈從數(shù)據(jù)采集到模型開發(fā)仿真都可以非常好地支撐自動駕駛開發(fā)的全過程,來加速模型的迭代,目前也有很多車場的團隊在使用百度這樣的工具。
前面講的是云計算在智駕方面的支撐,在智能體和端到端語音方面,百度也有對應的模型和技術(shù)來提升座艙的體驗。百度提供完整的智能體貨架,覆蓋出行場景、用車、內(nèi)容、生活和陪伴各方面的場景。這是智能體對車外的問答,時間關(guān)系不去展示很完整了,這是多模態(tài)車型的效果。
通過車型向?qū)Х矫娴闹悄荏w,還有端到端的語音,我們知道語音交互越來越會偏自然,剛才李駿院士也講到擬人化,百度從傳統(tǒng)語義到大模型增強,2025年我們出來了端到端的語音產(chǎn)品,大伙兒可以的文心一言app體驗端到端的語音效果。目前端到端語音也會進入座艙,這里可以檢點的對話效果。它非常擬人化,而且延遲非常短,可以大大提升車輛語音交互的效果。
端到端的語音目前融入了座艙的整體架構(gòu),我們在云端和端側(cè)一起配合著來支撐,將來你會看到用戶在車里的問答,一部分通過端側(cè)模型來支持,一部分通過端到端語音直接給出回復,它的語音效果就會非常地好。
一部分復雜的車控理解再通過智能體的方式去配合,整體來講是非常綜合、多層級的架構(gòu)在車上,目前我們跟一些典型的車企開始合作,也在今年就會逐步地落地。
樂道L90(參數(shù)|詢價)接入了百度的服務,深藍也接入百度座艙層面的服務。大模型助力企業(yè)效能提升也是一個非常關(guān)鍵的熱點,我跟幾乎絕大部分的車廠在這方面有交流,他們非常熱衷把大模型的能力在廠內(nèi)進行落地,包括知識問答、質(zhì)量管理、業(yè)務工作流程,這里我們可以看到大模型在汽車企業(yè)在研產(chǎn)供銷服各個環(huán)節(jié)都有非常落地的方向點。一方面需要百度這樣的企業(yè)提供更好的模型和更好的技術(shù)平臺,模型開發(fā)平臺和應用開發(fā)平臺,也需要企業(yè)IT團隊開始具備AI落地的能力,同時整個產(chǎn)業(yè)生態(tài)能夠提升AI落地上服務的能力,這樣才能更好地幫助整個車企在企業(yè)內(nèi)部提升AI。
百度自己有一整套完整的開發(fā)平臺,接入了很多車廠的內(nèi)部系統(tǒng),從底層的大模型平臺到應用側(cè)上面的應用開發(fā)平臺,已經(jīng)開始為很多的企業(yè)提供對應的服務。
舉個例子來講,代碼生成這樣的產(chǎn)品可以大大提高效率,百度廠內(nèi)AI代碼生成的比例已經(jīng)超過了40%,我們已經(jīng)賦能了1萬家企業(yè),采納率能夠達到46%,更多的場景也需要我們的共同努力,能夠把AI能力更好地在汽車行業(yè)進行落地。
以上是百度的語音+AI如何在智駕、智艙以及企業(yè)提效上提供的服務,我們也希望更多的車企能夠跟我們一起更好地把服務AI化做得更好。謝謝大家!
