2024年11月,卓馭官宣成行智駕由兩段式端到端算法升級(jí)為可解釋端到端算法,并且新增全國(guó)都可開的無圖城市領(lǐng)航高階智駕功能。實(shí)際體驗(yàn)和背后玄機(jī)到底如何?我們先來通過一段平臺(tái)車的實(shí)測(cè)視頻一探究竟!
端到端算法基于數(shù)據(jù)驅(qū)動(dòng),即從傳感器數(shù)據(jù)輸入,到軌跡或控制信號(hào)輸出,通過駕駛數(shù)據(jù)的學(xué)習(xí)進(jìn)行端到端訓(xùn)練,其核心在于訓(xùn)練階段軌跡或控制的監(jiān)督信號(hào)能反傳到上游模塊,可持續(xù)對(duì)智駕系統(tǒng)進(jìn)行全局的優(yōu)化。盡管針對(duì)目前端到端算法原理已有共識(shí),但因?yàn)樵诙说蕉擞?xùn)練中所投入的數(shù)據(jù)質(zhì)量高低、訓(xùn)練效率、數(shù)量多寡、以及模型優(yōu)化部署的差異,讓端到端智駕系統(tǒng)在最終的實(shí)際場(chǎng)景體驗(yàn)上也有所不同。因此,是否足夠聰明擬人,也成為了在產(chǎn)品體驗(yàn)上衡量端到端智駕系統(tǒng)的標(biāo)準(zhǔn)之一。
01 優(yōu)質(zhì)數(shù)據(jù)+高效訓(xùn)練,提升端到端智駕體驗(yàn)上限
從上述的定義可知,端到端模型本質(zhì)是從大量數(shù)據(jù)中學(xué)習(xí)傳感器數(shù)據(jù)→軌跡的映射關(guān)系。端到端智駕系統(tǒng)的能力上限由數(shù)據(jù)驅(qū)動(dòng)獲得,通過傳感器的數(shù)據(jù)輸入直出駕駛軌跡,以此在城市領(lǐng)航的場(chǎng)景中實(shí)現(xiàn)路口左右轉(zhuǎn)、避障繞行、領(lǐng)航變道、智能調(diào)速等等能力,同時(shí)能夠讓駕駛更擬人,體驗(yàn)更絲滑。這些能力實(shí)現(xiàn)和提升,關(guān)鍵在于高質(zhì)量的數(shù)據(jù)獲取,以及高效率的數(shù)據(jù)訓(xùn)練。
卓馭自成立以來,就已建立自有的數(shù)據(jù)研采車隊(duì),加上近年來隨著越來越多合作伙伴車型的規(guī)?;慨a(chǎn),在數(shù)據(jù)的獲取上覆蓋全國(guó)的高質(zhì)量場(chǎng)景?;谧狂S多模態(tài)大模型的數(shù)據(jù)挖掘技術(shù),可提供高質(zhì)量人類駕駛數(shù)據(jù)進(jìn)行端到端訓(xùn)練,確保數(shù)據(jù)有“質(zhì)”且有“量”,可真正閉環(huán)驅(qū)動(dòng)算法迭代。
此外,單目/異構(gòu)雙目系統(tǒng)依靠大量數(shù)據(jù)學(xué)習(xí)圖像→軌跡的映射,其數(shù)據(jù)訓(xùn)練效率低,需覆蓋大量長(zhǎng)尾數(shù)據(jù)。相對(duì)于此,卓馭所特有的雙目增強(qiáng)端到端架構(gòu),可提供圖像+點(diǎn)云幾何信息,讓數(shù)據(jù)訓(xùn)練效率提升10-20倍,即達(dá)到同樣性能所需訓(xùn)練數(shù)據(jù)量只需常規(guī)單目/異構(gòu)單目方案的10%左右,極大降低長(zhǎng)尾數(shù)據(jù)需求。卓馭獨(dú)創(chuàng)的雙目增強(qiáng)全向OCC技術(shù)可將障礙物感知精度提升至0.05~0.1米的范圍,不僅支持異形車、雪糕筒、水馬、石塊等任意類型障礙物檢測(cè)和避讓,實(shí)現(xiàn)更強(qiáng)駕駛安全性;落到端到端算法上,更可通過AI模型和雙目點(diǎn)云雙冗余感知技術(shù),使其性能上限更高,障礙物檢測(cè)更魯棒。
02 從用戶實(shí)際使用出發(fā),打造100%場(chǎng)景數(shù)據(jù)驅(qū)動(dòng)的端到端智駕體驗(yàn)
高質(zhì)量的數(shù)據(jù)獲取,加上高效率的數(shù)據(jù)訓(xùn)練,是端到端算法的核心基礎(chǔ);那么能從用戶實(shí)際場(chǎng)景出發(fā),讓數(shù)據(jù)來驅(qū)動(dòng)智駕體驗(yàn),則是端到端算法的落地關(guān)鍵。
在卓馭成行智駕的城市領(lǐng)航功能上,基于產(chǎn)品導(dǎo)向軟硬件聯(lián)合優(yōu)化的能力,以及結(jié)合AI和機(jī)器人科學(xué)上的空間智能積累,卓馭科技實(shí)現(xiàn)了100%場(chǎng)景下100%功能體驗(yàn)的數(shù)據(jù)驅(qū)動(dòng)。無論是橫向的車道保持、繞行避障、交互博弈、變道超車、上下匝道、領(lǐng)航選路,還是縱向的車速控制、禮讓行人、紅綠燈啟停等功能,均已實(shí)現(xiàn)100%體驗(yàn)數(shù)據(jù)驅(qū)動(dòng)。
這兩個(gè)100%,既是卓馭成行智駕在技術(shù)上的核心競(jìng)爭(zhēng)力,也是區(qū)別于其它端到端方案的差異點(diǎn)。同時(shí),100%體驗(yàn)數(shù)據(jù)驅(qū)動(dòng)技術(shù)不僅為成行智駕的城市領(lǐng)航能力在體驗(yàn)上奠定了基礎(chǔ),同時(shí)體驗(yàn)可通過數(shù)據(jù)驅(qū)動(dòng)持續(xù)提升,越開越好。而安全推理框架的應(yīng)用,也為端到端技術(shù)澆筑了安全底線。
03 高效部署端到端模型 安全推理框架保障安全底線
在算力優(yōu)化方面,卓馭始終保持著探索和努力,讓領(lǐng)先的端側(cè)算力優(yōu)化技術(shù),為端到端算法架構(gòu)的升級(jí)提供極致的部署優(yōu)化能力,尤其是針對(duì)芯片特性優(yōu)化的模型架構(gòu),即便是有限算力也可實(shí)現(xiàn)端到端模型部署。
正是基于這樣的部署優(yōu)化能力,成行智駕可解釋端到端架構(gòu)最終通過一個(gè)AI模型打通感知、預(yù)測(cè)、決策和規(guī)劃多個(gè)模塊,這樣一方面讓智能駕駛系統(tǒng)信息傳遞損失更少,同時(shí)提升了響應(yīng)速度;另一方面,在端到端模型內(nèi)保留感知、預(yù)測(cè)模塊的可解釋輸出,使整個(gè)模型具備一定的可解釋性。所有通過端到端模型輸出的智駕軌跡,最終在安全推理框架的合理篩選下保留安全且擬人化程度最高的軌跡,確保自車行為在智駕狀態(tài)下的可控性。
類比人類駕駛員在駕駛時(shí)會(huì)思考多種駕駛方式,端到端網(wǎng)絡(luò)所輸出的也是多模態(tài)候選軌跡。每條候選軌跡都對(duì)應(yīng)著一種駕駛方式,在部分場(chǎng)景中,這些候選軌跡可能會(huì)有很大差異。根據(jù)不同的場(chǎng)景和駕駛習(xí)慣,我們借助安全推理框架篩選出最合適的軌跡并發(fā)送給車輛進(jìn)行控制,同時(shí)還會(huì)針對(duì)候選軌跡的安全性以及其他指標(biāo)進(jìn)行進(jìn)一步的交叉驗(yàn)證,從而堅(jiān)守端到端算法的安全底線。
安全推理框架由“軌跡評(píng)估模塊”與“安全校驗(yàn)?zāi)K”這兩大部分構(gòu)成,其運(yùn)行原理如下圖所示,即根據(jù)需求和場(chǎng)景集,構(gòu)建輔助駕駛行為的“黑名單”。
?軌跡評(píng)估模塊:在端到端網(wǎng)絡(luò)直出軌跡時(shí),神經(jīng)網(wǎng)絡(luò)也會(huì)給出各個(gè)候選軌跡的評(píng)分,軌跡評(píng)估模塊則能夠基于此,結(jié)合安全、交規(guī)、導(dǎo)航等維度的評(píng)估,高效篩選出在安全前提下足夠擬人化的候選軌跡。
?安全驗(yàn)證模塊:該模塊承擔(dān)冗余兜底的作用,通過冗余的軟件和算法,參照功能安全機(jī)制,對(duì)最終輸出軌跡的質(zhì)量和安全性予以進(jìn)一步保障。
讓先進(jìn)的端到端技術(shù)實(shí)現(xiàn)輕松標(biāo)配,讓更多消費(fèi)者體驗(yàn)到智能駕駛行業(yè)最新的技術(shù)成果,是卓馭一直以來對(duì)“為所有人,提供安全,輕松出行體驗(yàn)”使命的踐行。這同時(shí)要求端到端技術(shù)落地的實(shí)際體驗(yàn),不僅需要滿足智能駕駛系統(tǒng)“上限足夠高”的預(yù)期,也應(yīng)在所謂“端到端下限”的安全性和可解釋性上具有充分的保障。
成行智駕可解釋端到端算法即將落地量產(chǎn),通過卓馭在數(shù)據(jù)驅(qū)動(dòng),算力優(yōu)化,模型部署等方面深厚的技術(shù)賦能,這套智駕系統(tǒng)的實(shí)際體驗(yàn)中足以達(dá)到“上限夠高,下限也高”的預(yù)期。隨著不斷優(yōu)化和完善,成行智駕可解釋端到端還將不斷提升和演進(jìn),持續(xù)在功能和體驗(yàn)上帶來更多驚喜和創(chuàng)新。