蔚來(lái)智能駕駛研發(fā)副總裁任少卿
“別人都在開(kāi)城,蔚來(lái)為什么不發(fā)布開(kāi)城數(shù)據(jù)?”相信這是很多人的疑問(wèn)。
在這個(gè)智駕領(lǐng)域尤其浮躁的時(shí)代里,有人喊出了“智駕全國(guó)都能開(kāi)”,而蔚來(lái)這家造車新勢(shì)力,在智駕層面卻從未喊出過(guò)激進(jìn)的開(kāi)城口號(hào)。
有人說(shuō)蔚來(lái)的錢都花在了堆硬件層面了,“在毫無(wú)意義的地方花了很多錢。”難道蔚來(lái)在智駕層面真的把錢花錯(cuò)了地方?
蔚來(lái)的智駕能力到底如何?為什么大家都在干的事蔚來(lái)沒(méi)有干?蔚來(lái)在智駕上到底要怎么干?新發(fā)布的樂(lè)道品牌會(huì)用上蔚來(lái)的智駕功能嗎?帶著一連串的疑問(wèn),鈦媒體App近期對(duì)話了蔚來(lái)智能駕駛研發(fā)副總裁任少卿。
在來(lái)蔚來(lái)之前,任少卿是原Momenta研發(fā)總監(jiān)兼聯(lián)合創(chuàng)始人 。其畢業(yè)于中國(guó)科學(xué)技術(shù)大學(xué)與微軟亞洲研究院聯(lián)合培養(yǎng)博士班;2022年獲得人工智能全球最具影響力學(xué)者榜單——AI 2000,排名第十;2022年入選AI華人青年學(xué)者榜單;2023年,榮獲2023未來(lái)科學(xué)大獎(jiǎng)數(shù)學(xué)與計(jì)算機(jī)科學(xué)獎(jiǎng)。
好漢不提當(dāng)年勇。對(duì)于過(guò)去的成績(jī),任少卿不愿講述太多,他更愿意分享他當(dāng)下在做的事,以及未來(lái)想要做的事。
“群體智能:讓智駕更安全”
在北京車展前夕,任少卿第一次出現(xiàn)在李斌的直播間。之前他并未在直播間出現(xiàn)過(guò),用他的話說(shuō),“抖音都很少玩,現(xiàn)在是被斌哥(蔚來(lái)汽車董事長(zhǎng)李斌)給帶出來(lái)的。”
雖然是第一次參與智駕的直播,但他并不緊張,用他的話說(shuō),“蔚來(lái)的智駕功能,你已經(jīng)測(cè)試過(guò)很多次了,對(duì)于其能力你還是很了解的,了解了就不會(huì)有什么緊張。”
在那場(chǎng)智駕的直播過(guò)程中,有一個(gè)令人印象深刻的0.5次接管,在方向盤掰出的幅度比較小的情況之下,蔚來(lái)的輔助駕駛系統(tǒng)并未退出。
任少卿對(duì)此解釋說(shuō),我們的設(shè)計(jì)實(shí)際上會(huì)有一定的這個(gè)幅度,系統(tǒng)是可以容忍方向盤有一定角度的調(diào)整。這樣可以實(shí)現(xiàn)“人機(jī)共駕”之間更好地交互。
簡(jiǎn)言之,就是在一個(gè)車道里面,你可以加上你的意圖給車,車還會(huì)加上他的意圖,一起實(shí)現(xiàn)共駕這輛車。而不是當(dāng)你手碰方向盤時(shí),輔助駕駛就立刻退出。
在直播的過(guò)程中,任少卿一直坐在后排,返程的時(shí)候,他坐在了前排副駕,開(kāi)到半路,他問(wèn)坐在后排的李斌,“你們覺(jué)得現(xiàn)在是車在開(kāi)還是人在開(kāi)?”
車自己開(kāi)與人來(lái)開(kāi),帶給后排乘客的體驗(yàn),已經(jīng)傻傻分不清了。這也是蔚來(lái)的目標(biāo),也是李斌反復(fù)對(duì)外強(qiáng)調(diào)的“人機(jī)共駕”,讓駕駛更安全,打通“類無(wú)人”的駕駛方式。
蔚來(lái)已經(jīng)于4月30日向所有NT2平臺(tái)車型全量推送了全域領(lǐng)航輔助NOP+的城區(qū)功能。這也是繼華為之后,第二家交付全域領(lǐng)航輔助的車企。從覆蓋的用戶規(guī)模來(lái)看,蔚來(lái)覆蓋超24萬(wàn)名用戶。作為比較,理想是20-25萬(wàn)名,問(wèn)界和小鵬各有7-8萬(wàn)多名。
李斌曾說(shuō)過(guò),從用戶規(guī)模、已驗(yàn)證可用范圍和已驗(yàn)證道路里程來(lái)看,蔚來(lái)毫無(wú)疑問(wèn)是智駕第一梯隊(duì)選手。截至4月20日,蔚來(lái)NOP+城區(qū)智駕在全國(guó)726座城市可用,覆蓋范圍99%;城區(qū)智駕已開(kāi)通里程超過(guò)84萬(wàn)公里,比原計(jì)劃今年6月實(shí)現(xiàn)40萬(wàn)公里的里程大幅提升。
為什么呢?其實(shí),背后主要得益于兩方面的原因,一是以通用能力為主的底層智駕研發(fā)能力的持續(xù)迭代;二是蔚來(lái)獨(dú)特的群體智能的助推,這是蔚來(lái)智駕提速的幕后技術(shù)功臣。
所謂群體智能,即通過(guò)用戶車輛對(duì)每條路進(jìn)行驗(yàn)證,然后通過(guò)分布式驗(yàn)證和集中優(yōu)化的方式,幫助每個(gè)用戶跑過(guò)的每條路進(jìn)行安全驗(yàn)證,最終針對(duì)每個(gè)版本開(kāi)展超過(guò)1000萬(wàn)公里的實(shí)車測(cè)試,才會(huì)推送給用戶。
之所以說(shuō)群體智能是蔚來(lái)的獨(dú)有能力,主要是因?yàn)槲祦?lái)為每個(gè)NT2.0平臺(tái)車型都標(biāo)配了四顆Orin 芯片,其中一顆專門用于群體智能。相較蔚來(lái),同行要么只配置至多兩顆芯片,要么只在高配車型上配置芯片,很難像蔚來(lái)一樣實(shí)現(xiàn)群體智能。這也是蔚來(lái)為何前期搭建基礎(chǔ)耗費(fèi)時(shí)間比較長(zhǎng),而一旦搭建完成,智駕普及快速進(jìn)入第一梯隊(duì)的原因。
更為重要的是,群體智能可以幫助蔚來(lái)發(fā)現(xiàn)所有的風(fēng)險(xiǎn)場(chǎng)景,而行業(yè)的一般做法是靠測(cè)試車完成。但測(cè)試車的規(guī)模畢竟有限,很難覆蓋所有的極端場(chǎng)景。而蔚來(lái)依靠群體智能,顯著提升了找到不安全場(chǎng)景的能力。可以看到,通過(guò)群體智能,蔚來(lái)建立了發(fā)現(xiàn)不知道場(chǎng)景的能力。這也是很多用戶在使用智駕時(shí)對(duì)極端場(chǎng)景的安全擔(dān)憂,蔚來(lái)通過(guò)群體智能將主動(dòng)安全做得更安全。
“靠著群體智能,我們?cè)跀?shù)據(jù)的維度持續(xù)挖掘,找到接管的數(shù)據(jù)、找到潛在的風(fēng)險(xiǎn),同時(shí)處理這些高價(jià)值的數(shù)據(jù)。現(xiàn)在我們已經(jīng)有超過(guò)一千萬(wàn)公里的高價(jià)值數(shù)據(jù),保證我們?cè)陬I(lǐng)航的狀態(tài),在主動(dòng)安全的狀態(tài)做到更加安全。”任少卿表示。
“人車共駕:如何讓用戶感到安心?”
雖然蔚來(lái)的群體智能大幅提升了應(yīng)對(duì)極端場(chǎng)景的處理能力,但礙于技術(shù)瓶頸和安全法規(guī),現(xiàn)階段的智駕還處在L2+階段,雖然在部分場(chǎng)景可以實(shí)現(xiàn)類L3功能,但畢竟沒(méi)有到全程不需要駕駛員操作的L4階段。因而,人車共駕,是現(xiàn)階段智駕的主要特點(diǎn)。
但實(shí)現(xiàn)人車共駕,并不是一件容易的事。因?yàn)槠渲械暮诵氖鞘玛P(guān)安全,一旦處理不好人駕和智駕的關(guān)系,用戶開(kāi)啟一次就會(huì)終生棄用。為了做好人機(jī)共駕,蔚來(lái)主要做了兩方面的工作。
一方面是讓提醒功能更人性化了。傳統(tǒng)的駕駛?cè)吮O(jiān)測(cè)系統(tǒng)DMS,會(huì)在車上裝一個(gè)攝像頭,監(jiān)測(cè)駕駛員的狀態(tài),一旦有不符合駕駛安全的行為,系統(tǒng)會(huì)自動(dòng)發(fā)出提醒。但任少卿認(rèn)為對(duì)于智駕系統(tǒng)來(lái)說(shuō),這遠(yuǎn)遠(yuǎn)不夠,因?yàn)槿狈?duì)車輛本身和車外的監(jiān)測(cè)。
在任少卿看來(lái),人、車和車外環(huán)境是一個(gè)整體,需要將三者進(jìn)行統(tǒng)一的融合,實(shí)現(xiàn)在真正危險(xiǎn)的場(chǎng)景下對(duì)人發(fā)出準(zhǔn)確的提醒,而在不危險(xiǎn)的情況下則要做到減少打擾。
為此,蔚來(lái)開(kāi)發(fā)了一套將駕駛員、車、智能駕駛?cè)诤铣梢惶渍w的模型——ADMS。它會(huì)通過(guò)對(duì)整體車的狀態(tài)、駕駛員的狀態(tài),以及車外環(huán)境狀態(tài)進(jìn)行統(tǒng)一建模,實(shí)現(xiàn)在有必要的場(chǎng)景提醒駕駛員,在沒(méi)有必要的場(chǎng)景減少提醒。
任少卿表示,相較傳統(tǒng)的DMS,蔚來(lái)的人車共駕模型ADMS,在風(fēng)險(xiǎn)場(chǎng)景的有效提醒率上升高了3.5倍。對(duì)于現(xiàn)階段的智駕而言,實(shí)現(xiàn)人和車的共駕尤為重要,尤其是對(duì)于安全而言。這是智駕實(shí)現(xiàn)“減少精力、減少事故”的安全,這也是蔚來(lái)2017年開(kāi)始開(kāi)發(fā)智能駕駛系統(tǒng)時(shí)的初心。
除了具有更好的人車共駕模型ADMS確保安全外,蔚來(lái)還創(chuàng)新地推出了智駕分體系,這一使用體系就像是城區(qū)智駕的操作教程,可以幫助用戶建立起正確、安全的全域智駕使用觀念。
智駕分的核心,是建立一個(gè)長(zhǎng)期的人車共駕下駕駛員安全行為引導(dǎo)機(jī)制,通過(guò)分值的變化讓駕駛員關(guān)注并持續(xù)確保自身駕駛行為的正確。
據(jù)悉,智駕分主要從專注安全駕駛、合理地完成系統(tǒng)接管響應(yīng)和良好的智駕經(jīng)驗(yàn)三方面,通過(guò)對(duì)過(guò)去30個(gè)智駕使用日(新用戶為100公里智駕里程)的人車共駕行為進(jìn)行模型化評(píng)估。
用戶開(kāi)通城區(qū)智駕之前,為了確保他對(duì)于城區(qū)智駕的功能理解,需要完成經(jīng)驗(yàn)任務(wù)且NOP+高速城快智駕里程達(dá)100公里。后續(xù)在使用過(guò)程中,會(huì)結(jié)合智駕分體系對(duì)用戶使用全域領(lǐng)航輔助NOP+的全量功能使用里程范圍管控,分?jǐn)?shù)高于70分全量城區(qū)驗(yàn)證道路可用,分?jǐn)?shù)低于70分,則只有城區(qū)主干驗(yàn)證道路可用。
任少卿表示,智駕分的根本目的是希望讓用戶看到一些與其駕駛安全相關(guān)的更顯性的事情或指標(biāo)。“原來(lái)大家開(kāi)車時(shí)可能并不太關(guān)注自己的駕駛習(xí)慣,有了這個(gè)智駕分之后,可能每次開(kāi)車的時(shí)候就會(huì)注意一下這個(gè)事,它就會(huì)變好。”
ADMS的開(kāi)發(fā)和智駕分體系的建立,可以讓蔚來(lái)用戶在開(kāi)啟全域領(lǐng)航輔助NOP+時(shí),達(dá)到理想的人車共駕狀態(tài)。什么是理想的人車共駕狀態(tài)?“安心感,讓用戶持續(xù)處于安心、舒適的狀態(tài)。”任少卿說(shuō)道。
事實(shí)上,對(duì)于現(xiàn)在90%的用戶,城區(qū)智駕都是一個(gè)新鮮事物。在任少卿看來(lái),車企卷智駕開(kāi)城速度的前提,應(yīng)該將安全保障置于前置條件,也應(yīng)該提醒用戶安全大于一切。
“控成本,自研智駕芯片”
今年智駕有一個(gè)趨勢(shì),就是往下卷。在任少卿看來(lái),從產(chǎn)品的角度來(lái)說(shuō),其實(shí)就這兩件事,要么就是同樣的性能更便宜,要么就是同樣的價(jià)格性能更好。
值得注意的是,智能駕駛里面最貴的部分或者說(shuō)最核心的部分是芯片。要想實(shí)現(xiàn)降本增效,自研智駕芯片是其中的方法之一。這也是為什么蔚來(lái)要自研智駕芯片的原因之一。
在2023 NIO Day上,蔚來(lái)正式發(fā)布了首顆自研智能駕駛芯片——神璣NX9031。蔚來(lái)的目標(biāo)是用一顆自研芯片實(shí)現(xiàn)目前業(yè)界四顆旗艦智能駕駛芯片的性能,使得效率和成本更優(yōu)。
任少卿認(rèn)為,不管從商業(yè)的角度,還是從功能的角度來(lái)看,2024、2025年是整個(gè)行業(yè)瘋狂變化的階段,也是瘋狂提升的階段。
對(duì)于購(gòu)車的用戶來(lái)說(shuō),會(huì)考慮車如果要用8年、10年,那這個(gè)車的智駕功能是否可以用這么久。
蔚來(lái)對(duì)于這方面的考量是,硬件上要做到領(lǐng)先兩代,一代基本上是三年,六年就是一個(gè)比較領(lǐng)先的硬件。同時(shí)軟件做到九年、十年。
在任少卿看來(lái),2027年、2028年、2029年以后,硬件迭代的速度可能就會(huì)慢下來(lái)。因此,車可能就不需要預(yù)埋那么多硬件,但是從2022年到2026年這個(gè)時(shí)間段,硬件的變化速度非常快,可能就需要預(yù)埋更多的硬件,這樣才能保證接下來(lái)的6年,車上的一些軟件相對(duì)來(lái)說(shuō)好用的,可用的。
從軟件的角度來(lái)說(shuō),大多數(shù)車企其實(shí)不同車型的軟件是不一樣的,直接帶來(lái)的問(wèn)題是后續(xù)維護(hù)、運(yùn)營(yíng)、迭代帶來(lái)的成本非常高,很難持續(xù)維護(hù)6年、10年。
這也是蔚來(lái)為什么一直強(qiáng)調(diào)NAD的架構(gòu),在任少卿看來(lái),軟件層面的平臺(tái)化和統(tǒng)一化,實(shí)際上才是消費(fèi)者的最終價(jià)值所在。
比如新推出的樂(lè)道品牌和蔚來(lái)的底層架構(gòu)是一樣的,軟件和硬件同架構(gòu),意味著很多數(shù)據(jù)可以共享。比如攝像頭的那兩個(gè)犄角都還在,很多底層這個(gè)感知的數(shù)據(jù),就像攝像頭積累的這些數(shù)據(jù)都是共享的。
相當(dāng)于樂(lè)道到量產(chǎn)的時(shí)候,它對(duì)于這些攝像頭相關(guān)的corner case(極端情況),它是經(jīng)過(guò)蔚來(lái)的這些車驗(yàn)證過(guò),它是有好多年的這個(gè)積累,它不是一個(gè)從零開(kāi)始的狀態(tài)。
任少卿指出,“智駕的本質(zhì)是你上線的時(shí)候做不到90%的能力,那用戶的價(jià)值就會(huì)受限制。”
也就是說(shuō),新車上搭載的智能駕駛,剛買車時(shí),智駕功能可能還沒(méi)有實(shí)現(xiàn)超過(guò)50%。智駕量產(chǎn)后,能力還持續(xù)迭代。如果軟件架構(gòu)沒(méi)有做好,或者說(shuō)沒(méi)有好的平臺(tái),后續(xù)是無(wú)法進(jìn)行持續(xù)迭代的。
“現(xiàn)在可能大家對(duì)于訂閱的接受度沒(méi)有那么高,但我們一直認(rèn)為這是正確的方向。”在任少卿看來(lái),如果沒(méi)有訂閱模式,只是一錘子買賣,就是我賣了一套硬件、一套軟件,交付的時(shí)候就把錢收完了,后續(xù)誰(shuí)還有動(dòng)力去優(yōu)化?
“端到端之后才是大模型”
對(duì)于現(xiàn)在大家都在講的大模型上車,任少卿認(rèn)為,大模型現(xiàn)在更多地變成了一個(gè)宣傳的東西。
從技術(shù)的角度來(lái)說(shuō),大模式實(shí)際上拆開(kāi)來(lái)看,包含了很多層的東西。
具體來(lái)說(shuō),首先要模型化。
大家其實(shí)還沒(méi)有搞明白什么是模型,為什么要搞機(jī)器學(xué)習(xí)或者人工智能這個(gè)事,就開(kāi)始要大模型。
實(shí)際上,搞模型有好處也有壞處。模型的好處是把復(fù)雜的系統(tǒng)問(wèn)題簡(jiǎn)單化,讓人去訓(xùn)練模型,接近問(wèn)題的辦法從加人變成了加數(shù)據(jù)。很多公司在這個(gè)層面開(kāi)始往里走,而且走得很深了。
那模型不好的點(diǎn)是什么?任少卿解釋說(shuō),模型化這件事不是說(shuō)說(shuō)就可以了,需要建立相應(yīng)的能力。比如需要建立一個(gè)結(jié)合現(xiàn)實(shí)的自訓(xùn)模型的底層架構(gòu),包括數(shù)據(jù)體系,如何找到高質(zhì)量的數(shù)據(jù)?怎么找到corner case?然后去建立一個(gè)把這些標(biāo)注數(shù)據(jù)處理的系統(tǒng),最后才是建立一個(gè)訓(xùn)練的系統(tǒng)。有了這些基礎(chǔ)能力之后,其實(shí)才是起步開(kāi)始做模型化。
這聽(tīng)起來(lái)不太好理解,但簡(jiǎn)言之,就是要先有一個(gè)底層的架構(gòu),然后才能干其他的。
此前任少卿在蔚來(lái)智能駕駛發(fā)布會(huì)上公布了蔚來(lái)實(shí)現(xiàn)城區(qū)智駕公式(通用能力+按路驗(yàn)證/優(yōu)化/開(kāi)通/運(yùn)營(yíng)=全域領(lǐng)航輔助 NOP+)。
該公式中首先提到的通用能力就是蔚來(lái)智駕的底層能力,其中也用到了現(xiàn)在業(yè)界討論比較多的技術(shù)——“占用網(wǎng)絡(luò) OCC 2.0”。
占用網(wǎng)絡(luò)OCC(Occupancy Network ),實(shí)際上其原理是通過(guò)獲取體積占據(jù)信息,使得系統(tǒng)能夠在三維空間中精確地定位物體并識(shí)別其形狀,而非僅在二維平面上進(jìn)行識(shí)別,能夠處理更復(fù)雜的空間關(guān)系,從而提升自動(dòng)駕駛的能力。
蔚來(lái)將OCC2.0表述為“超高精度純視覺(jué)柵格”,再加上車上的11個(gè)攝像頭,其智能駕駛的“感知精度”與“泛化能力”都會(huì)有較大的提升。
當(dāng)有了這個(gè)基礎(chǔ)能力之后,就可以開(kāi)始訓(xùn)練模型,那是不是意味著就可以上車了?其實(shí),還會(huì)面臨很多的問(wèn)題。
比如說(shuō)發(fā)現(xiàn)了一個(gè)case(問(wèn)題),這個(gè)case 不過(guò),模型重新訓(xùn),然后把所有的 case 重新測(cè), 100% 的 case 全部重新過(guò)一遍。
因?yàn)樯婕暗乃俣龋谕瑯拥臅r(shí)間,有了這個(gè)case,依然希望在3天能修復(fù)掉。從測(cè)試的角度來(lái)說(shuō),之前是 1% 測(cè)一遍,現(xiàn)在是 100% 測(cè)完。
“那你的整體的測(cè)試能力要提升 100 倍。如果沒(méi)有辦法提升 100 倍,模型就是扯淡。”
所以第一步,大家都是模型化。感知模型化大家都沒(méi)問(wèn)題了,實(shí)際上這些規(guī)控模型的模型化,頭部都沒(méi)怎么做全。
“模型之后是端到端,最后才能叫大模型。”
為什么要端到端?在任少卿看來(lái),其實(shí)訓(xùn)練這個(gè)智能駕駛,它本身也生產(chǎn)一個(gè)產(chǎn)品,只是它產(chǎn)出來(lái)的不是一個(gè)車,它產(chǎn)出來(lái)的是這個(gè)模型或者是一個(gè)功能。但它也是一個(gè)復(fù)雜的產(chǎn)品,它有非常多的東西需要去做。
為了更好地理解端到端,任少卿將其比喻成福特的T型車流水線。
早期大家做自動(dòng)駕駛,可能幾個(gè)人坐下來(lái)把能想到的東西都寫下來(lái),在實(shí)驗(yàn)室階段可能三個(gè)人就能完成;但在工程化階段,就不可能再是這樣一個(gè)東西,就變成一個(gè)T型車的流水線,開(kāi)始拆工序,第一步做什么、第二步做什么、第三步做什么……一步一步把流水線給建立起來(lái)。
所以就變成了第一步要做感知,感知完了做定位,然后做規(guī)劃,再做控制。拆分完了流水線,爽的事情是看起來(lái)部分解耦了,但帶來(lái)的問(wèn)題是這個(gè)中間的接口必須定義得非常清楚,以及非常簡(jiǎn)單,流水線才能走。但是這個(gè)接口的定義本質(zhì)上是有問(wèn)題。
有什么問(wèn)題嗎?“因?yàn)檎鎸?shí)世界沒(méi)有這么簡(jiǎn)單,真實(shí)世界是復(fù)雜的。”任少卿說(shuō)道,越往后你會(huì)發(fā)現(xiàn),你可以解決99%的問(wèn)題,但就是這1%的問(wèn)題解決不了。
不管如何定義這個(gè)接口,最后可能還有問(wèn)題無(wú)法解決。“所以大家就希望說(shuō)那我不定這個(gè)接口了,我讓這個(gè)接口,網(wǎng)絡(luò)自己學(xué),就機(jī)器自己去定,那這個(gè)的核心就是端到端,就相當(dāng)于說(shuō)把這個(gè)前面和后面連起來(lái),把這接口干掉,能干掉很多事。”
“那就要從我們自己的定義來(lái)說(shuō),大模型一直要解決的是你有一個(gè)更強(qiáng)地對(duì)世界的建立認(rèn)知的能力,以及預(yù)測(cè)的能力。”任少卿坦言道。