極越汽車,搞了一個(gè)車圈科技圈大新聞:純視覺NOA國(guó)內(nèi)首發(fā)上路! 一段陸家嘴點(diǎn)到點(diǎn)領(lǐng)航輔助駕駛的實(shí)拍視頻剛剛被公開 : 視頻中極越01一鏡到底、全程不接管、帶領(lǐng)航輔助,而且ODD包含高速、城市以及泊車場(chǎng)景,全程解放用戶不用自己開。 這樣的Demo在自動(dòng)駕駛行業(yè)其實(shí)不稀奇,Robotaxi早就實(shí)現(xiàn)。但令人吃驚的是,極越01的這種私家車智駕系統(tǒng),在國(guó)內(nèi)首個(gè)布局、跑通純視覺方案,不再把激光雷達(dá)作為唯一的智能駕解決方案——通常行業(yè)認(rèn)為這是現(xiàn)階段高階智駕的必須條件。 中國(guó)首個(gè),且在全球范圍內(nèi)和北美地區(qū)的特斯拉FSD處于同一梯隊(duì)。 這也是李彥宏剛剛在百度世界大會(huì)上所說“大模型重構(gòu)自動(dòng)駕駛”的成果和體現(xiàn)之一。 同樣是今年智能駕駛所有玩家內(nèi)卷的一個(gè)方向:視覺為主落地NOA,實(shí)現(xiàn)輕傳感器高功能落地。 只不過極越汽車和背后關(guān)系緊密的百度Apollo,也許在其他玩家還在驗(yàn)證研發(fā)的階段,就要率先落地了。 最終的智駕量產(chǎn)版本留有懸念,10月27日舉辦的極越01上市發(fā)布會(huì)上,這款主打開箱即用的高階智駕產(chǎn)品即將交卷。 不過用戶疑問也隨之而來,再次引發(fā)了行業(yè)對(duì)于智駕技術(shù)路線的討論:擺脫激光雷達(dá),靠譜嗎?極越01演示的這套智駕方案有哪些技術(shù)亮點(diǎn)? 純視覺高階智駕,體驗(yàn)如何? 點(diǎn)到點(diǎn)領(lǐng)航輔助駕駛,是指在目前的人機(jī)共駕階段,絕大部分的駕駛由系統(tǒng)輔助完成,司機(jī)位的職責(zé)對(duì)車輛的行駛狀態(tài)保持時(shí)刻關(guān)注。 極越01的測(cè)試全程,包含了城市高頻使用場(chǎng)景,比如上海浦東區(qū)CBD,這屬于城區(qū)內(nèi)的NOA功能;還包括上下高速匝道、隧道內(nèi)的連續(xù)領(lǐng)航輔助,以及復(fù)雜路口的人車混行等等。 其中的基礎(chǔ)能力,包括自動(dòng)避讓、基礎(chǔ)的跟車、車道保持、定速巡航等等。 更高階的能力,包括綜合考慮安全因素和通勤效率,自行變道(不用提前撥桿)、識(shí)別紅綠燈、根據(jù)導(dǎo)航自主規(guī)劃路線… 我們先看其中最值得關(guān)注的亮點(diǎn),實(shí)測(cè)一鏡到底視頻長(zhǎng)度約9分鐘,放在最后。 首先是隧道內(nèi)的長(zhǎng)距離智能駕駛,在隧道內(nèi)因?yàn)镚PS信號(hào)弱或離線,需要系統(tǒng)較為精準(zhǔn)的定位能力,同時(shí)還要面對(duì)隧道內(nèi)光照條件差、周圍障礙物密集的挑戰(zhàn): 除了正常行駛之外,極越01還能自主識(shí)別進(jìn)入隧道內(nèi)的分流岔路: 城市道路內(nèi),極越01除了能按照導(dǎo)航信息,自主規(guī)劃轉(zhuǎn)彎,還能在匯入、駛出主路的過程中,主動(dòng)繞行路邊故障車輛: 以及主動(dòng)避讓占道的行人、兩輪車: 高速場(chǎng)景下,自主進(jìn)出匝道、匯入?yún)R出車流,并且主動(dòng)避讓加塞車輛: 當(dāng)然,極越01在路上為了保證安全,對(duì)于行人、加塞的處理方式是主動(dòng)避讓,但在安全的情況下也會(huì)通行效率優(yōu)先,主動(dòng)選擇更快的車道: 如果這樣的表現(xiàn)是一輛Robotaxi,那沒什么值得驚奇的。畢竟Robotaxi上傳感器類型、數(shù)量豐富,而且也擁有相對(duì)固定的線路。 但這是一輛需要考慮量產(chǎn)、交付給用戶的私家車,而且是隨機(jī)在上海核心城區(qū)挑戰(zhàn)。 是國(guó)內(nèi)第一個(gè),很難有直接對(duì)比的參考,畢竟其他的“遙遙領(lǐng)先”都是在重傳感器的加持下實(shí)現(xiàn)的類似功能。 在極越01之前,全球范圍內(nèi),只有特斯拉的FSD展現(xiàn)過類似的能力。 極越CEO夏一平在這件事上是很不“謙虛”的: 行業(yè)標(biāo)桿,而且一定比特斯拉FSD強(qiáng)。 百度Apollo自動(dòng)駕駛能力賦能了這套系統(tǒng),百度智能駕駛事業(yè)群(IDG)技術(shù)委員會(huì)主席王亮進(jìn)一步解釋了一下: 考慮到特斯拉FSD的數(shù)據(jù)手機(jī)幾乎全部基于北美路況,所以它真正落地中國(guó)的時(shí)候,還要面臨復(fù)雜的的泛化性挑戰(zhàn)。 擺脫激光雷達(dá),技術(shù)上靠譜嗎? 目前,具備城市領(lǐng)航輔助能力的智能車,普遍常見1-2個(gè)激光雷達(dá)的配置,也有的是3個(gè),都宣稱自己是最可靠最領(lǐng)先的。 但擺脫了激光雷達(dá)的智能駕駛系統(tǒng),對(duì)于不了解細(xì)節(jié)的用戶,不免產(chǎn)生疑問:多個(gè)硬件多份保障,沒有激光雷達(dá)的智駕,能靠譜嗎? 回答這個(gè)問題,首先要弄明白激光雷達(dá)在車上有啥用。 量產(chǎn)智能駕駛系統(tǒng),你可以把它看成一個(gè)AI司機(jī),它開車的方式和人類相同,也是用眼睛去感知一切信息。這是計(jì)算機(jī)視覺學(xué)科自然而然衍生出的一個(gè)應(yīng)用方向。 這個(gè)AI司機(jī)的“眼睛”,就是車端的攝像頭。而讓AI司機(jī)分辨出看到的目標(biāo)、物體的“大腦”就是背后的感知識(shí)別算法。 算法的本質(zhì)是AI,而不是“if else”的判斷指令,因?yàn)槟悴豢赡芨F舉世界上每一種交通參與者或場(chǎng)景狀況。既然是AI,它就需要大量的數(shù)據(jù)學(xué)習(xí),作為感知識(shí)別的基礎(chǔ)。 但是這里有一個(gè)問題,人類看到的世界,是3維立體的,你可以憑直覺判斷一個(gè)目標(biāo)的形狀、大小,距離遠(yuǎn)近。但攝像頭捕捉到的圖像信息,卻是2維平面,同時(shí)AI又不具備和人類一樣的“直覺”。 所以從2維數(shù)據(jù)復(fù)現(xiàn)構(gòu)建出3維實(shí)時(shí)場(chǎng)景,是純視覺智能駕駛系統(tǒng)的最大挑戰(zhàn)。當(dāng)然還有另一個(gè)難題是路上的異形物、異型車層出不窮,在有限數(shù)據(jù)集上學(xué)習(xí)訓(xùn)練的AI,難以完全識(shí)別覆蓋。 在算法還不發(fā)達(dá)、車端芯片算力支持還不夠的早期,給“眼神”不好的純視覺系統(tǒng)增加一種感官,就成了最好的辦法——激光雷達(dá)登場(chǎng)。 激光雷達(dá)發(fā)射紅外光,碰到障礙物一定會(huì)產(chǎn)生相應(yīng)的回波信號(hào),這其中自然包含了目標(biāo)的形狀、大小,而通過回波時(shí)間,還能計(jì)算出距離信息。 相當(dāng)于激光雷達(dá)通過“觸覺”,構(gòu)建場(chǎng)景的3維數(shù)據(jù),給系統(tǒng)作為圖像數(shù)據(jù)外的參考補(bǔ)充:視覺錯(cuò)檢漏檢的,激光雷達(dá)告訴你那還有一個(gè)XX目標(biāo)。 但激光雷達(dá)成本高昂,目前在高檔豪華車以外,難以隨車標(biāo)配。并且紅外光回波信號(hào)的噪音抑制、信號(hào)處理等等,需要占用大量系統(tǒng)資源。而且激光雷達(dá)也不是萬無一失,對(duì)于回波信號(hào)的識(shí)別,同樣由算法完成,自然也有針對(duì)它的對(duì)抗攻擊手段。 不依賴激光雷達(dá)的純視覺方案要解決的關(guān)鍵問題,就是找出能夠替代3維數(shù)據(jù)實(shí)時(shí)還原構(gòu)建的視覺方法。 極越所展示的方式是OCC,Occupancy Networks,占用網(wǎng)絡(luò)。 這項(xiàng)技術(shù)去年在特斯拉AI Day上被首次公開應(yīng)用,后來特斯拉又在CVPR 2023的workshop上做了進(jìn)一步闡述。 系統(tǒng)的主要感知識(shí)別數(shù)據(jù)仍然是視覺圖像,攝像頭采集的數(shù)據(jù)通過基于Transformer的BEV網(wǎng)絡(luò),應(yīng)用自注意力機(jī)制進(jìn)行特征提取,獲得當(dāng)前場(chǎng)景各個(gè)目標(biāo)的語義分割信息,并加入時(shí)序特征。 OCC的作用,是在傳統(tǒng)3D目標(biāo)識(shí)別能力之上,通過體素(Voxel)化的方式理解和處理空間信息。 可以簡(jiǎn)單理解為將場(chǎng)景空間分割成單位化的“方塊”,感知系統(tǒng)可以對(duì)3D空間的可通行區(qū)域進(jìn)行高保真度還原。不需要考慮物體是什么,只考慮當(dāng)下這個(gè)“方塊”是否被占用: OCC從根本上避免傳統(tǒng)視覺對(duì)非訓(xùn)練集內(nèi)物體的漏檢問題,使模型的泛化能力大幅提升,能更好適應(yīng)不同場(chǎng)景和環(huán)境。 而且對(duì)比激光雷達(dá)產(chǎn)生的稀疏且不連續(xù)的點(diǎn)云,攝像頭采集的信息內(nèi)容更豐富,更好地將3D幾何信息與語義信息融合,更準(zhǔn)確還原3D場(chǎng)景。 OCC的作用,同樣提供了空間尺度下的物體大小、形狀、距離等等信息,而且不需要額外傳感器,依然使用攝像頭采集的圖像信息。 這也是極越01基于此前“純視覺為主+激光雷達(dá)”的技術(shù)路線,又開發(fā)了“無激光雷達(dá)”智駕方案的關(guān)鍵,看似沒了一項(xiàng)重要冗余,卻依然能夠?qū)崿F(xiàn)點(diǎn)到點(diǎn)智能駕駛可靠性的關(guān)鍵技術(shù)。 重新審視激光雷達(dá),高階智駕新路線? 極越CEO夏一平透露,從2021年末就和王亮博士探討純視覺智能駕駛技術(shù)方案的可行性。 從用戶端來看,這樣的方案目前似乎有些激進(jìn),因?yàn)檫@兩年激光雷達(dá)有成為高階智駕標(biāo)配之勢(shì)。 但技術(shù)端、供應(yīng)鏈一側(cè)的震動(dòng),早已經(jīng)醞釀、產(chǎn)生并傳導(dǎo):高階智駕普及,傳感器越來越輕,成本越來越經(jīng)濟(jì)。 之前耕耘自動(dòng)駕駛、AI技術(shù)多年的玩家,比如大疆、商湯、曠視等等,今年紛紛公布智能駕駛量產(chǎn)產(chǎn)品路線,瞄準(zhǔn)的是從2024以及后3年的新車型。 無一例外將高階智駕的普及門檻越降越低,有鮮明且統(tǒng)一的標(biāo)志:入門級(jí)方案成本不過千元級(jí),功能至少是高速NOA起步。 激光雷達(dá)在這些方案中,逐漸成為選配或非必須,“領(lǐng)土”退守售價(jià)更貴、規(guī)模更小的車型上。 而且其退守有加劇之勢(shì):行業(yè)頭部玩家公布的最新方案中,純視覺系統(tǒng)實(shí)現(xiàn)的功能已經(jīng)覆蓋到城市通勤NOA。 王亮博士解釋了核心原因: “實(shí)際上,任何自動(dòng)駕駛、智能汽車行業(yè)從業(yè)者都清楚,激光雷達(dá)不是自動(dòng)駕駛的終局”。 這并不涉及什么“路線之爭(zhēng)”,只是技術(shù)發(fā)展不同階段的呈現(xiàn)。 他透露,2019年之前的嘗試證明,純視覺的方法要達(dá)到高可靠且體驗(yàn)良好的自動(dòng)駕駛功能,“太難了”。所以激光雷達(dá)成了系統(tǒng)必不可少的傳感器,相當(dāng)于給當(dāng)時(shí)“眼神不好”的AI司機(jī),配了一根可以“觸摸”環(huán)境的拐杖。 但激光雷達(dá)也有不盡完美的地方。其一是成本高昂(目前仍在數(shù)千元級(jí)別),是量產(chǎn)智駕普及、L4落地規(guī)模上量的主要障礙;其二是激光雷達(dá)讓系統(tǒng)數(shù)據(jù)類型繁雜,數(shù)據(jù)量劇增,增添算法、算力資源負(fù)擔(dān)。 所以“擺脫掉激光雷達(dá)依賴”實(shí)際上成了所有量產(chǎn)智能駕駛玩家的主動(dòng)選擇,也成了車企作為甲方的客觀需求。 這同樣也是老百姓的需求。因?yàn)?個(gè)激光雷達(dá)=至少數(shù)千元BOM成本,對(duì)于大眾消費(fèi)的20萬元級(jí)或更加經(jīng)濟(jì)的車型,這樣的智駕系統(tǒng)只能是嘗鮮選配,沒法普及。這也是目前行業(yè)的普遍狀況。 智能化作為核心競(jìng)爭(zhēng)力和產(chǎn)品價(jià)值,獲得用戶認(rèn)可重視,極越和百度Apollo聯(lián)合研發(fā)純視覺方案的邏輯是: 用戶不會(huì)認(rèn)為多了幾個(gè)硬件就是高級(jí)的,反而車端輕傳感器減成本方案,背后的算力、數(shù)據(jù)、算法研發(fā)投入更大,這才是更高級(jí)更昂貴的智駕方案。 但這些軟件端的研發(fā)成本不同于硬件,不是由用戶直接買單,而是攤銷進(jìn)了規(guī)?;慨a(chǎn)。 預(yù)售價(jià)25.99萬的極越01,想做中國(guó)智能車的一個(gè)大膽嘗試:點(diǎn)到點(diǎn)高階智駕普及到大眾消費(fèi)車型,而且智能硬件標(biāo)配,不選裝不加價(jià)。 并且前端方案配置清晰、后端技術(shù)體系透明。 于是這一階段比拼性價(jià)比的智能駕駛量產(chǎn)競(jìng)爭(zhēng)幾乎已宣告結(jié)束,下一階段卷的方向更加清晰:更高的通行效率、更絲滑的乘坐體驗(yàn),和更可靠的功能安全——細(xì)節(jié)處見功夫。 不再依賴激光雷達(dá)的高階智駕,不是主觀上的激進(jìn),而是技術(shù)和行業(yè)發(fā)展到一定階段的必然和客觀體現(xiàn)。 只不過令人吃驚的是,極越展示的技術(shù)實(shí)力,讓這個(gè)標(biāo)志性里程碑的到來大大加速了。 |
|