大多數(shù)自動(dòng)駕駛方面的研究者們都非常專注于使汽車免于碰撞之類的事情,這可以理解。而在一般情況下,這恰恰是自動(dòng)駕駛汽車已經(jīng)非常擅長(zhǎng)做的事情——特別是在公路上以及其他一些區(qū)域中,駕駛員不必?fù)?dān)心周圍會(huì)出現(xiàn)突如其來的行人,從而不必進(jìn)行更復(fù)雜和更困難的思考。 Drive.ai 是一小部分正在推動(dòng)自主駕駛技術(shù)快速商業(yè)化的創(chuàng)業(yè)公司之一。這家公司于今年四月走出了隱身狀態(tài),IEEE Spectrum 也曾寫了有關(guān)其自上而下的深度學(xué)習(xí)(top-to-bottom deep learning)解決方法。如今,Drive.ai 是「正式出山」了,而我們已經(jīng)了解到了有關(guān)該公司的更多內(nèi)容。Drive.ai 正在兜售一種改裝套件——一組為商業(yè)車提供的可以使現(xiàn)存車輛變身成為完全自動(dòng)駕駛的工具。但與眾不同的是,它含有一個(gè) HRI(人機(jī)交互)組件,即一個(gè)能使汽車直接與人進(jìn)行交流的超大顯示器。乍一看這似乎是個(gè)全新的東西,但它卻是自動(dòng)駕駛汽車迫切需要的一個(gè)功能。 理解自動(dòng)駕駛汽車被賦予這種交流能力的原因是非常重要的,試想一下當(dāng)你試圖走過一條無法被控制的人行橫道的情況。一輛迎面而來的汽車可能會(huì)因?yàn)槟愣鴾p速,但通常情況下,在你穿過道路之前會(huì)與司機(jī)進(jìn)行眼神交流,確保他們已經(jīng)看到你了并且會(huì)停止前進(jìn)?,F(xiàn)在想象同一情形下的一輛無人駕駛汽車。在無人控制的情況下,你如何知道汽車是否已經(jīng):1)完全檢測(cè)到你;2)明白你想做什么;3)決定是否會(huì)為你停下? 無論是在行人、騎自行車或其他駕駛員之間,這樣的交流發(fā)生得比你可能會(huì)意識(shí)到的更加頻繁。它也可能沒有實(shí)際上應(yīng)該發(fā)生的那么頻繁(我認(rèn)為自己是一個(gè)這方面的專家,因?yàn)槲疑现苣募~約開車到了華盛頓。)。實(shí)際上自動(dòng)駕駛汽車不僅會(huì)使用其轉(zhuǎn)向信號(hào),也會(huì)傳達(dá)更復(fù)雜的概念,它們甚至可以禮貌地要求并道,提供諸如「減速防止前方事故」這樣的有用信息,或者甚至是在超車占道時(shí)向你道歉,當(dāng)然它們可能不會(huì)那么做。 在第一代商業(yè)化的自動(dòng)駕駛汽車中聚焦 HRI 的基本必要性源自這樣一個(gè)事實(shí):大部分人類駕駛員與大部分自動(dòng)駕駛汽車之間將有一個(gè)重要的過渡期。一旦道路上行駛的都是自動(dòng)駕駛汽車,而且車輛之間可以進(jìn)行無線通信,那么這就不是個(gè)大問題。 有時(shí)能感覺到自動(dòng)駕駛汽車公司高度關(guān)注于那個(gè)終極目標(biāo)。而由于過渡期將是混亂不堪的,常見的解決方案就是要么忽略它(「我們以后會(huì)處理它」),要么試圖規(guī)避這個(gè)問題?;氐饺诵袡M道的例子,與確實(shí)幫助人們安全過馬路相反,區(qū)別在于能否確保你的自動(dòng)駕駛汽車不會(huì)在人行橫道上撞到別人。 為了得到更多無人駕駛汽車應(yīng)用 HRI 的細(xì)節(jié),以及更多有關(guān) Drive.ai 自動(dòng)駕駛的全棧深度學(xué)習(xí)(full stack deep learning)方法,整理了接收采訪了 Drive.ai 的聯(lián)合創(chuàng)始人兼總裁 Carol Reiley 博士的筆錄: IEEE Spectrum:Drive.ai 的自動(dòng)駕駛技術(shù)有什么特別的地方? Reiley:我把自動(dòng)駕駛汽車看作大多數(shù)人將與之互動(dòng)的第一個(gè)社會(huì)機(jī)器人。它不是人形的,而是一個(gè)通過人工智能實(shí)現(xiàn)的智能機(jī)器。(我們不得不問自己),一旦你解決了從 A 點(diǎn)到 B 點(diǎn)的問題,這些自動(dòng)駕駛汽車如何與道路上的所有其他玩家互動(dòng)?這種關(guān)系是什么樣的?以及發(fā)生在人行橫道上、路口或當(dāng)你試圖并道時(shí)的非語言之舞是什么?當(dāng)你替代了方向盤后的人類時(shí),這輛車會(huì)如何反應(yīng)?它如何進(jìn)行溝通才能讓每個(gè)人都感到安全并信任它呢?我們覺得這是一個(gè)人們還沒有太多談?wù)摰脑掝}。 Spectrum:在你談到通過人工智能來實(shí)現(xiàn)一個(gè)更智能的機(jī)器人時(shí),它是如何在自動(dòng)駕駛背景下進(jìn)行的?在 2007 DARPA Grand Challenge 中運(yùn)用的人工智能與目前自動(dòng)駕駛汽車所使用的有何不同? Reiley:這個(gè)問題有很多不同層面。我們正在從頭運(yùn)用深度學(xué)習(xí)來創(chuàng)建公司;在美國(guó)國(guó)防部高級(jí)研究計(jì)劃局(DARPA)的那段時(shí)間進(jìn)行的是前期的深度學(xué)習(xí)。 Sebastian(即 Thrun (http://robots./),他在谷歌開發(fā)自動(dòng)駕駛汽車之前,帶領(lǐng)的是斯坦福大學(xué)的 DARPA Grand Challenge團(tuán)隊(duì))曾說:「計(jì)算機(jī)視覺行不通,我支持高清地圖和激光雷達(dá)?!苟雀璧淖詣?dòng)駕駛汽車計(jì)劃就是這樣被建立的:在計(jì)算機(jī)視覺行不通的設(shè)想之上。 2012 年,Google Brain 徹底改變了計(jì)算機(jī)視覺與感知方面的人工智能,而現(xiàn)在這個(gè)行業(yè)都是由深度學(xué)習(xí)支撐的。在這一點(diǎn)上,谷歌已經(jīng)在非深度學(xué)習(xí)方法上投資了數(shù)年,而他們正在一個(gè)模塊一個(gè)模塊地進(jìn)行切換,但很難從根本上改變這個(gè)方法。這是我們創(chuàng)業(yè)的優(yōu)勢(shì)之一:我們是在從頭創(chuàng)辦一家深度學(xué)習(xí)自動(dòng)駕駛汽車公司。而且我們不僅用它來進(jìn)行感知,也將它用于決策。這是一個(gè)更加閉環(huán)的方法。這是我自從 DARPA Grand Challenge 時(shí)期以來對(duì)人工智能所發(fā)生的變化的一個(gè)看法。 Spectrum:你們的汽車用的是什么傳感器?你覺得攝像頭和激光雷達(dá)相比如何? Reiley:這正是我們的深度學(xué)習(xí)流程所面臨著的問題:什么樣的傳感器適合你的車,我到底要收集多少數(shù)據(jù),以及到底需要駕駛多少英里才夠。在深度學(xué)習(xí)方面,我們目前是希望把傳感器的成本降得比以往任何時(shí)候都更低。攝像頭是非常便宜的傳感器,而且有了深度學(xué)習(xí)后,就可以對(duì)圖像置于語境中處理。對(duì)于冗余的部分,我們有其他的傳感器,但是比起其他團(tuán)隊(duì),我們真的在推動(dòng)攝像頭要努力得多,而機(jī)器學(xué)習(xí)幫我們做到了。 某些團(tuán)隊(duì)把激光雷達(dá)安放在車的前面和中心位置,否則他們就會(huì)認(rèn)為沒有高清地圖,你就不能解決這個(gè)問題。即便沒有地圖人也能在熟悉的附近開得很好,他們基本上有一個(gè)相當(dāng)于(立體)相機(jī)的東西。我們的團(tuán)隊(duì)歡迎任何低成本的傳感器;如果 Quanergy 能拿到 100 美元的傳感器,那就太棒了,我們一定會(huì)用它的。我們并不是在炫耀我們能用攝像頭做高難度的事情;我們只是嘗試建立安全且人們能真正使用并能負(fù)擔(dān)得起的系統(tǒng)。 Spectrum:為什么HRI 對(duì)于自動(dòng)駕駛汽車來說如此重要? Reiley:一個(gè)人開車時(shí),他會(huì)觀察周圍環(huán)境中的所有相關(guān)線索。例如,你看見前面有輛車,如果它的車輪向右轉(zhuǎn),你就可以推測(cè)它下一個(gè)動(dòng)作:它可能要右轉(zhuǎn)。真實(shí)世界中有很多這種微妙的線索可以用來幫助我們導(dǎo)航,而且使[我們的汽車]看起來具有更多社會(huì)智能,因?yàn)槟隳茉谒鼈冏龀鰟?dòng)作之前就能預(yù)測(cè)到會(huì)發(fā)生什么。 我們正在推動(dòng)自動(dòng)駕駛汽車在社會(huì)互動(dòng)方面的技術(shù)。人類與人類的非語言交流有時(shí)可能會(huì)很讓人困惑。當(dāng)你把人移開,這些車就得智能到可以自己導(dǎo)航,而且能被這條道路上的所有人接受,同時(shí)要保證非常安全。所以,在一個(gè)四岔路口,路人與車之間會(huì)發(fā)生什么呢?我們正在探尋車該如何表達(dá)自己,我們用 LED 燈,像 R2-D2 這樣的聲音來傳遞信息,或者通過不同的移動(dòng)方式來顯示車的意圖。我們正在考慮如何讓我們的汽車與其他人溝通。 駕駛的一個(gè)有趣之處是它是動(dòng)態(tài)的,涉及到很多人類,而人類是不可預(yù)測(cè)的。對(duì)于一輛必須進(jìn)行實(shí)時(shí)決策的自動(dòng)駕駛汽車而言,它需要在切換模式時(shí)保持非常透明,所以它不只是顯得不穩(wěn)定。我們?nèi)绾蜗蛲獠渴澜缯f明這輛汽車是自動(dòng)的呢,以及我們?nèi)绾伪硎疚覀兊囊鈭D是什么呢? Spectrum:這種對(duì) HRI 的重視是否意味著汽車自動(dòng)化的實(shí)際駕駛部分已經(jīng)(幾乎)得到解決了呢? Reiley:我覺得這個(gè)行業(yè)的大部分都在關(guān)注駕駛的機(jī)制。這不是說 HRI 與那是完全不同的;我將其看作是高度的耦合,是應(yīng)該并行發(fā)展的東西,而不是一樣一樣地做。這不只是某種實(shí)驗(yàn)室里面的機(jī)器人。存在許多與人類相關(guān)的問題需要考慮。我認(rèn)為汽車行業(yè)在很多事情上采用了模塊化的方法,但自動(dòng)駕駛汽車并不是模塊化的問題:它們是一種基于軟件的、整體性的東西,你必須退后一步了解其整體面貌。 Spectrum:Drive.ai 在這方面有什么計(jì)劃? Reiley:我們不造汽車;我們的業(yè)務(wù)是創(chuàng)造改裝套件。所以需要選擇有興趣交付貨物或交付人的合作伙伴。已有的汽車進(jìn)入 Drive.ai 的工廠,然后我們?yōu)槠涮砑訋в袀鞲衅骱?HRI 組件和軟件的車頂架,而且我們也在與這些合作伙伴合作做固定路線的駕駛。 我們將這看作是自動(dòng)駕駛汽車的安全的、邏輯上的第一步。我認(rèn)為自動(dòng)駕駛汽車的全球部署將會(huì)帶來大規(guī)模的混亂。我認(rèn)為人們目前還沒有將人類看作是其中的一環(huán)。即使我們解決了自動(dòng)駕駛汽車的問題,更大的問題實(shí)際上是人類。人類會(huì)搞砸一切,而且你必須為人類使用自動(dòng)駕駛汽車的情況進(jìn)行設(shè)計(jì),還有他們會(huì)怎樣理解他們周圍的事物。我們想要快速推出這項(xiàng)技術(shù),我們將這種與我們合作伙伴的固定路線的策略看作是第一步。而且我們肯定有興趣做一種 4 級(jí)的(完全自動(dòng))方法,因?yàn)?3 級(jí)的(其中人類還控制著一些事情)也是很混亂的。 |
|