本文來源:VEehicle / 導讀 / 繼上次分享的2020年自動駕駛汽車技術報告-了解自動駕駛汽車硬件和軟件最新技術指南之感知與定位之后,本文繼續(xù)分享處理以及學習模塊。 根據自動駕駛傳感器套件捕獲的原始數據和它可以訪問的現有地圖,自動駕駛系統(tǒng)需要構建和更新其環(huán)境地圖,同時跟蹤其位置。同時定位和映射(SLAM)算法讓車輛實現了這一點。一旦它在地圖上的位置已知,系統(tǒng)就可以開始規(guī)劃從一個點到另一個點的路徑。SLAM是一個復雜的過程,因為定位需要一個地圖,而定位需要一個好的位置估計。盡管長期以來一直被認為是機器人實現自主的一個基本的雞或蛋問題,但在80年代中期和90年代的突破性研究在概念和理論層面上解決了SLAM問題。從那時起,各種各樣的SLAM方法被開發(fā)出來,其中大多數使用概率概念。為了更精確地執(zhí)行SLAM,傳感器融合開始發(fā)揮作用。傳感器融合是將來自多個傳感器的數據與數據庫相結合,以獲得更好的信息的過程。它是一個多層次的過程,處理數據的關聯、關聯和組合,能夠獲得比單獨使用單個數據源更便宜、更高質量或更相關的信息。對于從傳感器數據到運動所需的所有處理和決策,通常使用兩種不同的人工智能方法:哪一種方法最適合于自動駕駛,目前沒有定論,傳統(tǒng)的,也是最常見的方法包括將自動駕駛問題分解成若干子問題,并用計算機視覺、傳感器融合、定位、控制理論和路徑規(guī)劃的專用機器學習算法技術依次解決每個子問題。端到端(e2e)學習作為解決自動駕駛車輛復雜人工智能系統(tǒng)挑戰(zhàn)的一種潛在方法,越來越受到人們的關注。端到端(e2e)學習將迭代學習作為一個整體應用于復雜系統(tǒng),并在深度學習的背景下得到了推廣。端到端的方法試圖創(chuàng)建一個自動駕駛系統(tǒng),其中包含一個單一的、全面的軟件組件,可以將傳感器輸入直接映射到駕駛動作。由于在深度學習方面的突破,e2e系統(tǒng)的能力得到了提高,因此它們現在被認為是一個可行的選擇。這些系統(tǒng)可以用一種或多種不同類型的機器學習方法來創(chuàng)建,例如卷積神經網絡或強化學習,我們將在本報告后面詳細闡述首先,我們將回顧如何處理來自傳感器的數據,以就機器人車輛的運動做出決定。根據車上使用的傳感器的不同,可以使用不同的軟件方案從傳感器信號中提取有用的信息。有幾種算法可用于識別圖像中的對象。最簡單的方法是邊緣檢測,即評估不同像素中光或顏色強度的變化。[69]人們會期望屬于同一對象的像素具有相似的光特性;因此,觀察光強度的變化可以幫助分離對象或檢測一個對象轉向下一個對象的位置。這種方法的問題在于,在低光照強度(比如晚上)情況下,算法不能很好地執(zhí)行,因為它依賴于光照強度的差異。此外,由于這種分析必須在每個鏡頭和多個像素上進行,因此計算成本很高。激光雷達數據可以用來計算車輛的運動,原理相同。通過比較在連續(xù)瞬間拍攝的兩個點云,一些物體將離傳感器更近或更遠。一種稱為迭代最近點的軟件技術迭代地修正了兩個點云之間的轉換,從而能夠計算出車輛的平移和旋轉。雖然上述方法很有用,但它消耗了大量的計算時間,并且不容易擴展到自動駕駛車輛在不斷變化的環(huán)境中運行的情況。這就是機器學習發(fā)揮作用的地方,它依賴于已經學會從現有數據執(zhí)行任務的計算機算法。目前,不同類型的機器學習算法正被用于自動駕駛汽車的不同應用。本質上,機器學習根據提供的一組訓練數據,將一組輸入映射到一組輸出。卷積神經網絡(CNN)、遞歸神經網絡(RNN)和深度強化學習(DRL)是應用于自主駕駛的最常見的深度學習方法。CNNs主要用于處理圖像和空間信息,提取感興趣的特征,識別環(huán)境中的目標。這些神經網絡由一個卷積層組成:一組濾波器,試圖區(qū)分圖像的元素或輸入數據來標記它們。這個卷積層的輸出被輸入到一個算法中,該算法將它們結合起來預測圖像的最佳描述。最后一個軟件組件通常稱為對象分類器,因為它可以對圖像中的對象進行分類,例如街道標志或其他汽車。RNN是處理視頻等時間信息的強大工具。在這些網絡中,前面步驟的輸出作為輸入輸入輸入到網絡中,從而允許信息和知識在網絡中持續(xù)存在并被上下文化。DRL結合了深度學習(DL)和強化學習。DRL方法允許軟件定義的“代理”學習使用獎勵功能在虛擬環(huán)境中實現其目標的最佳可能操作。這些面向目標的算法學習如何實現一個目標,或者如何在多個步驟中沿著特定維度最大化。盡管前景看好,但DRL面臨的一個挑戰(zhàn)是設計正確的獎勵功能來駕駛車輛。深度強化學習在自主車輛中的應用仍處于初級階段。這些方法不一定是孤立的。例如,像特斯拉這樣的公司依賴于混合形式,這種形式試圖同時使用多種方法來提高精度和減少計算需求。多任務同時訓練網絡是深度學習中的一種常見做法,通常稱為多任務訓練或輔助任務訓練。這是為了避免過度擬合,這是神經網絡的一個常見問題。當一個機器學習算法為一個特定的任務訓練時,它可以變得如此專注于模仿它所訓練的數據,以至于當試圖進行插值或外推時,它的輸出變得不現實。通過在多個任務上訓練機器學習算法,網絡的核心將專門尋找對所有目的都有用的通用特征,而不是只專注于一個任務。這可以使輸出更真實,對應用程序更有用。為了使用這些算法,需要在表示真實場景的數據集上對它們進行訓練。對于任何機器學習過程,數據集的一部分用于培訓,另一部分用于驗證和測試。因此,許多數據集,包括街道對象的語義分割、標志分類、行人檢測和深度預測,已經被包括Aptiv、Lyft、Waymo和Baidu在內的研究人員和公司公開提供。這大大有助于推進機器學習算法的能力。收集數據的一種方法是使用原型車。這些汽車是由司機駕駛的。車上的感知傳感器用來收集有關環(huán)境的信息。同時,車載電腦將記錄來自踏板、方向盤的傳感器讀數,以及描述駕駛員行為的所有其他信息。由于需要由人類收集和標記大量數據,這是一個代價高昂的過程。特斯拉人工智能主管安德烈·卡普西(Andrej Karpathy)表示,他所在團隊的大部分工作都致力于獲得越來越好的數據。或者,也可以使用模擬器。”國家儀器公司(National Instruments)全球汽車戰(zhàn)略主管杰米·史密斯(Jamie Smith)表示:“目前的物理測試還不夠,因此需要進行虛擬測試?!薄_@降低了數據采集的成本,但也帶來了現實主義的問題:這些虛擬場景是由人類定義的,比真實車輛所經歷的隨機性小。在這一領域,有越來越多的研究稱之為虛擬到真實的轉換,研究在真實世界中傳遞在模擬中收集到的知識的方法利用來自傳感器和這些算法的所有數據,自動駕駛車輛可以檢測到周圍的物體。下一步,它需要規(guī)劃找到一條路徑。當車輛知道其環(huán)境中的物體及其位置時,可以使用voronoi圖(最大化車輛與物體之間的距離)、占用網格算法或駕駛走廊算法來確定車輛的大范圍路徑。但是,這些傳統(tǒng)方法不足以滿足車輛正在與周圍的其他移動對象交互,其輸出需要微調。一些自動駕駛汽車不僅依靠機器學習算法來感知環(huán)境,而且依靠這些數據來控制汽車。路徑規(guī)劃可以通過模仿學習教給CNN,CNN試圖模仿司機的行為。在更先進的算法中,使用DRL,其中獎勵以可接受的方式駕駛的自治系統(tǒng)。通常,這些方法與經典的運動規(guī)劃和軌跡優(yōu)化方法相結合,以確保路徑的魯棒性。此外,制造商還可以在模型試圖確定最佳路徑時考慮其他目標,如節(jié)能。在車輛運行過程中訓練神經網絡和推理需要巨大的計算能力。直到最近,大多數機器學習任務都是在基于云的基礎設施上執(zhí)行的,計算能力和冷卻能力都過大。對于自動駕駛車輛,這不再可能,因為車輛需要能夠同時對新數據作出反應。因此,操作車輛所需的部分處理需要在車上進行,而模型改進可以在云端進行。機器學習的最新進展集中在如何有效地處理由自動駕駛車輛上的傳感器產生的大量數據以降低計算成本上,使用諸如attention或core set等概念。此外,芯片制造和小型化的進展正在增加計算能力安裝在自主車輛上。隨著網絡協議的進步,汽車可能能夠依靠低延遲的基于網絡的數據處理來幫助他們進行自主操作。一輛車是如何根據這些信息行動的?在目前由人類駕駛的汽車中,車輛的轉向、制動或信號等動作通常由駕駛員控制。來自駕駛員的機械信號由電子控制單元(ECU)轉換為驅動指令,由汽車上的電動或液壓執(zhí)行器執(zhí)行。目前有少數車型包含線控驅動系統(tǒng),其中像方向盤柱這樣的機械系統(tǒng)被電子系統(tǒng)取代。在(半)自動汽車中,這種功能被直接與ECU通信的驅動控制軟件所取代。這可以提供改變車輛結構和減少部件數量的機會,特別是那些專門用于將駕駛員的機械信號轉換為ecu的電信號的部件。今天的車輛包含多個ECU,從標準車中的15-20個到高端車中的100個左右。ECU是一個簡單的計算單元,有自己的微控制器和內存,它使用這些處理輸入數據,將其輸入到它控制的子系統(tǒng)的輸出命令中,例如移動自動變速箱。一般來說,ecu可以負責控制車輛的操作、安全功能或運行信息娛樂和內部應用程序。大多數ecu支持單一應用程序,如電子動力轉向、本地運行算法和處理傳感器數據。不斷增長的需求和復雜性要求工程師為需要進行傳感器融合的系統(tǒng)設計正確的電子體系結構,同時以同步的方式將決策分發(fā)給執(zhí)行指令的較低級別子系統(tǒng)。理論上,在可能的設置的一個極端,可以選擇一個完全分布式的架構,其中每個傳感單元處理其原始數據并與網絡中的其他節(jié)點通信。在頻譜的另一端,我們有一個集中的體系結構,所有的遠程控制單元(RCU)都直接連接到一個中央控制點,該控制點收集所有信息并執(zhí)行傳感器融合過程。在這個頻譜的中間是混合解決方案,它將在更高抽象級別工作的中央單元與執(zhí)行專用傳感器處理和/或執(zhí)行決策算法的域結合起來。這些域可以基于車輛內的位置,例如車輛前部和后部的域、它們控制的功能類型或它們處理的傳感器類型(例如攝像頭)。在集中式體系結構中,來自不同傳感器的測量是獨立的量,不受其他節(jié)點的影響。數據在系統(tǒng)邊緣節(jié)點不被修改或過濾,為傳感器融合提供了最大可能的信息,并且具有低延遲。面臨的挑戰(zhàn)是,需要將大量數據傳輸到中央單位并在那里進行處理。這不僅需要一臺功能強大的中央計算機,還需要一個高帶寬的重型線束。今天的車輛包含超過一公里的電線,重數十公斤。分布式體系結構可以用較輕的電氣系統(tǒng)實現,但更復雜。雖然在這種架構中,與帶寬和集中處理相關的需求大大減少,但它在驅動和感知階段之間引入了延遲,并增加了數據驗證的挑戰(zhàn)。除了增加系統(tǒng)的復雜性之外,自動化還對車輛部件的功耗、熱管理、重量和尺寸提出了挑戰(zhàn)。無論體系結構是分布式的還是集中式的,自動駕駛系統(tǒng)的功率需求都是非常重要的。這方面的主要驅動力是計算需求,對于完全自主的汽車來說,計算需求很容易比目前生產中最先進的汽車高出100倍。自動駕駛汽車的這種動力饑渴增加了對電池性能和系統(tǒng)中半導體元件性能的要求。對于全電動汽車,行駛里程受到這一電力需求的負面影響。因此,像Waymo和福特這樣的一些公司選擇專注于混合動力汽車,而Uber則使用全汽油suv車隊。然而,專家指出,由于內燃機在產生用于車載計算的電力方面效率低下,全電動最終成為自動駕駛動力系統(tǒng)的首選。處理需求的增加和更高的功率吞吐量使系統(tǒng)升溫。為了使電子部件正??煽康毓ぷ?,它們必須保持在一定的溫度范圍內,而不管車輛的外部條件如何。冷卻系統(tǒng),特別是那些基于液體的冷卻系統(tǒng),可以進一步增加車輛的重量和尺寸。額外的部件、額外的布線和熱管理系統(tǒng)對減輕車輛任何部件的重量、尺寸和熱性能都施加了壓力。從減少大型部件(如激光雷達)的重量到微型部件(如構成電子電路的半導體部件),汽車部件供應商有很大的動力相應地改變其產品。半導體公司正在制造占地面積更小、熱性能更高、干擾更低的組件,同時實際上提高了可靠性。除了發(fā)展各種硅元件,如MOSFET、雙極晶體管、二極管和集成電路外,該行業(yè)還著眼于使用新型材料。基于氮化鎵(GaN)的元件被認為對未來的電子產品有很大的影響。與硅相比,氮化鎵能在給定的導通電阻和擊穿電壓下產生更小的器件,因為它能更有效地傳導電子。要執(zhí)行所有的算法和進程以實現自動駕駛,需要大量的計算,因此需要強大的處理器。一輛完全自主的汽車可能比迄今為止開發(fā)的任何軟件平臺或操作系統(tǒng)包含更多的代碼行。GPU加速處理是目前的行業(yè)標準,Nvidia是市場領導者。然而,越來越多的公司正在尋求不同的解決方案;Nvidia的大部分競爭對手都把他們的芯片設計集中在張量處理單元(TPU)上,這加速了張量運算,而張量運算是深度學習算法的核心工作量。另一方面,gpu是為圖形處理而開發(fā)的,因此阻止了深度學習算法充分利用芯片的能力。由此可見,隨著汽車自動化水平的提高,作為汽車軟件的體形都將發(fā)生顯著變化。除此之外,車輛中更大的自主性也會影響你作為用戶將如何與他們互動。凡本公眾號注明“來源:XXX(非智車科技)”的作品,均轉載自其它媒體,轉載目的在于傳遞和分享更多信息,并不代表本平臺贊同其觀點和對其真實性負責,版權歸原作者所有,如有侵權請聯系我們刪除?!?/section>
|