你追我趕!英偉達(dá)、Meta同日宣布機(jī)器人重磅成果 原創(chuàng) 2023-10-21 18:11 星期六 科創(chuàng)板日報 宋子喬 ①英偉達(dá)開發(fā)的AI代理Eureka引入大模型參與訓(xùn)練,可以教會機(jī)器人復(fù)雜的運(yùn)動控制技能,Meta Habitat 3.0模擬器可教授機(jī)器人如何與物理世界進(jìn)行交互; ②英偉達(dá)深耕運(yùn)動控制,Meta注重交互能力,這兩大能力正是機(jī)器人進(jìn)入千家萬戶的前提。 《科創(chuàng)板日報》10月21日訊(編輯 宋子喬) 如今,科技巨頭主動肩負(fù)起機(jī)器人研發(fā)的重任,正你追我趕奔赴下一場科技盛宴。當(dāng)?shù)貢r間10月20日,英偉達(dá)、Meta各自發(fā)布了重磅機(jī)器人訓(xùn)練工具。 英偉達(dá)開發(fā)的AI代理Eureka可以教會機(jī)器人復(fù)雜的運(yùn)動控制技能,比如轉(zhuǎn)筆、打開抽屜和柜子、拋球和接球、操作剪刀。英偉達(dá)稱這一突破將重新定義機(jī)器學(xué)習(xí)。 Meta則推出了Habitat 3.0模擬器,可教授機(jī)器人如何與物理世界進(jìn)行交互,Meta將其稱為“社交智能機(jī)器人研發(fā)路上的里程碑”。 究竟是什么樣的工具?新成果的意義何在? ▌英偉達(dá)Eureka——大模型參與訓(xùn)練機(jī)器人 Eureka的全稱是Evolution-driven Universal Reward Kit for Agent,本質(zhì)是一種由大模型驅(qū)動的算法生成工具。借助GPT-4寫代碼的能力,Eureka擁有了出色的獎勵函數(shù)設(shè)計能力,可以自主編寫?yīng)剟钏惴▉碛?xùn)練機(jī)器人。 Eureka的關(guān)鍵所在,是通過上下文來實現(xiàn)了人類水平的獎勵算法設(shè)計。簡單來說,就是用GPT-4的零樣本生成、代碼編寫以及上下文改進(jìn)功能,對獎勵執(zhí)行策略進(jìn)行優(yōu)化,由此通過強(qiáng)化學(xué)習(xí)來進(jìn)行復(fù)雜的技能。 英偉達(dá)稱,在29種不同的開源強(qiáng)化學(xué)習(xí)(RL)環(huán)境中,Eureka獎勵設(shè)計的性能達(dá)到了人類水平,這些環(huán)境包括10種不同的機(jī)器人形態(tài)(四足機(jī)器人、四旋翼機(jī)器人、雙足機(jī)器人、機(jī)械手以及幾種靈巧手)。在沒有任何特定任務(wù)提示或獎勵模板的情況下,Eureka生成的獎勵程序在超過80%的任務(wù)上優(yōu)于專家編寫的獎勵程序。這使得機(jī)器人的平均性能提高了50%以上。 機(jī)器人通過Eureka學(xué)會了轉(zhuǎn)筆、拋接球、打開柜子(注:這些機(jī)械手指上下翻飛的場景,暫時僅限于虛擬環(huán)境)人形機(jī)器人通過Eureka學(xué)習(xí)跑步步態(tài)英偉達(dá)這項研究由其與賓夕法尼亞大學(xué)、加州理工學(xué)院、德州大學(xué)奧斯汀分校的研究人員合作完成。目前該項目完全開源。 在機(jī)器人領(lǐng)域,有一個“莫拉維克悖論”——人類所獨(dú)有的高階智慧能力只需要非常少的計算能力,但無意識的技能和直覺(如辨識人臉、舉起鉛筆、在房間內(nèi)走動、回答問題等能力)卻需要極大的運(yùn)算能力,即越簡單的事情越難,越難的事情越簡單。 這也是為什么人類早已創(chuàng)造出打敗世界頂級棋手的AlphaGo,卻仍不能讓機(jī)器人擁有像兩三歲小孩一樣的感知力和行動力。 英偉達(dá)的最新成果展示了大模型在機(jī)器人精細(xì)化控制方面的作用,在英偉達(dá)的推動下,更智能的機(jī)器學(xué)習(xí)方式有望被迅速引入工業(yè)和消費(fèi)應(yīng)用領(lǐng)域。 ▌Meta Habitat——人機(jī)交互直指具身智能 Meta的Habitat同樣為訓(xùn)練機(jī)器人而生。據(jù)介紹,Habitat 3.0是第一個支持在多樣化、逼真的室內(nèi)環(huán)境中,就人機(jī)交互任務(wù)進(jìn)行大規(guī)模訓(xùn)練的模擬器。 具體來看,Habitat 3.0可以利用紅外捕捉系統(tǒng)精心構(gòu)建一個虛擬環(huán)境,如辦公空間、住宅和倉庫等,其中物體的形狀和大小完全復(fù)制現(xiàn)實世界,該工具還可在外貌和姿勢上對人類進(jìn)行真實的模擬,支持從簡單(如行走和揮手)到復(fù)雜(如與物體交互)等各種類型的動作,還可模擬多種真實的社交場景。 機(jī)器人和人形化身同處一個空間,且虛擬環(huán)境中的人形化身既可由算法控制,也可由真人通過鍵盤、鼠標(biāo)以及VR頭顯等進(jìn)行控制。網(wǎng)上已經(jīng)有人期待在Meta Quest VR中體驗Habitat 3.0了。 Meta的目的很明確——通過Habitat 3.0,讓AI智能體在真實世界和人類互動。 值得注意的是,與真實世界進(jìn)行交互正是實現(xiàn)具身智能的基礎(chǔ),正如Meta的AI研究部門(FAIR)所說,Habitat 3.0等新產(chǎn)品的發(fā)布代表了他們在具身智能方面的進(jìn)步。 FAIR表示,Habitat 3.0將把機(jī)器人AI代理的學(xué)習(xí)時間從幾個月甚至幾年縮短到幾天。它還能在安全的模擬環(huán)境中更快速地測試新模型,不會有任何風(fēng)險。 在推出Habitat 3.0的同時,Meta還宣布發(fā)布Habitat合成場景數(shù)據(jù)集(Habitat Synthetic Scenes Dataset),這是一個由藝術(shù)家撰寫的三維數(shù)據(jù)集,可用于訓(xùn)練人工智能導(dǎo)航代理;同時還發(fā)布了Home Robot,這是一個機(jī)器人助手軟硬件平臺,可在模擬和真實環(huán)境中使用。 英偉達(dá)深耕運(yùn)動控制,Meta注重交互能力,這兩大能力正是機(jī)器人進(jìn)入千家萬戶的前提。 華為“天才少年”稚暉君離開華為后奔赴機(jī)器人創(chuàng)業(yè),他曾在其機(jī)器人產(chǎn)品首秀上引用一個網(wǎng)絡(luò)段子:我們想讓AI做的事,是做飯、打掃房間、洗衣服、扔垃圾,然而它們實際在做的事,是聊天、繪畫、寫作、作曲、打游戲…… 工業(yè)機(jī)器人已經(jīng)愈發(fā)普及的當(dāng)下,如何讓機(jī)器人成為普通家庭的助手、日常生活中的伙伴,已經(jīng)成為新的科技熱點(diǎn)。 一個包攬家務(wù)活、零碎事的家用機(jī)器人,距離我們還有多遠(yuǎn)呢? 收藏 閱32.84W |
|
來自: 白雪詩 > 《新技術(shù)革命》