模擬幾十年比賽
科技日?qǐng)?bào)北京9月1日電 (記者劉霞)在短短幾周內(nèi),人工智能(AI)通過模擬數(shù)十年足球比賽的情況,學(xué)會(huì)了熟練地控制數(shù)字人形足球運(yùn)動(dòng)員,相關(guān)研究發(fā)表于最新一期的《科學(xué)·機(jī)器人》雜志。 AI研究公司“深度思維”的研究人員利用一種加速版運(yùn)動(dòng)課程,通過計(jì)算機(jī)模擬訓(xùn)練AI踢足球,類似于將人類嬰兒培養(yǎng)為足球運(yùn)動(dòng)員。結(jié)果顯示,AI能很好地控制代表它的數(shù)字人形機(jī)器人,該數(shù)字人形機(jī)器人被設(shè)定為真實(shí)身體質(zhì)量和關(guān)節(jié)運(yùn)動(dòng)。 “深度思維”公司研究人員表示:“我們不會(huì)讓嬰兒參加11對(duì)11的比賽,他們得先學(xué)會(huì)四處走動(dòng),然后學(xué)會(huì)運(yùn)球,然后再玩1對(duì)1或2對(duì)2比賽?!?/p> 課程的第一階段是模仿人類踢足球的視頻剪輯,訓(xùn)練數(shù)字類人機(jī)器人自然奔跑。第二個(gè)階段則通過一種試錯(cuò)機(jī)器學(xué)習(xí)的形式來練習(xí)運(yùn)球和射門。 前兩個(gè)階段代表了大約1.5年的模擬訓(xùn)練時(shí)間,AI能在大約24小時(shí)內(nèi)快速完成。模擬5年的足球比賽后,AI開始表現(xiàn)出運(yùn)動(dòng)和控球之外更復(fù)雜的行為。研究人員稱:“機(jī)器人學(xué)會(huì)了協(xié)調(diào),也學(xué)會(huì)了我們以前沒有明確設(shè)定為訓(xùn)練內(nèi)容的動(dòng)作技能?!钡谌A段的訓(xùn)練則讓數(shù)字人形機(jī)器人參與2對(duì)2比賽。 在耗時(shí)2—3周,學(xué)習(xí)了20—30年的比賽數(shù)據(jù)后,AI學(xué)會(huì)了團(tuán)隊(duì)合作技能,例如預(yù)測(cè)在哪里傳球等。 不過,這種模擬并不意味著科學(xué)家們可以很快研制出能踢足球的機(jī)器人。研究人員表示,漫長(zhǎng)的學(xué)習(xí)時(shí)間使工作更難以直接轉(zhuǎn)移到真正的足球機(jī)器人上,但看看“深度思維”公司的方法在年度機(jī)器人杯3D模擬聯(lián)盟中是否具有競(jìng)爭(zhēng)力,也是一件有趣的事。 據(jù)悉,“深度思維”團(tuán)隊(duì)已經(jīng)開始教真正的機(jī)器人如何將球推向目標(biāo),并計(jì)劃研究這種AI訓(xùn)練策略是否適用于足球以外的領(lǐng)域。 總編輯圈點(diǎn) 雖然足球網(wǎng)絡(luò)游戲很常見,但這和一個(gè)人工系統(tǒng)真正走向人類水平的運(yùn)動(dòng)還是有一定差距的。因?yàn)槿祟惪此谱匀坏奶咔蜻\(yùn)動(dòng),跨越了從肌肉到認(rèn)知、到?jīng)Q策、再到行為,非常多的組織層次,而在空間和時(shí)間上模擬并表現(xiàn)它們,正是AI長(zhǎng)期面臨的巨大挑戰(zhàn)。本文的成果是一個(gè)此類研究非常完美的案例,不過看完這條消息,大家應(yīng)該還有個(gè)疑問:如果通過合適的訓(xùn)練,人工系統(tǒng)都能從“小白”變成“優(yōu)秀球員”,有些足球隊(duì)能不能也有所感悟呢? 《科技日?qǐng)?bào)》2022年9月2日第 7 版) |
|