這個互聯(lián)網(wǎng)大廠,想為中國培養(yǎng)500萬AI人才。北京東南角的亦莊經(jīng)濟(jì)開發(fā)區(qū)的道路上,有不少頭頂類似攝像頭裝置的轎車往來穿梭。這景象看起來平平無奇,但這些車都有一個共同特點:不用司機(jī),自動駕駛。
重慶的一家“魚菜共生”工廠里,養(yǎng)大口黑鱸魚的廢水澆灌著碼放15層的韭菜、茼蒿,蔬菜栽培、病蟲害巡檢、魚生命體征監(jiān)測、魚餌投喂全部自動完成,人只需定期檢查維護(hù)設(shè)備。
云南麗江,在“城市大腦”的指揮下,數(shù)百個攝像頭自動識別、上報城市內(nèi)垃圾暴露、機(jī)動車違停、街面違規(guī)經(jīng)營等行為,大大提高城市治理的效率,降低了管理成本。
從智慧農(nóng)業(yè)到先進(jìn)制造,再到城市管理和智能交通,無人駕駛、無人工廠和智慧城市這些未來感十足的技術(shù)背后,都離不開一個“核心科技”——AI,也就是人工智能。雖然距離科幻作品中機(jī)器人滿街跑的時代仍有不短的距離,但最近幾年,AI正在各個場景實實在在地進(jìn)入人們的生活。
在AI落地的過程中,“人”,也就是訓(xùn)練、使用、操作AI的那些人,仍在起著至關(guān)重要的作用。而人社部在2021年7月發(fā)布的一份報告,卻揭示了一個令人擔(dān)憂的事實:目前,我國人工智能人才的供需比只有1:10,如果再不加強(qiáng)培養(yǎng),2025年的人才缺口將達(dá)到1000萬。
AI人才培養(yǎng)的數(shù)量和質(zhì)量,成了制約AI賦能當(dāng)代生產(chǎn)、生活的關(guān)鍵因素。
在國內(nèi),一批AI領(lǐng)域的探索者已經(jīng)注意到了這個問題,AI人才的培養(yǎng),開始漸漸走上正規(guī)。
2021年12月27-29日,百度舉辦了以“創(chuàng)造者精神”為主題的Create大會,其中,專門有一場論壇是留給AI人才培養(yǎng)的。在這場論壇中,“硅谷鋼鐵俠”馬斯克的母親梅耶·馬斯克對話百度女科學(xué)家,計算機(jī)C語言教學(xué)“開山鼻祖”譚浩強(qiáng)、前國家乒乓球領(lǐng)隊姚振緒以及來自大學(xué)校園的普通開發(fā)者都帶來了自己的分享。
本來,這些來自不同領(lǐng)域的人們可能不會產(chǎn)生聯(lián)系,但因為百度,他們走到了一起,共同探討AI人才發(fā)展的現(xiàn)實、路徑和未來。
在百度Create大會AI人才培養(yǎng)論壇上,來自孟加拉國的河南理工大學(xué)大四留學(xué)生尼希德展示了他的成果:
通過AI識別雞糞。
這項“成就”聽起來就充滿了鄉(xiāng)土的味道。2018年,尼希德來到中國讀大學(xué)。在老師的指導(dǎo)下,他走上了學(xué)習(xí)人工智能的道路,學(xué)習(xí)機(jī)器學(xué)習(xí)和推薦系統(tǒng)等課程。
學(xué)習(xí)的過程中,尼希德意識到,“要真正理解人工智能的意義,我們不僅要學(xué)習(xí)理論,還要將理論應(yīng)用到實際的生產(chǎn)生活中?!彼_始大量參加競賽,編程比賽、機(jī)器人比賽、創(chuàng)意課題展示......也在這些比賽中獲得了一些獎項。
后來,尼希德決定參加C4-AI大賽(中國高校計算機(jī)大賽-人工智能創(chuàng)意賽)。這是一個頗為權(quán)威的全國性大賽,由全國高等學(xué)校計算機(jī)教育研究會主辦,浙江大學(xué)、百度公司聯(lián)合承辦,競爭相當(dāng)激烈,很能體現(xiàn)選手的個人水平。
正當(dāng)尼希德為做什么而苦惱的時候,他的指導(dǎo)老師王春陽建議,“你為什么不試試用人工智能做一些你家鄉(xiāng)真正需要的東西?”
孟加拉國是個人口1.6億的南亞農(nóng)業(yè)國,但技術(shù)相對落后,每年約有30%的家禽因為疾病爆發(fā)而死亡,給當(dāng)?shù)鼐用竦纳a(chǎn)生活帶來巨大損失。
如果可以用AI自動識別雞糞便的形狀和顏色,也就意味著能夠自動判斷雞的健康狀況,而隨著技術(shù)的發(fā)展,鴨、鵝等禽類的健康狀況也可以進(jìn)行識別。這將有效地防止疾病在家禽中傳播,也可以將一部分勞動力從繁重的飼養(yǎng)工作中解放出來。
尼希德認(rèn)定,這是一個“家鄉(xiāng)真正需要的東西”。
他和兩位同樣來自孟加拉國的同學(xué)開始收集數(shù)據(jù),也就是雞糞的照片。這正是訓(xùn)練AI的原料。為了讓數(shù)據(jù)更準(zhǔn)確,要給每個數(shù)據(jù)打上兩三個標(biāo)簽。換算成時間,就是要“凝視”每張雞糞照片兩分鐘,而照片的總量接近1000張。將近一個半月,他們都在做這件事。
完成了數(shù)據(jù)的收集和標(biāo)注,就該百度“EasyDL”(百度大腦推出的零門檻AI開發(fā)平臺)上場了,借助它,開發(fā)者可以完成對雞糞的顏色、形狀和大小的分類,從而達(dá)到識別雞的健康狀況的目的。
“EasyDL降低了人工智能學(xué)習(xí)的門檻。在EasyDL上不需要很難的編碼,也不需要去構(gòu)建算法架構(gòu)。所以任何人都能通過這個平臺來實現(xiàn)自己的創(chuàng)意想法?!?/span>
在AI人才培養(yǎng)論壇上,尼希德用自己的親身經(jīng)歷如是說。對AI開發(fā)者如此友好的平臺,在國內(nèi)基本找不到競品,在國際上也只有谷歌一級的“大廠”才會提供類似服務(wù)。
尼希德在百度AI開發(fā)者大會人才論壇上演講
后來,這個AI雞糞識別項目,獲得了C4-AI大賽的二等獎。“回想我祖國,我認(rèn)為人工智能可以用于改善各行各業(yè)和日常生活,比如醫(yī)療、交通、農(nóng)業(yè)、電子商務(wù)、課堂管理等?!睂τ谀嵯5潞退淖鎳鴣碚f,AI的意義都相當(dāng)重大。
在尼希德的故事里,有一個人扮演了至關(guān)重要的角色,那就是他的中國大學(xué)老師王春陽。尼希德剛來到中國時,不懂中文,學(xué)習(xí)基礎(chǔ)也不如身邊的中國學(xué)生,AI上知識更是零基礎(chǔ)。
幸運的是,他的這位指導(dǎo)老師剛好參加過百度的深度學(xué)習(xí)培訓(xùn)。老師從百度那里取來了AI的火種,再把這火種傳遞給了尼希德。在老師的影響下,他有機(jī)會接觸并掌握了飛槳的使用;更幸運的是,百度飛槳EasyDL足夠“零門檻”,讓這個一開始連EasyDL界面都看不懂的外國人,做出了能在國內(nèi)大賽獲獎的項目,實現(xiàn)了AI技能的從零到一。
尼希德的故事還在續(xù)寫。河南理工大學(xué)的老師自發(fā)組織了一批孟加拉國學(xué)生,撰寫孟加拉語的EasyDL使用手冊。他想讓更多的孟加拉國學(xué)生,進(jìn)入百度AI的人才培養(yǎng)鏈條中,培養(yǎng)更多的尼希德。
百度的AI能力,也在幫助越來越多的開發(fā)者實現(xiàn)自己的“從零到一”。在百度飛槳開發(fā)者社區(qū)我們看到,開發(fā)者于航在PaddleLite主干網(wǎng)絡(luò)加入了超過10萬張口罩人臉數(shù)據(jù)進(jìn)行訓(xùn)練,將識別是否佩戴口罩的模型準(zhǔn)確度提升到了96.5%;開發(fā)者夏凡借助飛槳平臺開發(fā)了“鸚鵡識別”程序,能夠自動識別鸚鵡的保護(hù)級別和物種分類信息。
這些開發(fā)者的故事告訴我們,因為百度的AI能力,開發(fā)者AI學(xué)習(xí)的從零到一變得不再困難重重。
“這可以說是開掛了。”
在AI人才培養(yǎng)論壇上,大學(xué)生開發(fā)者高鴻志這樣形容百度飛槳平臺對于AI開發(fā)上的能力。
高鴻志就讀于東北大學(xué)自動化專業(yè),和尼希德一樣也在讀大四。他是甘肅省古浪縣人,家在騰格里沙漠邊緣。小時候,黃土漫天的沙塵暴給他留下了深刻印象。想要根除沙塵暴,治理荒漠化,必須多種抗風(fēng)沙的植物。但在沙漠中種樹談何容易,不僅需要在松散的沙地上費力挖坑,還要人力搬運樹苗和水。
“我們自動化學(xué)生的使命,不就是用機(jī)器去代替人工,完成那些艱苦的重復(fù)性勞動嗎?”
從小就對沙塵危害有著切膚之痛的高鴻志,迫切希望用智能機(jī)器更高效地種樹。他的目標(biāo)不僅僅是一個會挖坑填坑、會安插樹苗的簡單機(jī)器人,而是包括沙漠栽樹機(jī)器人、護(hù)養(yǎng)機(jī)器人集群以及控制它們的物聯(lián)網(wǎng),共同組成“栽、護(hù)、管”一體化的智能解決方案,真正實現(xiàn)用機(jī)器代替人工。
作為一名自動化專業(yè)的學(xué)生,高鴻志和他的伙伴們的長處是做硬件,組裝底盤、車輪、履帶、箱體,再把電路板一塊塊焊接到主體上,這都不是問題。
真正的考驗在于,如何給這臺栽樹機(jī)器人“賦予靈魂”,讓他真正智能起來?比如,機(jī)器人的護(hù)養(yǎng)模塊要精準(zhǔn)定位到每一顆樹苗,對視覺有著很高的要求。如何搭建目標(biāo)檢測模型,并進(jìn)行有針對性的訓(xùn)練?對于不太懂AI的高鴻志和他的伙伴們來說,這成了一個令人困擾的難題。
無意間,高鴻志在飛槳公眾號上看到開源工具“PaddleDetection”,它是一個相當(dāng)于0代碼的目標(biāo)檢測開發(fā)工具,只需要運行相應(yīng)的python文件,就可以實現(xiàn)模型訓(xùn)練、預(yù)測等功能。
這讓栽樹機(jī)器人的研發(fā)進(jìn)程,跨過了深度學(xué)習(xí)模型的搭建、訓(xùn)練和預(yù)測等一系列費時費力的步驟,開發(fā)者只需將自己的數(shù)據(jù)集處理成為規(guī)定格式,就可以輕松使用集成好的模型配置文件,一鍵運行腳本訓(xùn)練模型。
更令人驚喜的是,原本需要幾萬張數(shù)據(jù)才能達(dá)到的效果,現(xiàn)在通過套件內(nèi)部集成的超大規(guī)模預(yù)訓(xùn)練模型做遷移學(xué)習(xí)后,預(yù)計只用1000張左右的數(shù)據(jù),就能達(dá)到95%以上的準(zhǔn)確率了。這讓開發(fā)者可以集中精力尋找數(shù)據(jù)集。
飛槳提供給開發(fā)者的還不止工具上的便利,在數(shù)據(jù)收集上,飛槳開發(fā)者社區(qū)同樣助力良多。因為疫情,高鴻志他們沒法去沙漠實地拍攝梭梭苗的數(shù)據(jù)集。抱著試一試的心態(tài),他在飛槳開發(fā)者社區(qū)求助,希望能找到住在沙漠附近的開發(fā)者幫忙采集數(shù)據(jù)。通過飛槳的工作人員,高鴻志果然聯(lián)系到一位住在甘肅省民勤縣的開發(fā)者,一次性幫搜集了一千多張沙漠植株的數(shù)據(jù)集,解決了這個大問題。
之后,高鴻志和他的同伴用百度大腦的開源工具Easydata做智能標(biāo)注,2個小時就標(biāo)注了1000多張數(shù)據(jù);用PaddleDetection做模型訓(xùn)練,2天時間,識別率就達(dá)到95%。
測試中的沙漠種樹機(jī)器人
在學(xué)校的沙地上,這款栽樹機(jī)器人開始了第一次落地實驗。它的履帶碾過沙土,樹苗真的可以一束一束種到沙土里。在經(jīng)過幾個版本的迭代之后,這款機(jī)器人已經(jīng)具備種樹、養(yǎng)護(hù)、避障等功能,并有自己適配的控制系統(tǒng)、AI感知能力和云端數(shù)據(jù)監(jiān)測系統(tǒng)。
當(dāng)開發(fā)者完成了從零到一的“入門”,進(jìn)入了AI人才鏈條,如何面對更進(jìn)一步的AI實戰(zhàn)?高鴻志用自己的故事給出了這個問題的答案。在飛槳平臺的支持下,更多學(xué)科與AI結(jié)合的可操作性變得更強(qiáng)、成本更低,助力更多學(xué)科背景的開發(fā)者攻克AI技術(shù)的應(yīng)用難點,提升使用AI技術(shù)的效率。
對于一些傳統(tǒng)型企業(yè)來說,百度的AI能力同樣能夠加速智能設(shè)備的研發(fā),幫助企業(yè)的開發(fā)者跨越AI技術(shù)障礙。比如,中國南方電網(wǎng)的技術(shù)攻關(guān)團(tuán)隊就引入飛槳深度學(xué)習(xí)開源框架,為智能巡檢機(jī)器人提供視覺賦能,用機(jī)器人巡視代替了原有的人工巡視,大大降低了運維成本、提升了企業(yè)的智能管理水平。
當(dāng)AI走進(jìn)行業(yè),有多強(qiáng)?AI技術(shù)總要走出實驗室和比賽場,在行業(yè)前沿發(fā)揮作用。曾經(jīng)傳統(tǒng)的體育行業(yè),已經(jīng)是AI技術(shù)發(fā)揮作用的前沿領(lǐng)域。
比如在中國的體育強(qiáng)項乒乓球運動上,百度AI大有希望通過賦能乒乓球訓(xùn)練的方式,讓乒乓球運動員的技戰(zhàn)術(shù)水平和臨場應(yīng)變能力更上一層樓。
前國家乒乓球領(lǐng)隊姚振緒告訴刺猬公社(ID:ciweigongshe),他們正在和百度合作,試圖通過AI對運動動作進(jìn)行精確識別、統(tǒng)計,根據(jù)統(tǒng)計數(shù)據(jù)對比賽的得失做出判斷。
對于乒乓球訓(xùn)練而言,這些數(shù)據(jù)在經(jīng)過研究之后,可以幫助運動員發(fā)現(xiàn)動作的準(zhǔn)確與否、發(fā)力早晚,甚至幫助運動員判斷如何正確地把力量集中到球上,通過合適的摩擦制造出正確的弧線,提高擊球的成功率。
過去,這樣的統(tǒng)計只能用人工的方式完成。這就造成了兩個弊端。一是慢,由于乒乓球的瞬間變化很多,記錄者很難在短時間內(nèi)進(jìn)行統(tǒng)計,因此無法作為臨場應(yīng)變的依據(jù);二是不夠準(zhǔn)確,姚振緒舉了一個例子,有時候人工往往只記錄最后一板球的失分,卻不能發(fā)現(xiàn),這次失分是因為之前的某一板球就出現(xiàn)了失誤,從而導(dǎo)致被動造成失分。
如果能用機(jī)器解決人工統(tǒng)計慢和不準(zhǔn)的問題,對于乒乓球運動員的訓(xùn)練和比賽,將具有相當(dāng)大的指導(dǎo)意義:在比賽時,運動員可以根據(jù)數(shù)據(jù)反饋調(diào)整技戰(zhàn)術(shù)和心態(tài);訓(xùn)練時,也可根據(jù)反饋規(guī)范動作、強(qiáng)化練習(xí)等等。
但其實現(xiàn)難度同樣可想而知。
首先,由于動作識別一般基于比賽轉(zhuǎn)播畫面,乒乓球運動員時而面對攝像頭、時而背對攝像頭,容易遮擋動作識別;其次,運動員動作持續(xù)時間短且連續(xù)、密集,不同的技術(shù)動作,可能只有手腕擺動的角度和幅度的不同,同一種技術(shù)動作,不同運動員的揮拍路線也不盡相同,因此實現(xiàn)精確定位相當(dāng)困難。
想要提高識別精度,僅僅數(shù)據(jù)標(biāo)注這一環(huán)節(jié)就相當(dāng)“專業(yè)”,需要標(biāo)注者懂乒乓球技術(shù)。參與此次項目的知名乒乓球裁判吳飛向刺猬公社表示,對于一場比賽,她需要從發(fā)球時選手用的是側(cè)旋發(fā)球還是逆旋發(fā)球,對局中的擺短、劈長等等一一標(biāo)注,后來為了加快速度,他們還邀請了一批體育大學(xué)的研究生去做數(shù)據(jù)集的標(biāo)注工作。
而當(dāng)吳飛看到項目的Demo時,第一感覺是“驚艷”。那是一場馬龍對陣樊振東的比賽,統(tǒng)計精度可以細(xì)化到每一板球的得失分和具體的技術(shù)動作,比如是搓球還是進(jìn)攻,是正手拉還是反手拉等等。它的精度也相當(dāng)高,起止回合準(zhǔn)確率達(dá)到97%以上,動作識別達(dá)到了80%以上。
吳飛在百度AI開發(fā)者大會人才論壇上演講
這,是吳飛和百度的工程師們經(jīng)過50多次實驗,嘗試了20多種優(yōu)化策略組合之后的的成果。曾經(jīng)以為AI離自己很遠(yuǎn)的吳飛,也借助百度飛槳平臺的AI能力,從乒乓球裁判、技戰(zhàn)術(shù)分析的科研人員成長為AI開發(fā)者。
“現(xiàn)在已經(jīng)進(jìn)行了大量的技術(shù)動作的分析和判斷,找出同樣效果且略有差別的動作,把這些動作分別歸類整理。”姚振緒說,“百度的年輕AI工作者接受這個挑戰(zhàn),無數(shù)次地、不厭其煩地去識別一個個動作?!?/span>
姚振緒還表示,AI技術(shù)和體育運動的技術(shù)結(jié)合是當(dāng)今的潮流和趨向,也是體育科技的高地?!澳囊粋€國家把這方面的工作做在前面、做好了,一定對這個國家的體育運動有很大的幫助?!?br>
而當(dāng)技術(shù)進(jìn)一步成熟,AI技術(shù)還能用在指導(dǎo)普通乒乓球愛好者的訓(xùn)練上,助力全民健身。吳飛告訴刺猬公社,當(dāng)更多“動作庫”建立之后,AI可以向乒乓球愛好者提供反饋,對比糾正動作,比如手腕、肘肩的走向和位置等等。
除了乒乓球,百度AI還助力了我國另一個體育強(qiáng)項——跳水。在百度和國家跳水隊的合作中,AI技術(shù)能夠?qū)τ?xùn)練視頻進(jìn)行摘要、動作抽取、姿勢糾正等處理,快速整理歸納,方便對運動員的姿勢、動作等進(jìn)行針對性的指導(dǎo),也可以在賽前集中回顧、觀看。在奧運會賽前幾個月的訓(xùn)練中,這套AI技術(shù)輔助運動員的訓(xùn)練效率提升了20%。
百度的AI能力正在行業(yè)前沿不斷突破,這個體系培養(yǎng)出的AI人才,也正在為一個又一個傳統(tǒng)行業(yè)帶來新的可能——從制造業(yè)、農(nóng)業(yè)的智能化轉(zhuǎn)型到城市管理、金融服務(wù)的智慧升級,擁有了良好的AI人才基礎(chǔ)。
“未來5年為社會培養(yǎng)500萬AI人才”,在Create2021AI人才分論壇上,百度CTO王海峰再次提及這一目標(biāo)。通過建設(shè)飛槳教育生態(tài)、成立百度松果學(xué)堂,百度將持續(xù)助力優(yōu)秀AI人才的成長,“人人皆可成才”,培養(yǎng)懂技術(shù)、有產(chǎn)業(yè)實踐經(jīng)驗的復(fù)合型AI人才。
助力大批AI人才成長的百度,也將在“智能時代”里成為不可或缺的人才源泉,發(fā)揮出越來越大的影響力。