2016 年 4 月 9 日 0 點(diǎn) 04 分,《我是歌手》第四季總決賽在湖南衛(wèi)視落下帷幕,賽前被廣泛看好的 CoCo 李玟奪得了總冠軍。但當(dāng)天,我們在記住了李玟的歌聲以外,還被另一個意外出現(xiàn)的事件所吸引,那就是阿里云小 Ai。 雖然在賽前它們給出的預(yù)測結(jié)果宣稱韓國歌手黃致列將會奪冠,這與最后的結(jié)果并不相符;但隨著比賽的激烈進(jìn)行,各種數(shù)據(jù)和信息都在發(fā)生著變化,在第一輪淘汰之后的幾次預(yù)測中,阿里云小 Ai 都表現(xiàn)出了比較精準(zhǔn)的結(jié)果,并且在最終的三選一中成功預(yù)測到了李玟的奪冠。 4 個月之后,在 8 月的阿里巴巴云棲大會上,這個一戰(zhàn)成名的人工智能程序也進(jìn)行了改版升級,變身成了「阿里云 ET」。 但相比于競爭對手百度在人工智能領(lǐng)域的頻頻發(fā)聲,阿里云 ET 雖然登上了《我是歌手》的舞臺,并且還在雙十一晚會上變了魔術(shù),不過在外界看來,百度仍然是中國人工智能領(lǐng)域的領(lǐng)頭羊。外媒 Fast Company 就在去年年底將百度排在最具創(chuàng)新的 AI 和機(jī)器學(xué)習(xí)企業(yè)榜單第三位,僅次于 Google 和 IBM,也是唯一入選此榜單的中國企業(yè)。 但事實(shí)真的是如此嗎?在阿里巴巴看來,人工智能技術(shù)在它們的未來戰(zhàn)略中究竟處于何種位置?阿里的人工智能研究重點(diǎn)到底在哪邊? 近日,極客公園帶著這些問題拜訪了阿里云 ET 的相關(guān)研究人員,我們將會帶著大家一起來看看人工智能這個備受矚目的技術(shù)領(lǐng)域在這家中國互聯(lián)網(wǎng)巨頭中的存在形態(tài)。 時機(jī)到了就回來2008 年,已經(jīng)在微軟亞洲研究院擔(dān)任常務(wù)副院長的王堅(jiān)博士回到了杭州,加入了阿里巴巴集團(tuán),其時,阿里云還未成立。一年之后,阿里云正式成立,王堅(jiān)成為其掌舵者。這時,面對新的局面,他也需要幫手,于是他找來了自己之前在微軟的同事初敏。 加入阿里之前,初敏在微軟亞洲研究院工作了近 10 年,創(chuàng)建并領(lǐng)導(dǎo)了其中的語音合成研究小組,她自己也是智能語音領(lǐng)域的專家。現(xiàn)在,她負(fù)責(zé)領(lǐng)導(dǎo)阿里云在智能語音方面的工作。 事實(shí)上,雖然「人工智能」這個技術(shù)領(lǐng)域目前主要被放在阿里云的體系下,但在幾年以前,阿里內(nèi)部已經(jīng)在各個業(yè)務(wù)線上開始了初步的試探。「阿里(的人工智能部分)實(shí)際上到云上去的時間開始得挺晚的,我們從 2014 年下半年才開始搞的」,初敏說道,在此之前,她已經(jīng)零零星星在阿里內(nèi)部的翻譯、輸入法以及電商方面做了好幾年的工作。 阿里云 iDST 技術(shù)總監(jiān)、阿里云語音團(tuán)隊(duì)負(fù)責(zé)人初敏 與百度相比,阿里大規(guī)模進(jìn)入人工智能領(lǐng)域的動作還是晚了不少。早在 2013 年年初,百度就成立了百度深度學(xué)習(xí)研究院(Institute of Deep Learning,IDL),并在三個月之后在硅谷成立了硅谷人工智能實(shí)驗(yàn)室。 在當(dāng)時,「人工智能」這個概念在業(yè)界方興未艾,大公司中,除了百度,還很少有公司能這么早就進(jìn)行系統(tǒng)性的布局。但就像初敏所說的:「在這個行業(yè)里,其實(shí)什么人工智能熱不熱跟我們沒有關(guān)系,對技術(shù)人來講是持續(xù)的、一直都在做的。外面的熱是輿論上面的」,在背后,不管是阿里還是其他人,技術(shù)的積累和發(fā)展一直都在默默地發(fā)生。 很快,隨著業(yè)界對人工智能領(lǐng)域在未來的不斷看好,很多人的都意識到,就這項(xiàng)技術(shù)來說,如果你失去了這塊領(lǐng)地,那你也將失去未來。所以,大約從 14 年開始,阿里陸陸續(xù)續(xù)找來了不少人工智能領(lǐng)域的世界級專家,開始系統(tǒng)性布局人工智能領(lǐng)域。 作為世界級的數(shù)據(jù)科學(xué)家,閔萬里在 2013 年 9 月通過獵頭的渠道回國加入了阿里,目前他是阿里云大數(shù)據(jù)孵化器團(tuán)隊(duì)的負(fù)責(zé)人。在談到回國的原因時,他表示主要是因?yàn)?strong>「發(fā)現(xiàn)阿里這邊數(shù)據(jù)非常大,而且數(shù)據(jù)種類也很豐富,比亞馬遜+eBay+PayPal 還多」。 有相似經(jīng)歷還有視覺團(tuán)隊(duì)的華先勝博士。自 2001 年從北京大學(xué)畢業(yè)之后,華先勝就一直在微軟工作,一待就是 14 年。2015 年年初,因?yàn)榘⒗锏难?,華先勝從西雅圖回到了國內(nèi),加入了阿里巴巴。目前他則是阿里云視覺計(jì)算團(tuán)隊(duì)的負(fù)責(zé)人。 阿里云視覺計(jì)算團(tuán)隊(duì)的負(fù)責(zé)人華先勝 從 13 年開始,阿里巴巴陸續(xù)從世界各大頂尖團(tuán)隊(duì)挖來了多位世界級人工智能專家,美國密歇根州立大學(xué)終身教授金榕,麻省理工學(xué)院博士、普渡大學(xué)終身教授漆遠(yuǎn)都是在那段時間從美歸來,加入了阿里。而就在本周,阿里再次拋出了一個重磅消息:亞馬遜公司資深主任科學(xué)家任小楓正式加盟阿里巴巴,擔(dān)任人工智能核心團(tuán)隊(duì) iDST 的副院長和首席科學(xué)家。 這一切都顯示,阿里已經(jīng)成為了人工智能的人才爭奪戰(zhàn)中一支重要的力量。 一切從場景中長出來事實(shí)上,在 13 年之前,「人工智能」作為一個學(xué)術(shù)名詞還停留在很多學(xué)術(shù)機(jī)構(gòu)和大公司的實(shí)驗(yàn)室中,工業(yè)界還遠(yuǎn)未像今天這般重視這個技術(shù)領(lǐng)域,不過阿里在自己的專業(yè)領(lǐng)域——電商部門——已經(jīng)初步有了一些智能化的雛形。 「你知道有的賣家的商品圖片都是像牛皮癬一樣,上來貼滿了狗皮膏藥,這種就不好了。怎么識別呢?其實(shí)就是人工智能的方法去識別,只是在三年前大家沒有那么強(qiáng)調(diào)人工智能,實(shí)際上我們已經(jīng)在做了。所以我們當(dāng)時做了一些圖片精美度的模型來看這個圖片是否優(yōu)美、是否違規(guī),然后再基于這些判斷這個商品是不是一個精品」,閔萬里說道。 阿里云大數(shù)據(jù)孵化器團(tuán)隊(duì)的負(fù)責(zé)人閔萬里 閔萬里現(xiàn)在是阿里云大數(shù)據(jù)孵化器團(tuán)隊(duì)的負(fù)責(zé)人,回國之前,他先后在 IBM Watson 研究所和 Google 從事人工智能方面的研究工作。在他看來,阿里的人工智能是「從場景當(dāng)中長出來的」,而這可能也是他們和其他公司的區(qū)別之一。 而在智能語音團(tuán)隊(duì)的初敏看來,阿里作為一家以電商立足的公司,「接地氣」是阿里做人工智能最大的特點(diǎn)。在這里,「接地氣」的意思就是「從下面的基礎(chǔ)業(yè)務(wù)部門開始推動」。
他們二者的觀點(diǎn)似乎是相同的,即阿里的人工智能都是從日常的應(yīng)用場景而來,通過解決一個個技術(shù)難題慢慢走到了今天。 視覺團(tuán)隊(duì)的華先勝也贊同這個觀點(diǎn),作為圖像搜索領(lǐng)域的世界級專家,他覺得圖像搜索技術(shù)最合適的場景就是電商。
為此,華先勝離開了微軟來到了全世界最大的電商平臺阿里巴巴,并且在一開始并沒有加入阿里云團(tuán)隊(duì),而是進(jìn)入了電商團(tuán)隊(duì)的搜索事業(yè)部。在那里,他主要負(fù)責(zé)的項(xiàng)目就是淘寶 App 中的「拍立淘」功能。 手機(jī)淘寶中的拍立淘 「拍立淘」可以讓用戶通過拍照的方式實(shí)現(xiàn)「以圖搜圖」,以此來解決用戶在不知道商品名稱的情況下購買的問題。在此之前,淘寶其實(shí)已經(jīng)有這個產(chǎn)品了,但是離用戶的期望還差得很遠(yuǎn)。而華先勝通過一年多的工作讓這項(xiàng)功能有了很大的提高,2015 年雙十一當(dāng)日,拍立淘的使用量超過千萬。 上云在搜索部門做了一年多之后,華先勝離開了那里,加入了阿里云。當(dāng)時,云計(jì)算剛剛興起不久,需求量逐步增加,「當(dāng)時也是看到這個需求,我就過來了,其實(shí)后面的需求遠(yuǎn)遠(yuǎn)超過我所看到的?!?/p> 與他相似的還有閔萬里,這位在剛剛進(jìn)入阿里時也加入了電商部門做數(shù)據(jù)挖掘的科學(xué)家同樣在不久之后轉(zhuǎn)入了阿里云的體系。所有的一切都顯示:阿里巴巴這家公司的人工智能技術(shù)被放到了阿里云的體系下去做。 事實(shí)上,作為國內(nèi)最大的競爭對手,百度一直將人工智能作為自己未來最重要的核心戰(zhàn)略,在 2013 年成立了北京和硅谷人工智能實(shí)驗(yàn)室之后,還早早從斯坦福大學(xué)挖來了世界級科學(xué)家吳恩達(dá)擔(dān)任首席科學(xué)家。 相比之下,人工智能「僅僅」作為阿里云體系下的一個分支領(lǐng)域,似乎在阿里巴巴內(nèi)部不夠受到重視,真的是這樣嗎? 在初敏看來,隨著 PC 被大量的移動設(shè)備代替以后,移動設(shè)備上面語音就是最好的入口,因?yàn)樗械妮斎敕椒ɡ锩嬷挥姓Z音是最簡單的。但在這背后,其實(shí)所有的事都發(fā)生在云上。 而這「背后的事」主要有兩方面:強(qiáng)大的計(jì)算能力以及廣泛的應(yīng)用場景。
目前,阿里云在自己的平臺上開放了多個相關(guān)的 API,比如人臉識別、智能語音交互等等。外部的創(chuàng)業(yè)公司可以通過使用阿里云的服務(wù)免去自己開發(fā)的相關(guān)步驟,而他們在使用過程中產(chǎn)生的數(shù)據(jù)經(jīng)過回流還可以讓阿里云 ET 變得更聰明,「這其實(shí)是個雙贏的事情?!?/p> 將人工智能與「云」結(jié)合起來的戰(zhàn)略還體現(xiàn)在云 OS 操作系統(tǒng)上。目前,據(jù)初敏透露,阿里云智能語音團(tuán)隊(duì)很大的一塊工作就是跟云 OS 進(jìn)行深度合作,因?yàn)椤冈?OS 的操作系統(tǒng)是支持多端的,這里面云能力也是需要多端的,而且應(yīng)該是多端打通的」。 不過,在采訪中,阿里云的相關(guān)工作人員也表示「人工智能」在阿里內(nèi)部的地位未來還會再提高。雖然截至本文發(fā)表當(dāng)天還沒有確切的相關(guān)消息,但就在今年年初的阿里巴巴集團(tuán)首屆技術(shù)大會上,馬云宣布將建立阿里巴巴的『NASA』,「面向機(jī)器學(xué)習(xí)、芯片、IoT、操作系統(tǒng)、生物識別這些核心技術(shù)組建嶄新的團(tuán)隊(duì),建立新的機(jī)制和方法。」 但無論未來人工智能被阿里提到哪一個層級,阿里云都會是其中重要的一環(huán)。 要做平臺「蘋果會說自己在人工智能行業(yè)是『second to none』,你們會怎么評價自己?」 「其實(shí)從技術(shù)上來講,各家都有特色,或者說側(cè)重點(diǎn)不一樣。但是從人工智能在業(yè)務(wù)領(lǐng)域、垂直行業(yè)的創(chuàng)新上來說,我覺得阿里巴巴現(xiàn)在應(yīng)該走在全球的最前面?!拱⒗镌拼髷?shù)據(jù)孵化器團(tuán)隊(duì)的負(fù)責(zé)人閔萬里說道。 因?yàn)樽约簬ьI(lǐng)的既是一個技術(shù)團(tuán)隊(duì),同時還是一個業(yè)務(wù)落地的團(tuán)隊(duì),所以閔萬里需要承擔(dān)商業(yè)方面的 KPI 指標(biāo),但這也讓他和阿里云人工智能的落地情況有了更深的了解。他同時認(rèn)為,阿里和其他公司在人工智能方面的最大差別就是「對技術(shù)和業(yè)務(wù)場景的深刻理解和抽象提煉」,但這并不表示阿里需要把所有的場景都自己做掉。 杭州城市大腦項(xiàng)目正式發(fā)布的現(xiàn)場
承接各個場景,這種對業(yè)務(wù)領(lǐng)域的廣泛布局成為了阿里的優(yōu)勢,也自然而然變成了他們未來的長遠(yuǎn)目標(biāo)。 「建立云上視覺計(jì)算的生態(tài)」——這是華先勝心目中的長遠(yuǎn)目標(biāo)。在他看來,廣義的 AI 也可以平臺化、生態(tài)化,這樣「大家都可以在 AI 的平臺上去做研發(fā)、部署和生產(chǎn)」。 阿里云官網(wǎng)上發(fā)布的部分 API 服務(wù) 這聽起來很符合阿里的氣質(zhì)和地位。在和幾位高級研究人員的對話中,他們都或多或少表露了類似的意見和想法。閔萬里也認(rèn)為,將來的趨勢一定是一個「多鏈路、多種功能的結(jié)合」,一定是「多種技術(shù)結(jié)合成一個完整的解決方案去解客戶的問題」。 因此,「那些有特色的小而美的公司會成為這個生態(tài)當(dāng)中非常重要的補(bǔ)充,或者是應(yīng)該成為這個平臺上的一個很好的玩家?!?/p> 「我們會去做底層的平臺性的東西,然后他們在上面做各個方向的垂直。所以這些人我們認(rèn)為都是我們的生態(tài)伙伴」,初敏也這樣認(rèn)為。 最后,要找到技術(shù)的正確傳遞方式一切的問題似乎都變成了「尋找正確的產(chǎn)品形態(tài)」。 當(dāng)我們坐在阿里云的辦公室里時,初敏為我們展示了支付寶中的語音入口,「幫我給 XX 轉(zhuǎn) 20 塊錢」,屏幕上出現(xiàn)了通訊錄中的那位聯(lián)系人的名字,確認(rèn)之后,不用點(diǎn)擊,20 塊錢就轉(zhuǎn)了過去。 支付寶語音助手的界面 這個過程看上去還不錯,而淘寶和天貓這些阿里系的 App 中的語音入口也大同小異。初敏把這種交互方式稱為「意圖的分發(fā)」,目的就是在復(fù)雜的多層任務(wù)中直接傳達(dá)意圖,只是「產(chǎn)品形態(tài)還沒有跟上」。 當(dāng)然,誰也不知道最終的產(chǎn)品形態(tài)會是怎樣。僅拿語音來說,初敏認(rèn)為 Amazon Echo 的例子很成功,但不一定是最后的答案,「我是認(rèn)為只要有一個總的入口就好了,這個東西來控制所有其他的東西」,初敏說道,「這個東西也許是手機(jī),也許是家里的音箱,或者也許就是你那個 Wi-Fi,因?yàn)槊考叶加幸粋€ Wi-Fi 入口,也可能是你廚房里那個冰箱,具體是什么我覺得不好說。」 而華先勝則認(rèn)為算法、數(shù)據(jù)、用戶、平臺、商業(yè)模式這 5 個要素是他心目中一個成功的人工智能商業(yè)應(yīng)用的必備要素。 在他看來,頂尖團(tuán)隊(duì)在算法上的差別會越來越小,大家比拼的是綜合的資源,你既要有算法和數(shù)據(jù),還需要訓(xùn)練數(shù)據(jù)的能力,并且還需要通過正確的商業(yè)模式觸達(dá)到足夠多的用戶,以此才能真正成為一個成功的人工智能商業(yè)應(yīng)用。 閔萬里也覺得這是一個相輔相成的事情,你既要有技術(shù),還需要對業(yè)務(wù)場景有足夠的了解。「應(yīng)該這樣講,我們的人工智能技術(shù)不是為了技術(shù)而技術(shù),我們一定是一個全站式的解決方案,我們的技術(shù)上來之后就能解決客戶問題?!?/strong> 而在這方面,阿里在 iDST 團(tuán)隊(duì)之外還有一個「殺手锏」,那就是略顯神秘的「阿里巴巴人工智能實(shí)驗(yàn)室」。 6 月 28 日,一位阿里巴巴內(nèi)部人士向媒體確認(rèn),「阿里巴巴人工智能實(shí)驗(yàn)室」將于近期進(jìn)行首次公開亮相,該機(jī)構(gòu)負(fù)責(zé)阿里巴巴集團(tuán)旗下消費(fèi)級 AI 產(chǎn)品的研發(fā),成立于 2016 年,在阿里內(nèi)部頗為低調(diào)。「這個實(shí)驗(yàn)室的定位是主要做人工智能消費(fèi)級產(chǎn)品,與 iDST 有明顯的分工。」該人士對媒體表示。 在阿里官方表述和定位中,該實(shí)驗(yàn)室成立的愿景是「希望改變?nèi)伺c世界的連接方式」。上述人士向記者確認(rèn),阿里人工智能實(shí)驗(yàn)室很快將推出一款人工智能消費(fèi)級產(chǎn)品。而從今年各大公司的表現(xiàn)看,智能音箱顯然是一個最有可能的選擇。 在今年上半年,亞馬遜公司在 Echo 的基礎(chǔ)上又推出了 Echo Show,蘋果公司則發(fā)布了 Homepod;國內(nèi)的聯(lián)想、喜馬拉雅等大大小小的互聯(lián)網(wǎng)科技公司都在智能音箱這個產(chǎn)品上做文章,相繼推出了相關(guān)產(chǎn)品。 而據(jù)《界面》介紹,近日阿里巴巴一篇名為《一種新的語義編碼模型及其在智能問答及分類中的應(yīng)用》的論文被全球頂級數(shù)據(jù)挖掘?qū)<野l(fā)表各自領(lǐng)域研究成果的盛會 KDD (ACM SIGKDD Conference on Knowledge Discovery and Data Mining,簡稱 KDD)收錄,這篇論文的主要內(nèi)容聚焦在自然語言處理和智能問答,這是目前火熱的語音助手及智能音箱行業(yè)的基礎(chǔ)性技術(shù)。 在本文即將發(fā)表時,極客公園收到了來自于阿里人工智能實(shí)驗(yàn)室 7 月 5 日的新品發(fā)布邀請函,根據(jù)邀請函上「未來 開口即來」的主題口號和聲波一樣的圖案,我們推測應(yīng)該應(yīng)該就是發(fā)布智能音箱了。當(dāng)然,具體的答案將在 7 月 5 日揭曉,極客公園也將保持關(guān)注。 結(jié)語2016 年 8 月 9 日,在阿里云云棲大會·北京峰會上,阿里云總裁胡曉明說:「也許在 20 年后,管理阿里巴巴的,將是一位商業(yè)領(lǐng)袖 ET!」 「這樣的場景真會出現(xiàn)嗎?我們又該怎么樣定義阿里?它會是一家云計(jì)算公司,還是電商公司,還是人工智能公司?」我把這個問題拋給了閔萬里。 「我覺得可能到后面,云計(jì)算和電商都不需要再談了,因?yàn)樗呀?jīng)深入人心,無處不在了。但是『人工智能』這個詞會熱很久,熱很久有好有壞,一方面它還一直不斷地在完善當(dāng)中,另外一方面它能夠持續(xù)保持關(guān)注度,成為社會大家的一個共識,就像今天我們講互聯(lián)網(wǎng),沒有人去挑戰(zhàn)。所以說,那個愿景我覺得是有可能實(shí)現(xiàn)的,但是不是百分之百靠 ET 就是另外一回事了,」保持著他一貫的微笑,閔萬里回答道。 ■ 本文由極客公園原創(chuàng) 轉(zhuǎn)載聯(lián)系 wangxue@geekpark.net |
|