在微軟位于華盛頓州雷德蒙德的總部,薩蒂亞·納德拉(Satya Nadella)風風火火地走進會議室,急切地想要跟筆者聊一聊智能技術(shù)話題。這位首席執(zhí)行官正滔滔不絕地介紹微軟在開發(fā)智能應(yīng)用和服務(wù)方面的進展。納德拉告訴我,他每天早晨都會戴上自家的HoloLens全息眼鏡,查看投射在墻壁上的虛擬交互式日程表。這套系統(tǒng)智能化、高效率,而且充滿未來感。納德拉希望微軟在他的領(lǐng)導(dǎo)下也能具備這些特點。納德拉說,不管我們未來在哪里工作,微軟都將在其中占據(jù)一席之地。該公司今年3月發(fā)布的“對話即平臺”戰(zhàn)略就代表了一種押注,那就是以會話為基礎(chǔ)的界面將取代應(yīng)用程序,成為我們主要的網(wǎng)絡(luò)交互方式,從查詢信息、購物,到訪問一系列服務(wù),莫不如是。另外,得益于微軟開發(fā)的認知型應(yīng)用程序界面(API),應(yīng)用程序?qū)⒆兊酶又悄?,它們將能理解照片和視頻中的面孔、情緒和其他信息。微軟認為,它擁有最聰明的“大腦”來創(chuàng)建一個由人工智能驅(qū)動的未來,這源于近20年來它在機器學習和自然語言處理領(lǐng)域所取得的進步。得益于在中國進行的一項早期實驗,微軟率先打造了能夠與用戶產(chǎn)生情感共鳴的軟件機器人。它還發(fā)布了第一個基于文本的聊天界面平臺——對這家在很大程度上錯過智能手機革命的公司來說,這是一件值得驕傲的事情。在移動戰(zhàn)場失利后,微軟能打贏下一場戰(zhàn)爭嗎?今年上半年,大大小小的科技公司都加大了對軟件機器人的研發(fā)。Facebook開放了自家的一個軟件機器人開發(fā)平臺,它可以在該公司的聊天應(yīng)用Messenger上運行。谷歌則發(fā)布了運行在通訊類應(yīng)用程序Allo內(nèi)部的新智能助理,同時,它還發(fā)布了名為Home的智能硬件,試圖與亞馬遜智能音箱Echo一較高下。與此同時,Echo的語音輸入技術(shù)令開發(fā)者癡迷不已,據(jù)稱Echo已入駐300萬戶家庭 ,并通過自己的API習得1200項新“技能”。微軟對其在人工智能方面的成績感到自豪,并希望對外傳遞一種信號:從歷史上看,微軟對技術(shù)發(fā)展方向的判斷一向很準確。舉例來說,它很早就看到了智能手機和平板電腦的潛力,遠在競爭對手之前。對于微軟在人工智能方面的努力,一個揮之不去的問題是:憑什么這一次就能成?微軟人工智能首次成為中國電視臺的天氣預(yù)報員在開發(fā)軟件機器人方面,微軟取得的成功可能已超過了其他任何一家美國公司。 2016年1月,微軟的人工智能產(chǎn)品出現(xiàn)在了中國東方衛(wèi)視的早間新聞節(jié)目中,當時新聞主持人把電視畫面切給了氣象預(yù)報員“小冰”。只見在一個虛擬講臺前漂浮著一個跳動的圓圈,圓圈中的面孔變成了一個麥克風圖像,小冰用溫柔的女聲播報了天氣,甚至回答了主持人的一個問題。 我們找到了一種有著全新工作方式的軟件機器人,這種工作方式能夠充分激發(fā)對話的潛能。如果你想知道微軟為何如此看好軟件機器人,看看小冰就清楚了。“不敢說我們已經(jīng)開發(fā)出“殺手級”的軟件機器人,但至少我們做出了一種有著全新工作方式的軟件機器人,這種工作方式能夠充分激發(fā)對話的潛能?!钡吕锟恕た的螤枺―errick Connell)說道,他是微軟搜索引擎必應(yīng)的搜索技術(shù)負責人。2014年,微軟在微信平臺上推出了小冰,它能夠回答簡單的問題,和微軟的虛擬助理Cortana很像。它被設(shè)定為對情緒敏感,而且能夠記住以前的聊天記錄。分手了?小冰可能會主動過來關(guān)心你。上線三天后,小冰在微信上被添加到了150萬個聊天當中。之后,小冰登陸新浪微博,在那里成為最具人氣的名人賬號之一。如今,這個軟件機器人的使用者已經(jīng)超過4000萬,而平均算下來,使用者與機器人之間的對話達到了26個回合,著實表現(xiàn)不俗。對康奈爾來說,小冰指明了通向下一代搜索界面的道路。傳統(tǒng)的網(wǎng)頁搜索會呈現(xiàn)出列表式的藍色超鏈結(jié)果頁面;而完美的對話機器人可以直接給出正確答案。當然,微軟在中國的成功可能無法復(fù)制到美國。小冰誕生兩年后,我們?nèi)匀粵]有看到一個能講英語的“小冰”,而且近期也不會有這樣的軟件機器人問世。但微軟高管們表示,小冰背后的基礎(chǔ)設(shè)施代表著微軟的巨大機遇。 我們希望它成為一個生態(tài)系統(tǒng)。“這就是現(xiàn)代化的時代——你不需要成為語言理解方面的專家?!笨的螤栒f,“使用我們的工具就行了。你可以利用我們的工具創(chuàng)建自己的軟件機器人,然后把它置于任何平臺——可能是Slack,也可能是Facebook Messenger。我們希望是Skype或Windows,但選擇權(quán)在你?!?/span>如今開發(fā)者越來越擔心,圍繞軟件機器人的不同標準,各公司之間可能變得火藥味十足,然而微軟卻一反常態(tài),玩起了外交手腕。今年6月,該公司在舊金山舉辦了Botness大會,旨在促進軟件機器人開發(fā)者之間的合作。“我們真心希望它能夠具有互操作性——我們希望它成為一個生態(tài)系統(tǒng)。”微軟高級工程師程麗麗(音)說道,她參與組織了這場為期兩天的活動?!八袷?,在我們發(fā)現(xiàn)的問題和挑戰(zhàn)中,有哪些是可以合作解決的?”但是,通過舉辦這樣的活動,微軟希望自己能在軟件機器人浪潮中占據(jù)核心位置。如果成功了,它就能能夠在移動時代擁有一個新的開始。由微軟提供支持的軟件機器人可能出現(xiàn)在全球各個熱門通訊類應(yīng)用中,從而幫助微軟在新世界中占據(jù)優(yōu)勢。當然,試圖為下一代計算技術(shù)打造主導(dǎo)性平臺的并非只有微軟一家。每一家大型科技公司和許多初創(chuàng)企業(yè)都設(shè)立了人工智能部門,并取得了驕人的成果。不過值得一提的是,在各公司之間橫向比較人工智能是非常困難的,甚至可以說,是不可能的。像谷歌、Facebook、亞馬遜這樣的公司,它們的大部分工作并未公開。當這些公司的高管被問到各自的人工智能有何獨門絕招時,他們往往都是顧左右而言他,比如谷歌首席執(zhí)行官桑德爾·皮查伊(Sundar Pichai)只是簡單地表示,谷歌在這個領(lǐng)域已經(jīng)做了“很長時間”。風投公司安德森-霍洛維茨基金(Andreessen Horowitz)的未來學家本尼迪克特·埃文斯(Benedict Evans)在最近的一篇博客文章中表示,人工智能的未來仍然不明朗。“這個領(lǐng)域的發(fā)展是如此之快,以至于我們無法輕易斷言哪些技術(shù)必將成為最明顯的優(yōu)勢,也說不清哪些東西將實現(xiàn)商品化,以及最大的不同之處是什么?!八麑懙溃半m然關(guān)于這些技術(shù)的主要研究正在穩(wěn)步推進,并實現(xiàn)開源,但應(yīng)用起來并不簡單——這些技術(shù)還不一定能實現(xiàn)商品化?!?/span>每一家大型科技公司都在為這場戰(zhàn)役做準備陸奇很愿意為微軟的競爭優(yōu)勢提供依據(jù)。作為微軟的高管,他負責公司的應(yīng)用程序和服務(wù)工程部。陸奇也是一位計算機科學博士,名下?lián)碛?0項技術(shù)專利。陸奇盤點了移動互聯(lián)網(wǎng)第一波浪潮呈現(xiàn)的不利局面,以此開啟了話頭。他說,到現(xiàn)在為止,移動設(shè)備在網(wǎng)絡(luò)流量中的占比還沒有超過桌面設(shè)備,這說明移動設(shè)備的用戶體驗并不好?!拔覀冎?,網(wǎng)絡(luò)并沒有真正在手機上發(fā)揮好?!标懫嬲f。除了少數(shù)幾大類應(yīng)用之外,用戶并不樂意在手機上下載各種雜七雜八的應(yīng)用。比如他們并不會為了一年也坐不上幾次的輪渡而去專門下載一個票價查詢app。毫無疑問,肯定存在一種更好的模式。 業(yè)界還沒有找到一個能充分釋放移動和云計算全部價值的體驗平臺。”陸奇說,“從根本上說,應(yīng)用程序并不是正確的模式。應(yīng)用程序是作為替代HTML網(wǎng)頁的界面而興起,因為它們是我們在那個時候所能想出的最好方案。在過去技術(shù)條件下,對著手機呼喊并不能夠讓它為你呈現(xiàn)出想要的互聯(lián)網(wǎng)內(nèi)容,所以開發(fā)者構(gòu)建了復(fù)雜的隱秘管道系統(tǒng),讓你可以通過豆腐塊一般的圖形按鈕與之交互。而且,這些按鈕仍然是解決很多問題的最有效途徑。不過,得益于自然語言處理技術(shù)的進步,現(xiàn)在你真的可以通過大聲呼喊,讓手機呈現(xiàn)你想要的網(wǎng)絡(luò)內(nèi)容。陸奇表示,下一代“體驗平臺”將以對話的形式起步,因為它更貼近人類的行為方式。如果操作成功,你可以隨時退回去使用那些按鈕?!拔覀兛吹?,有很多解決方案都使用語言作為基礎(chǔ),但同時也會以一種周到和有意義的方式對圖形交互加以利用,以此來提升用戶體驗?!彼f。把所有資產(chǎn)拼合在一起,你就能看到微軟為何會如此樂觀但陸奇表示,若要取勝,一家公司需要五大“關(guān)鍵資產(chǎn)”。第一個是所謂的“對話平臺”——人們大量交談和收發(fā)大量信息的地方。在這方面,微軟擁有Office、Outlook、Skype、Cortana。第二個就是人工智能“大腦”——一個復(fù)雜的心理模型。微軟表示,他們的人工智能研究可以追溯到近20年前。第三個是對社交圖譜的訪問權(quán)限——人們在互聯(lián)網(wǎng)上的活動往往涉及他們的朋友和同事。就在筆者采訪陸奇幾天后,微軟宣布斥資262億美元收購擁有4.33億用戶的LinkedIn。對此,微軟有Windows和一系列家用設(shè)備(尤其是Xbox)。最后一個是開發(fā)者網(wǎng)絡(luò),他們急切地想在你的平臺上開發(fā),并愿意為特殊權(quán)限向你付費。單獨來看,微軟的各項資產(chǎn)都面臨著強大的競爭對手。比如,憑借一系列通訊類應(yīng)用,F(xiàn)acebook可以說掌握著更強大的對話平臺;當然該公司的社交圖譜也是最大的。谷歌的“大腦”可能更加智能,而且該公司可以接入數(shù)以億計的安卓設(shè)備。但把所有資產(chǎn)拼合在一起,你就能看到微軟為何會如此樂觀。陸奇說,“把這些資產(chǎn)結(jié)合起來看,我認為,我們掌握著引領(lǐng)未來的條件。”在兩年前的首屆Code大會上,微軟對人工智能的重視開始變得明顯。當時,擔任首席執(zhí)行官才剛剛?cè)齻€月的納德拉登上講臺,談?wù)撈鹞④浀奈磥怼?/span>講話結(jié)束前,他展示了Skype的一項新功能。兩名微軟員工在臺上講話——一個講英語,另一個講德語——Skype為他們進行了實時翻譯,讓他們繞開語言障礙進行交流。那是一段令人印象深刻的演示——納德拉宣布,到年底時,它將正式投入使用。對Skype團隊來說,納德拉給出的時間表不啻為一顆重磅炸彈。“我完全沒有想到?!蔽④浹芯吭浩髽I(yè)事務(wù)副總裁彼得·李(Peter Lee)說,“薩蒂亞真的用Skype Translator把我們套牢了?!?/span>第一,微軟研究院從未肩負過把產(chǎn)品推向市場的任務(wù),研究人員擔心,他們追求科研突破的自由突然之間變少了。 薩蒂亞真的用Skype Translator把我們套牢了。第二,在進行那段演示時,Skype Translator并不十分出色。微軟的語言模型是基于大量正式語言開發(fā)的——比如聯(lián)合國的聲明。然而,Skype需要翻譯的那種雙向交流有著很大的不同。這種交流中會有更多的“不流利”,說話人出口忘詞,或者把話重頭說一遍。另外還有“代碼混合”的問題,也就是說話人在一句話中使用多種語言,這在英語之外是非常普遍的現(xiàn)象。再有就是唱歌,人們喜歡用歌聲來表達情感,而事實證明,計算機很難對歌聲進行解析。“基本上,哪一樣都不行?!崩钫f,“我們不得不重新訓(xùn)練所有的模型?!?/span>不過,在納德拉的動員下,李的團隊也是拼了。他們在當年12月發(fā)布了一個預(yù)覽版。次年,這款產(chǎn)品變得普及,并且免費使用。李贊許地把納德拉稱為“激進分子”,他說這個項目是令人振奮的——最終的確如此。“想象一下,當你意識到這東西一無是處時,那種士氣的低沉和害怕——你必須帶領(lǐng)團隊挺過去。”李說,“一旦你做到了,你會看到一些了不起的新東西?!?/span>微軟現(xiàn)在可以在8種不同語言之間互譯,也就是有56種不同的組合,其基礎(chǔ)技術(shù)的影響已經(jīng)超越了翻譯。你知道微軟正在開發(fā)一款極其實用、甚至堪稱神奇的軟件機器人嗎?這款軟件已經(jīng)在進行測試,它能記錄商業(yè)會議并實時生成文稿,還能記錄兩人之間的音頻采訪,并在生成文稿時區(qū)分不同的講話者——這可能是所有新聞記者都最想要的一項技術(shù)。“當我們開始著手卻發(fā)現(xiàn)Skype Translator無法正常工作時,當時的沮喪之情溢于言表。”李說,“但我們克服了困難,我們已經(jīng)掌握了這些語言和翻譯模型,尤其是語言模型,它們棒極了?!?/span>與此同時,微軟正把人工智能資源注入到旗艦產(chǎn)品Windows和Office中。人工智能的一項潛力就是,它能夠預(yù)測你的需求——這正是Google Now的基本理念,它可以在你解鎖手機時向你呈現(xiàn)交通、天氣和體育比賽賽況。Cortana的研發(fā)負責人馬庫斯·阿什(Marcus Ash)向我展示了一個仿制版的Windows,它對大量基于云端的推測(即用戶可能想要知道的東西)加以利用。當阿什訪問“開始”菜單時,Cortana提供了一系列操作建議:對用戶有意義的名字,最近使用過的文檔,以及常見法語單詞翻譯(演示假定的用戶即將進行一趟旅行)。經(jīng)過你的授權(quán)之后,Cortana可以把你的聯(lián)系人、網(wǎng)絡(luò)搜索歷史以及應(yīng)用程序使用情況整合到它的建議中。 論性感程度,它比不上那種可以預(yù)測你每一種需求的通用型人工智能——但它現(xiàn)在就觸手可得而且,它可以根據(jù)一天中的不同時間段做出調(diào)整,比如,應(yīng)用開發(fā)者可以示意自己的應(yīng)用在早晨或飯點很有用。“利用對話以及關(guān)于用戶的語境信息,在用戶的授權(quán)之下,讓用戶變得更有效率以及更有控制感,這種想法是真正讓我們感到興奮的東西?!卑⑹舱f,“我們在改善用戶體驗上的很多工作都是圍繞簡化、消除摩擦以及展現(xiàn)智能力量來進行的?!?/span>在得到你的授權(quán)后,Outlook可以記下老板要求你在周末前向她發(fā)送某件東西的事情——如果你沒有做出回應(yīng),它會向你發(fā)出提醒。阿什說,“我的生活十分繁雜,所以常常忘事,尤其是電子郵件里的事?!彼f,自己最近就忘了回復(fù)上司的工作要求,還好Cortana及時提醒了他。當我見到負責Office企業(yè)市場營銷的副總裁柯克·柯尼斯鮑爾(Kirk Koenigsbauer)時,我了解到更多這樣的事情。他向我展示了很多例子,讓我看到人工智能可以讓Office變得更好用。2014年9月,微軟推出了Delve,并將其整合到Office 365中。這款應(yīng)用可以分析你在處理電郵和開會上花了多長時間,并在日歷上突出顯示你延長了哪些時間段來從事更復(fù)雜和更有意義的工作。它還可以告訴你,在你發(fā)出的郵件中,有多少收件人真正閱讀了郵件,以及他們的閱讀速度如何。當你跟某些同事有段時間沒聯(lián)系時,它會建議你聯(lián)絡(luò)感情。要找到這種有用的信息,你不必成為精通數(shù)字的大神。如果你是一位管理人士,Delve可以一目了然地顯示,你在過去一周和每名下屬各自待了多長時間。說到吸引眼的球程度,這種類型的智能或許比不上那種可以預(yù)測你每一種需求的通用型人工智能,但它現(xiàn)在就觸手可得,并且效果還不錯。 在花了六個月搜尋“殺手級”軟件機器人之后,我仍然看好這一概念。 它們所實現(xiàn)的交互要比客服電話和無人問津的小企業(yè)網(wǎng)站豐富得多,而且也必將取代它們。但是,對于在Facebook Messenger和Telegram這些平臺看到的大部分東西,我感到失望:有時候,它們感覺就像是使用互聯(lián)網(wǎng)的最慢方式。它們大多數(shù)的功能都比AOL Instant Messenger上的SmarterChild聊天機器人強不到哪兒去,而它們所要求的手動輸入更是常常把我逼回到滿是按鈕的圖形界面。眼下,推動人們對軟件機器人和人工智能進行討論的,并不是消費者對業(yè)界的期望,而是業(yè)界想要打造出新平臺來賺錢的迫切心態(tài)。當軟件機器人置身后臺,它們的表現(xiàn)或許會讓你感到不可思議迄今為止,各公司對這個問題的反應(yīng)基本上都是:他們正在努力解決。“就像很多先進技術(shù)一樣,人們以為它們?nèi)缃穸家褜崿F(xiàn)?!盕acebook首席技術(shù)官麥克·斯科洛普夫(Mike Schroepfer)說,“還有大量技術(shù)有待開發(fā),大量工作有待去做,我認為這會逐年逐月得到改進?!?/span>然而,造訪微軟讓我不禁想問,我會不會一直以錯誤的方式在思考這個問題。基于對話的界面通常是乏味的,但為它們提供支持、已被用于日常工具的機器學習技術(shù)卻是異常強大。如果微軟可以把類似于Delve的智能融入到更廣泛的服務(wù)中,我們就可以有理有據(jù)地說,它提供的生產(chǎn)力工具組合是世界上最強大的。那里將蘊藏著巨大的價值,即便微軟構(gòu)建大型平臺為聊天機器人提供支持的愿景沒有實現(xiàn)。這可能真的無法實現(xiàn)——在尚處于技術(shù)早期的現(xiàn)階段,位于前臺的軟件機器人往往給人一種愚不可及的感覺。但是,當軟件機器人置身后臺,它們的表現(xiàn)或許會讓你感到不可思議。
|