近來,“智能聊天機器人”的概念在國外越來越火熱。即便此前遭遇了點小挫折:微軟推出一款名為“Tay”的推特線上聊天機器人,將其設(shè)定為一名19歲的美國少女,并表示Tay能夠通過對話學(xué)習(xí)真實人類的說話方式,不斷完善自己,以更好地與人類交流。但就在Tay上線僅僅16小時之后,微軟就不得不將其緊急下線處理,甚至向公眾道歉,因為這款聊天機器人開始頻繁爆出粗口,其中不乏種族歧視、侮辱女性以及污穢不堪的詞句。 就在微軟剛下線自己的Tay后,社交巨頭Facebook對外宣稱將發(fā)布自己的語音聊天機器人,并將在Messenger軟件中加入此類技術(shù)。至上周5月8日,F(xiàn)acebook Messenger即迎來可撥打911電話的即時聊天機器人。 細心的人發(fā)現(xiàn),兩年前,微軟還曾發(fā)布過一款名為“小冰”的人工智能伴侶虛擬機器人,并進入微博、微信、米聊等第三方平臺,通過與用戶的不斷聊天進行積累學(xué)習(xí)。據(jù)稱,“小冰”集合了中國近7億網(wǎng)民多年來積累的、全部公開的文獻記錄,借助微軟在大數(shù)據(jù)、自然語義分析、機器學(xué)習(xí)和深度神經(jīng)網(wǎng)絡(luò)方面的技術(shù)積累,通過精煉的幾千萬條真實而有趣的語料庫(此后每天凈增0.7%),理解對話的語境與語義,從而實現(xiàn)超越簡單人機問答的自然交互。 包括蘋果的Siri、亞馬遜的Alexa,美國幾大科技巨頭在智能聊天機器人方面已經(jīng)開始暗中較勁——即便目前還看不出這些“回答磕磕絆絆、甚至文不對題”的智能聊天機器人會給人類的生活帶來多大變革。人工智能專家、美國康奈爾大學(xué)的計算機科學(xué)教授巴特·賽爾曼(Bart Selman)博士曾認為,微軟Tay遭遇的爆出口事件凸顯了人工智能領(lǐng)域目前所面臨的一大弱點:真正的語言能力。 不過放在重實用、愛賺錢的中國,仍不妨礙企業(yè)給“半成品”的智能聊天機器人找到一個發(fā)揮所長的工作領(lǐng)域:客服。客服行業(yè)的特殊性在于,其面對的對話場景并不是像蘋果Siri、微軟小冰那樣的任意聊天模式,客服分為不同領(lǐng)域,來尋求客服服務(wù)的用戶均是抱著特定的目的和話語體系,這使得智能聊天更容易精準定制。 比如百度的虛擬個人助理“度秘”,內(nèi)嵌在百度產(chǎn)品中,可以通過語音互動完成搜索、訂餐、訂電影票等O2O服務(wù)。而阿里系的產(chǎn)品客服需求更加龐大,其中越來越多的比例已經(jīng)被智能客服分擔。同時,語音自動轉(zhuǎn)接、情感識別與關(guān)鍵詞識別等技術(shù)已經(jīng)投入到智能客服當中。 就連網(wǎng)易,去年也開始組建人工智能團隊,推出一個叫“網(wǎng)易七魚”的全智能云客服產(chǎn)品,簡單講,類似電商、金融等不同領(lǐng)域的客服管理部門通過SDK安裝七魚后,即可接入有針對性的對話數(shù)據(jù),通過智能機器人答復(fù)用戶的常見、重復(fù)性問題,從而節(jié)省人力,實現(xiàn)人機協(xié)作。 在此有必要普及一下有關(guān)智能客服機器人所經(jīng)歷的四代技術(shù): 第一代:客服機器人為“問答機器人”,基于單個關(guān)鍵詞的精確匹配 這一代機器人很簡單,簡單到幾乎沒有什么技術(shù)可言,甚至稱不上智能??蛻魡柕摹皢栴}”停留在單個詞匯,而不是復(fù)雜句式。比如,在微信公眾號平臺回復(fù)一些關(guān)鍵字詞,獲取某篇文章或活動入口。 問答機器人的原型最早出現(xiàn)在電話客服上,稱為IVR(交互語音應(yīng)答系統(tǒng))。例如打電話給銀行客服,其可以通過語音提示用戶選擇所需服務(wù)的序號,進而一層層深入了解客戶想問什么問題,最后給出一個自動化的語音回答。第一代問答機器人使用單個詞匯的完全匹配,在使用場景中受限很多。 第二代:客服機器人可以支持多個詞匹配,并具有模糊查詢能力 第二代客服機器人比上一代機器人有了進步,但匹配規(guī)仍然相對死板的,只能應(yīng)用于一些簡單場景中。例如圖書館查詢系統(tǒng)中的書名、作者名,游戲中查詢的角色、裝備、副本信息等,都是相對明確的。這些內(nèi)容有一個很大的特點——用戶問法簡單、明確,沒有太大變化,在后方支撐這個系統(tǒng)的是一個關(guān)鍵詞列表。不過,當應(yīng)用于業(yè)務(wù)相對復(fù)雜的場景時,第二代客服機器人就會顯示出它的局限:需要維護非常龐大的關(guān)鍵詞列表,而且表達同一意義的會有若干不同的關(guān)鍵詞,這就會影響到最終匹配的精度和結(jié)果。 第三代:智能客服機器人在關(guān)鍵詞匹配的基礎(chǔ)上引入了自然語言處理(NLP)技術(shù) 比較大的變化在于,機器人處理的已經(jīng)不僅僅是詞,可以進一步處理句子:首先輸入信息,然后對數(shù)據(jù)進行清洗和預(yù)處理的工作,把一些雜亂和無效的信息排除。接著進入自然語言處理的流程:通過分詞、詞性標注、文法、句法、識別關(guān)鍵詞等技術(shù),把句子切開,給每個詞加一個權(quán)重,根據(jù)權(quán)重的綜合算法來匹配知識庫中哪個答案可以最準確回答用戶問題。 第三代機器人的智能體現(xiàn)在,當用戶問一個問題時,機器人支持一定問法上的變化。比如,知識庫設(shè)定的一個條目是“我要退貨”,當客戶說“我想退貨”時,第三代機器人同樣可以理解用戶意思。只是,第三代機器人語義判斷能力有限,匹配精度還沒有特別高,需要運營知識庫彌補這些局限。運營知識庫就是運營問法,不再是關(guān)鍵詞,數(shù)量上會大量減少,維護方式也變得簡單。這就是自然語言處理技術(shù)所起的作用,機器人與用戶的溝通,更接近于人與人的交流,用戶可以用一個完整的句子提問,不再是一個個單個的關(guān)鍵詞。 第四代:以神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),應(yīng)用了最新的“深度學(xué)習(xí)”、“模式識別”等技術(shù) 與第三代機器人相比,因為有了深度學(xué)習(xí)的技術(shù),第四代智能客服機器人完全可以打破人工配置的規(guī)則,有更好的自主學(xué)習(xí)能力和語義理解能力,可以處理更加口語化的問法。 人工智能領(lǐng)域的很多技術(shù),在很大程度上受到了生物學(xué)、醫(yī)學(xué)、認知神經(jīng)科學(xué)發(fā)展的啟發(fā)。 “深度學(xué)習(xí)”即是來自于相關(guān)領(lǐng)域的實驗。 1958年,諾貝爾醫(yī)學(xué)獎得主David Hubel和 Torsten Wiesel通過一系列關(guān)于“視覺系統(tǒng)的信息處理”的試驗發(fā)現(xiàn),視覺信號的處理是分層次的,圖像被一層一層抽象,最終被識別。此發(fā)現(xiàn)過去約40年,1995年前后,Bruno Olshausen和David Field兩位學(xué)者試圖用計算機的方法研究視覺問題,他們通過稀疏編碼算法訓(xùn)練機器,讓其自主提取視覺信號中的特征。 計算機算法自主學(xué)習(xí)后輸出的結(jié)果與David Hubel和 Torsten Wiesel兩位科學(xué)家生物學(xué)試驗的結(jié)果驚人的相似:視覺特征的提取,都是從最基本的物體邊緣開始的,更高級的特征,均可以由一些基本的特征組合而成。 這就是對“深度學(xué)習(xí)”的一種通俗的理解,即通過算法,讓機器自主的學(xué)習(xí),提取特征;并訓(xùn)練機器形成更深層次的特征。輸入的信號被一層層的特征抽象、表達;隨著層次的深入,這種表達在不斷的變換;不斷的迭代抽象,信號便被刻畫得更加準確。 對于深度學(xué)習(xí)來說,其特點就如名稱一樣,需要堆疊更多的特征層次。層數(shù)越多,輸入的數(shù)據(jù)量越大,學(xué)習(xí)能力越強,特征描述越準確。簡單講,深度學(xué)習(xí)和人的學(xué)習(xí)類似,其模型、或稱算法,就是告訴機器一個學(xué)習(xí)的方法。而機器能學(xué)到什么,依賴于訓(xùn)練的輸入,也就好比是人類的教材。至于機器能學(xué)到什么水平,則依賴于訓(xùn)練迭代的層數(shù),這就好比學(xué)習(xí)的用功程度。 國內(nèi)在智能客服機器人領(lǐng)域的創(chuàng)業(yè)者眾多,同質(zhì)化競爭激烈,附加功能大多包括多渠道(電話、網(wǎng)頁、微博、微信、手機APP等客服渠道)接入、移動工作平臺、數(shù)據(jù)報表、工單系統(tǒng)等,在技術(shù)上多數(shù)采用“第三代智能客服機器人”。只有阿里“小蜜”、網(wǎng)易七魚、京東JIMI等少數(shù)大公司級別產(chǎn)品采用了第四代深度學(xué)習(xí)智能客服機器人,并呈現(xiàn)出積極探索的態(tài)勢。未來的技術(shù)突破仍有賴于巨頭公司。 此前拿圍棋技術(shù)來調(diào)戲人類世界冠軍的谷歌人工智能AlphaGo同樣是采用“深度學(xué)習(xí)”的技術(shù)??萍冀缢坪蹩傆羞@么一個聽起來有點自嘲、但暗含業(yè)內(nèi)人驕傲的傳統(tǒng):一開始開發(fā)的或許只是能簡單的“小玩意”,后來卻能成長為一門正經(jīng)的大生意、或者應(yīng)用廣泛的新技術(shù)。 同時,在這個領(lǐng)域,我們也能看到中美科技公司對于人工智能應(yīng)用的區(qū)別:技術(shù)同樣領(lǐng)先時,中國公司更看重通過人工智能技術(shù)來推動用戶體驗、促發(fā)業(yè)務(wù)繁榮,所謂盡可能地做成生意。而美國公司卻在一個看似無用的領(lǐng)域“玩”到了極致。 但誰又能說得準,類似《三體》里面所講的“技術(shù)爆炸”會發(fā)生在哪一個小環(huán)節(jié)呢?
*文章為作者獨立觀點,不代表虎嗅網(wǎng)立場
本文由 足亦 授權(quán) 虎嗅網(wǎng) 發(fā)表,并經(jīng)虎嗅網(wǎng)編輯。轉(zhuǎn)載此文章須經(jīng)作者同意,并請附上出處(虎嗅網(wǎng))及本頁鏈接。原文鏈接http://www.huxiu.com/article/148498/1.html
關(guān)注微信公眾號虎嗅網(wǎng)(huxiu_com),定時推送,福利互動精彩多
|
|
來自: llvsh > 《人工智能的應(yīng)用》