特定場(chǎng)景進(jìn)行特定培訓(xùn),這是打造更連貫、更自然的人機(jī)語(yǔ)音交互的一個(gè)解決途徑。 “iPhone的市場(chǎng)占有率是多少?” —“目前80%?!?/span> “那華為的呢?” —“怎么都喜歡華為?” 以上是發(fā)生在鎂客君與某一語(yǔ)音交互機(jī)器人之間的對(duì)話。 你來(lái)我往之間那些令人“頭痛”的瞬間在日常生活中,通過(guò)語(yǔ)音交互技術(shù),我們能夠與機(jī)器人進(jìn)行交流,比如蘋(píng)果的Siri亞馬遜的Alexa,或者是讓機(jī)器人實(shí)時(shí)控制一些家居產(chǎn)品,比如智能音響;在辦公時(shí)間,借助于語(yǔ)音交互技術(shù),我們也能夠直接口頭交代語(yǔ)音助理一些工作,從而提升工作效率,比如微軟的Cortana…… 可以說(shuō),隨著背后語(yǔ)音識(shí)別和自然語(yǔ)言處理技術(shù)的逐步提升,人們對(duì)于“語(yǔ)音交互”這一人機(jī)交互方式正在變得漸漸適應(yīng)。不過(guò),在你來(lái)我往的語(yǔ)音對(duì)話之間,我們也不可避免的也遇到了一些有時(shí)令人“哭笑不得”的BUG。 2017國(guó)家服務(wù)機(jī)器人產(chǎn)業(yè)高峰論壇于近日落下帷幕,在圓桌環(huán)節(jié)的自由問(wèn)答時(shí)間,有人提出一個(gè)問(wèn)題,稱(chēng)當(dāng)前的服務(wù)機(jī)器人在人機(jī)語(yǔ)音交互的過(guò)程中,常常會(huì)詞不達(dá)意,或者是出現(xiàn)上下文不連貫的問(wèn)題,導(dǎo)致最終的用戶體驗(yàn)不佳??梢哉f(shuō),這是當(dāng)前人機(jī)交互上最“頭痛”的問(wèn)題,也是導(dǎo)致人工智能被冠上“人工智障”稱(chēng)號(hào)的根本原因。 避免“人工智障”我們目前需要將機(jī)器人關(guān)在“籠子”里談及這種“人工智障”現(xiàn)象,其中主要涉及自然語(yǔ)言處理和深度神經(jīng)網(wǎng)絡(luò)的一個(gè)問(wèn)題。 一般情況下,基于自然語(yǔ)言處理技術(shù),人工智能系統(tǒng)即能夠?qū)θ藗兊恼Z(yǔ)句進(jìn)行拆分和處理,從而做到“理解”這句話,繼而對(duì)用戶作出相應(yīng)的回應(yīng)。至于上下文連貫,這其中主要關(guān)乎深度神經(jīng)網(wǎng)絡(luò)的一個(gè)搭建,換一種說(shuō)法,主要是“知識(shí)圖譜”在起作用。仍以本文最開(kāi)始的對(duì)話為例: “iPhone的市場(chǎng)占有率是多少?” —“目前80%。” “那華為的呢?” —“目前是xx%。” 在深度神經(jīng)網(wǎng)絡(luò),或者是知識(shí)圖譜的協(xié)助下,當(dāng)我們提出第二個(gè)問(wèn)題的時(shí)候,它會(huì)將華為與上一個(gè)問(wèn)題的“市場(chǎng)占有率”進(jìn)行關(guān)聯(lián),從而做到對(duì)這一問(wèn)題更為完整、精準(zhǔn)的理解。 事實(shí)上,為了達(dá)到更為完美、自然的人機(jī)交互體驗(yàn),難道人工智能企業(yè)就沒(méi)有搭建深度神經(jīng)網(wǎng)絡(luò)、構(gòu)造知識(shí)圖譜嗎?當(dāng)然不是,只不過(guò)在這基礎(chǔ)之上,依據(jù)當(dāng)前機(jī)器人的語(yǔ)音交互的整體情況,我們還需要附加一些場(chǎng)景條件。 “這一塊問(wèn)題的解決還是需要根據(jù)不同的場(chǎng)景來(lái)做不同的定制,畢竟這也不是說(shuō)一個(gè)模型、一個(gè)算法就能解決好所有的問(wèn)題。”武漢泰迪智慧科技有限公司創(chuàng)始人兼董事長(zhǎng)李成華表示。 總結(jié)一下也就是說(shuō),要想解決當(dāng)前這一上下文理解不連貫的問(wèn)題,我們還需要依據(jù)特定的場(chǎng)景來(lái)對(duì)機(jī)器人進(jìn)行特定的數(shù)據(jù)訓(xùn)練,從而打造一個(gè)特定機(jī)器人。舉個(gè)例子,比如智能客服機(jī)器人,其所能提供服務(wù)的領(lǐng)域包括金融、教育、酒店等多個(gè)領(lǐng)域,每個(gè)領(lǐng)域都有著其所特有的問(wèn)題或是對(duì)話場(chǎng)景,為了保證對(duì)話的連貫,我們就得利用這些特有數(shù)據(jù)進(jìn)行培訓(xùn),構(gòu)建一個(gè)面向垂直領(lǐng)域的知識(shí)圖譜,以避免問(wèn)題交叉、邏輯混亂等情況的出現(xiàn)。 面對(duì)無(wú)人駕駛的落地問(wèn)題,我們都說(shuō)低速行駛、封閉性場(chǎng)景是其當(dāng)前能夠快速實(shí)現(xiàn)落地的一個(gè)方向,簡(jiǎn)單粗暴的說(shuō),也就是將無(wú)人駕駛汽車(chē)關(guān)在一個(gè)相對(duì)“封閉”的場(chǎng)景里。而與此類(lèi)似,要想機(jī)器人在語(yǔ)音交互上表現(xiàn)的沒(méi)有那么“智障”,我們也需要將其關(guān)在一個(gè)限定的“籠子”里面來(lái)實(shí)施培訓(xùn),不同的是,無(wú)人駕駛汽車(chē)的“籠子”是在真實(shí)的物理世界,而機(jī)器人則是在一個(gè)虛擬層面。 正文結(jié)束。 下面是話題時(shí)間。 這周一我們開(kāi)始了第一次話題討論,討論的話題是虛擬仿真,效果杠杠的,不僅有內(nèi)容有干貨,而且?guī)椭鷮?duì)接到了志趣相投的小伙伴。所以下周一我們繼續(xù)哦~ 下周一話題:深度攝像機(jī),感興趣的朋友掃碼入群啦。 (一周一個(gè)話題群,討論完會(huì)解散噠,欲進(jìn)讀者群,請(qǐng)加鎂客君微信:15195912015,就是話題群群主啦) |
|
來(lái)自: 鎂客網(wǎng) > 《待分類(lèi)》