本期談?wù)?/p> 《虛擬私人助理》相關(guān)的內(nèi)容。 我們先大致看下人工智能10大細分行業(yè)的典型應(yīng)用:
應(yīng)用很廣,我們設(shè)計師大用可為啊~ 其中關(guān)于計算機視覺/圖像識別方面,在上一期已經(jīng)做過梳理,可以點擊鏈接回顧下: 以下為正文: 大家都用過或者聽過蘋果的siri吧!這款產(chǎn)品的所用到的技術(shù)涉及自然語言處理、語音識別、語音合成等。它是一款語音助手產(chǎn)品,與語音對應(yīng)的還有基于文本的聊天機器人相關(guān)產(chǎn)品,他們都屬于虛擬私人助理的具體應(yīng)用產(chǎn)品。 虛擬私人助理帶來了人機交互方式的轉(zhuǎn)變,人機交互方式從GUI轉(zhuǎn)入了以自然交互為主的NUI。 計算機人機交互方式的演進:
這個時代的設(shè)計師,習慣于GUI的交互方式,面對的交互方式從復(fù)雜的GUI界面,到接近自然的NUI的轉(zhuǎn)變,難免會迷失方向,如果不跟上時代的步伐,很快設(shè)計師就要被淘汰啦~所以我們必須了解交互方式的變化,及其特點,才能更好的基于人工智能做我們的設(shè)計。 我梳理了對話式交互的一些要點,以供參考。 一、對話式交互的2個主要應(yīng)用方向: 可以是基于文本的,或者是基于語音的。 基于語音的需要語音識別技術(shù)的支持,理想的情況是不存在具體的交互界面,僅靠聲音對話就可以達到交互的目的,受限于目前技術(shù),語音式的交互大多用于兒童玩具或者個人助理相關(guān)的場景。 典型應(yīng)用是語音助手。 基于文本,比語音稍簡單點,因為在交互中,我們需要借助于具體的圖形界面,這樣的話,可以用具體的功能按鈕輔助,規(guī)避技術(shù)難題,可以做到在自由聊天與具體場景業(yè)務(wù)間的無縫過渡。 典型應(yīng)用是聊天機器人。 二、對話式交互的特點: 信息需要根據(jù)上下文語境來呈現(xiàn),每一次對話將決定下一次對話的信息; 產(chǎn)品的信息架構(gòu)以決策樹為主; 設(shè)計師思考角度的轉(zhuǎn)變; 設(shè)計師需要從界面的流程設(shè)計轉(zhuǎn)向基于決策樹的策略設(shè)計,建立滿足用戶需求的完整決策樹和尋找最優(yōu)路徑,更多地思考上下文前后信息的展現(xiàn)邏輯。 三、對話式技術(shù)解決方案: 3.1 人工對話 主要代表為美國創(chuàng)業(yè)公司設(shè)計的個人助理應(yīng)用Magic。當用戶提出要求如“幫我買一張機票”時,后臺通過人工運營為用戶提供解決方案,其實就是有個貼身客服為你解決問題。 優(yōu)點:本質(zhì)上是人與人之間的溝通,能避免很多問題; 缺點:當用戶量漲起來后,后臺的人工運營壓力較大。 目前Magic通過一半人工一半機器回答的形式轉(zhuǎn)型,減少后臺的壓力。 3.2 預(yù)埋對話 主要代表為蘋果Siri,微軟的Cortana,及百度的度秘。目前大部分對話式產(chǎn)品都采用該方案,通過識別語句中的關(guān)鍵詞給出預(yù)埋的解答。 優(yōu)點:降低答案的失誤和減少重復(fù)的工作; 缺點:是當設(shè)計師沒有意識到問題的其他最優(yōu)解決辦法或存在的bug,整個系統(tǒng)可能給不出最佳答案甚至無解;以及整個對話下來其實就是人與機器的獨白,沒有任何交流。 3.3 人工智能對話 主要代表還是蘋果的Siri、Google的Google Now、微軟的Cortana、Amazon的Echo以及百度的度秘。該方案主要通過處理大數(shù)據(jù)和機器學習的形式進行自我迭代優(yōu)化現(xiàn)有決策樹。 優(yōu)點:實現(xiàn)更完整的決策樹和產(chǎn)生更多最優(yōu)的解決方案,它能理解更多指令和記錄用戶的習慣; 缺點:但如何理解上下文,理解用戶情感仍是最重要的難題。 我覺得, 目前比較可靠的技術(shù)解決方案是: 三種方法融合, 然后交給設(shè)計師好好設(shè)計: 上下文前后信息的展現(xiàn)邏輯。 下面我們具體看看2大應(yīng)用方向的案例及技術(shù)路徑。 四、語音助手 案例: 蘋果的siri,亞馬遜的Alexa,微軟的Cortana,Google Assistant語音助手,三星Bixby語音助手等。 功能: 控制智能家居,或者是個人智能助理。
訊飛http://www./ 百度語音http://yuyin.baidu.com/asr 我調(diào)查下來,如果是一般的應(yīng)用,用百度的比較簡單,專業(yè)級應(yīng)用還是用訊飛吧。 語音識別在設(shè)計的應(yīng)用場景: a、photoshop、cad、sketch啥的都可以通過語音來控制來,解放設(shè)計師的雙手。這個基于語音聽寫,把語音轉(zhuǎn)化為文字,再轉(zhuǎn)化為具體的計算機指令,可以達到。 b、方案匯報不用自己講了,讓機器人幫你講解,不過目前來看,設(shè)計師得提供文字版的演說稿,基于訊飛的語音合成,挑選一個喜歡的方言、音調(diào)來講解。 五、聊天機器人 案例: 社交娛樂元素,小黃雞、微軟小冰等聊天機器人加入社交平臺,滿足了年輕用戶的追求新鮮的口味; 購物,推銷商品或服務(wù),比如谷歌語音助手向用戶玩起了推銷,告知《美女與野獸》將于今日上映的廣告; 美國好萊塢名媛、真人秀明星金·卡戴珊就推出了同名聊天機器人; 企業(yè)官方客服,淘寶客服就是典型的應(yīng)用; 新聞資訊,比如國外很火的對話式app:quartz;國內(nèi)類似的微信訂閱號:狗帶君; 個人日程管理、訂票、查詢天氣,微信服務(wù)號:助理來也。 目前對話大多以簡單命令和問題為主,如 “今天天氣怎樣?” “清明節(jié)是什么時候” “最近最便宜的餐廳在哪?” “現(xiàn)任美國總統(tǒng)是誰” “杭州在哪?”。 上圖為我最近在開發(fā)的app截圖 聊天機器人通過“天氣,餐館,最近,最便宜”等關(guān)鍵詞明確命令后,在數(shù)據(jù)庫和互聯(lián)網(wǎng)上進行搜索,將最優(yōu)答案反饋給用戶。 聊天機器人能簡單處理的問題: 是什么 什么時候 哪一個 是誰 什么地點 面對為什么,及如果(過程)的問題用戶體驗較差,聊天機器人很難處理。 目前大部分聊天機器人,可以做到簡單問題的回答、查詢天氣、查看新聞、查詢航班、給用戶講笑話、推薦菜譜、查找圖片等通用型問題。 比如下圖是微軟小冰等能力圖譜: 國內(nèi)開放平臺推薦 圖靈機器人http://www./ 用下來感覺效果還行。 tensorflow也是有相關(guān)的開源項目的,比如: Deep Q&Ahttps://github.com/Conchylicultor/DeepQA 動手能力強的話,可以下載下來玩一把~ 嗯,虛擬私人助理這篇就寫這么多內(nèi)容,拋磚引玉,讀者們可以思考下語音助手、聊天機器人、對話式的交互方式,是否還有其他有趣的玩法,或應(yīng)用了。 人工智能相關(guān)文章: |
|
來自: Mixlab交叉學科 > 《待分類》