【原】寫給設(shè)計師的人工智能指南：虛擬私人助理

Mixlab交叉學科 2020-11-07

展開全文

本期談?wù)?/p>

《虛擬私人助理》相關(guān)的內(nèi)容。

我們先大致看下人工智能10大細分行業(yè)的典型應(yīng)用：

1、深度學習／機器學習：
預(yù)測數(shù)據(jù)模型與分析數(shù)據(jù)的軟件平臺；
垃圾郵件檢測；
金融詐騙檢測；
2、自然語言處理：
語音識別；
智能客服；
智能化軟件幫助系統(tǒng)；
智能化知識管理系統(tǒng)；
智能企業(yè)形象代表；
智能導(dǎo)游；
智能查詢系統(tǒng)；
3、計算機視覺／圖像識別：
面部識別軟件；
基于內(nèi)容的圖片檢索；
智能交通；
醫(yī)療計算機視覺和醫(yī)學圖像處理；
軍事探測和導(dǎo)彈制導(dǎo)；
無人駕駛環(huán)境檢測；
4、手勢控制：
電腦手勢指令系統(tǒng)；
游戲軟件手勢操控；
人眼運動跟蹤系統(tǒng)；
汽車導(dǎo)航；
智能電器的手勢操作；
5、虛擬私人助手：
網(wǎng)絡(luò)客服助理；
個人助理app；
個人日程管理；
6、智能機器人：
家庭機器人；
銷售機器人；
7、推薦引擎和協(xié)助過濾算法：
音樂推薦app；
美食推薦網(wǎng)站；
8、情境感知計算：
可穿戴傳感器；
智能決策支持系統(tǒng)；
智能家居；
精準農(nóng)業(yè)；
9、語音翻譯：
視頻談話實時翻譯；
網(wǎng)絡(luò)研討會多語翻譯；
10、視頻內(nèi)容自動識別：
安防智能監(jiān)控；
視頻侵權(quán)檢測；

應(yīng)用很廣，我們設(shè)計師大用可為啊～

其中關(guān)于計算機視覺／圖像識別方面，在上一期已經(jīng)做過梳理，可以點擊鏈接回顧下：

寫給設(shè)計師的人工智能指南：圖像

以下為正文：

大家都用過或者聽過蘋果的siri吧！這款產(chǎn)品的所用到的技術(shù)涉及自然語言處理、語音識別、語音合成等。它是一款語音助手產(chǎn)品，與語音對應(yīng)的還有基于文本的聊天機器人相關(guān)產(chǎn)品，他們都屬于虛擬私人助理的具體應(yīng)用產(chǎn)品。

虛擬私人助理帶來了人機交互方式的轉(zhuǎn)變，人機交互方式從GUI轉(zhuǎn)入了以自然交互為主的NUI。

計算機人機交互方式的演進：

簡單的CLI
Command-line interface：
命令行界面
用戶與計算機的互動主要以簡單連續(xù)的指令為主
復(fù)雜的GUI
Graphical User Interface：
圖形用戶界面
用戶與計算機的互動還增加了瀏覽、視頻、語音、游戲等方式
自然交互為主的NUI
Natural User Interface：
自然用戶界面
與計算機的交互發(fā)展到觸摸屏、語音交互、與穿戴式設(shè)備的交互、AR和VR的交互

這個時代的設(shè)計師，習慣于GUI的交互方式，面對的交互方式從復(fù)雜的GUI界面，到接近自然的NUI的轉(zhuǎn)變，難免會迷失方向，如果不跟上時代的步伐，很快設(shè)計師就要被淘汰啦～所以我們必須了解交互方式的變化，及其特點，才能更好的基于人工智能做我們的設(shè)計。

我梳理了對話式交互的一些要點，以供參考。

一、對話式交互的2個主要應(yīng)用方向：

可以是基于文本的，或者是基于語音的。

基于語音的需要語音識別技術(shù)的支持，理想的情況是不存在具體的交互界面，僅靠聲音對話就可以達到交互的目的，受限于目前技術(shù)，語音式的交互大多用于兒童玩具或者個人助理相關(guān)的場景。

典型應(yīng)用是語音助手。

基于文本，比語音稍簡單點，因為在交互中，我們需要借助于具體的圖形界面，這樣的話，可以用具體的功能按鈕輔助，規(guī)避技術(shù)難題，可以做到在自由聊天與具體場景業(yè)務(wù)間的無縫過渡。

典型應(yīng)用是聊天機器人。

二、對話式交互的特點：

信息需要根據(jù)上下文語境來呈現(xiàn)，每一次對話將決定下一次對話的信息；

產(chǎn)品的信息架構(gòu)以決策樹為主；

設(shè)計師思考角度的轉(zhuǎn)變；

設(shè)計師需要從界面的流程設(shè)計轉(zhuǎn)向基于決策樹的策略設(shè)計，建立滿足用戶需求的完整決策樹和尋找最優(yōu)路徑，更多地思考上下文前后信息的展現(xiàn)邏輯。

三、對話式技術(shù)解決方案：

3.1 人工對話

主要代表為美國創(chuàng)業(yè)公司設(shè)計的個人助理應(yīng)用Magic。當用戶提出要求如“幫我買一張機票”時，后臺通過人工運營為用戶提供解決方案，其實就是有個貼身客服為你解決問題。

優(yōu)點：本質(zhì)上是人與人之間的溝通，能避免很多問題；

缺點：當用戶量漲起來后，后臺的人工運營壓力較大。

目前Magic通過一半人工一半機器回答的形式轉(zhuǎn)型，減少后臺的壓力。

3.2 預(yù)埋對話

主要代表為蘋果Siri，微軟的Cortana，及百度的度秘。目前大部分對話式產(chǎn)品都采用該方案，通過識別語句中的關(guān)鍵詞給出預(yù)埋的解答。

優(yōu)點：降低答案的失誤和減少重復(fù)的工作；

缺點：是當設(shè)計師沒有意識到問題的其他最優(yōu)解決辦法或存在的bug，整個系統(tǒng)可能給不出最佳答案甚至無解；以及整個對話下來其實就是人與機器的獨白，沒有任何交流。

3.3 人工智能對話

主要代表還是蘋果的Siri、Google的Google Now、微軟的Cortana、Amazon的Echo以及百度的度秘。該方案主要通過處理大數(shù)據(jù)和機器學習的形式進行自我迭代優(yōu)化現(xiàn)有決策樹。

優(yōu)點：實現(xiàn)更完整的決策樹和產(chǎn)生更多最優(yōu)的解決方案，它能理解更多指令和記錄用戶的習慣；

缺點：但如何理解上下文，理解用戶情感仍是最重要的難題。

我覺得，

目前比較可靠的技術(shù)解決方案是：

三種方法融合，

然后交給設(shè)計師好好設(shè)計：

上下文前后信息的展現(xiàn)邏輯。

下面我們具體看看2大應(yīng)用方向的案例及技術(shù)路徑。

四、語音助手

案例：

蘋果的siri，亞馬遜的Alexa，微軟的Cortana，Google Assistant語音助手，三星Bixby語音助手等。

功能：

控制智能家居，或者是個人智能助理。

語音識別是面臨的第一個技術(shù)環(huán)節(jié)，作為設(shè)計師我們可以了解下相關(guān)的語音識別開放平臺，畢竟不是每家公司都有實力從0到1搭建一個好用的語音識別系統(tǒng)的。

訊飛http://www./

百度語音http://yuyin.baidu.com/asr

我調(diào)查下來，如果是一般的應(yīng)用，用百度的比較簡單，專業(yè)級應(yīng)用還是用訊飛吧。

語音識別在設(shè)計的應(yīng)用場景：

a、photoshop、cad、sketch啥的都可以通過語音來控制來，解放設(shè)計師的雙手。這個基于語音聽寫，把語音轉(zhuǎn)化為文字，再轉(zhuǎn)化為具體的計算機指令，可以達到。

b、方案匯報不用自己講了，讓機器人幫你講解，不過目前來看，設(shè)計師得提供文字版的演說稿，基于訊飛的語音合成，挑選一個喜歡的方言、音調(diào)來講解。

五、聊天機器人

案例：

社交娛樂元素，小黃雞、微軟小冰等聊天機器人加入社交平臺，滿足了年輕用戶的追求新鮮的口味；

購物，推銷商品或服務(wù)，比如谷歌語音助手向用戶玩起了推銷，告知《美女與野獸》將于今日上映的廣告；

美國好萊塢名媛、真人秀明星金·卡戴珊就推出了同名聊天機器人；

企業(yè)官方客服，淘寶客服就是典型的應(yīng)用；

新聞資訊,比如國外很火的對話式app：quartz；國內(nèi)類似的微信訂閱號：狗帶君；

個人日程管理、訂票、查詢天氣，微信服務(wù)號：助理來也。

目前對話大多以簡單命令和問題為主，如

“今天天氣怎樣？”

“清明節(jié)是什么時候”

“最近最便宜的餐廳在哪？”

“現(xiàn)任美國總統(tǒng)是誰”

“杭州在哪？”。

上圖為我最近在開發(fā)的app截圖

聊天機器人通過“天氣，餐館，最近，最便宜”等關(guān)鍵詞明確命令后，在數(shù)據(jù)庫和互聯(lián)網(wǎng)上進行搜索，將最優(yōu)答案反饋給用戶。

聊天機器人能簡單處理的問題：

是什么

什么時候

哪一個

是誰

什么地點

面對為什么，及如果（過程）的問題用戶體驗較差，聊天機器人很難處理。

目前大部分聊天機器人，可以做到簡單問題的回答、查詢天氣、查看新聞、查詢航班、給用戶講笑話、推薦菜譜、查找圖片等通用型問題。

比如下圖是微軟小冰等能力圖譜：

國內(nèi)開放平臺推薦

圖靈機器人http://www./

用下來感覺效果還行。

tensorflow也是有相關(guān)的開源項目的，比如：

Deep Q&A

https://github.com/Conchylicultor/DeepQA

動手能力強的話，可以下載下來玩一把～

嗯，虛擬私人助理這篇就寫這么多內(nèi)容，拋磚引玉，讀者們可以思考下語音助手、聊天機器人、對話式的交互方式，是否還有其他有趣的玩法，或應(yīng)用了。

人工智能相關(guān)文章：

寫給設(shè)計師的人工智能指南：圖像

Javascript也可以玩機器學習

《機器學習》入門的26個概念。筆記1

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻花（0） +1

來自： Mixlab交叉學科 > 《待分類》

舉報/認領(lǐng)

0條評論

發(fā)表

請遵守用戶評論公約

類似文章 更多

Mixlab交叉學科

關(guān)注對話

TA的最新館藏

探索的真正意義在于超越自己的能力邊界：AI編程線下訓(xùn)練營 - 程序員回訪
高校教師為何熱衷學習#AI編程？新創(chuàng)造力工具
AI讓創(chuàng)造變得越來越簡單，讓每個人都能把想法變成現(xiàn)實#AI編程訓(xùn)練營 - 設(shè)計師回訪
畢設(shè)選題：AI Agent 全棧設(shè)計#AI編程訓(xùn)練營 - 學生回訪
AI被人類騙走34萬！用于解決復(fù)雜任務(wù)的通用多智能體系統(tǒng)#Magentic-One
Narya.ai正在尋找iOS工程師！#Mixlab內(nèi)推

喜歡該文的人也喜歡更多

熱門閱讀換一換

一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

【原】寫給設(shè)計師的人工智能指南：虛擬私人助理

Deep Q&A