作者:戴國忠 在信息技術(shù)迅猛發(fā)展的背景下, 人工智能的爆發(fā)及在諸多行業(yè)的成功應(yīng)用再次引發(fā)人們對(duì)計(jì)算機(jī)全方位為人類服務(wù)的美好想象。 然而, 作為人與計(jì)算機(jī)之間信息溝通的橋梁和以人為中心指導(dǎo)系統(tǒng)開發(fā)的方法論, 人機(jī)交互沒有得到應(yīng)有的同步發(fā)展, 其瓶頸效應(yīng)日益彰顯。 究其原因, 可以歸納為以下兩點(diǎn): 一是沒有吸取好歷史的發(fā)展經(jīng)驗(yàn); 二是智能時(shí)代下應(yīng)用場景的變化導(dǎo)致新的需求, 對(duì)人機(jī)交互提出了巨大的挑戰(zhàn)。發(fā)表在《中國科學(xué):信息科學(xué)》2018年第4期“智能時(shí)代的人機(jī)交互??鄙系脑u(píng)述“智能時(shí)代人機(jī)交互的一些思考”,回顧了人機(jī)交互的發(fā)展歷史, 重點(diǎn)討論了人機(jī)交互的發(fā)展模式、心理學(xué)模型、交互界面、交互設(shè)計(jì)原則和研究框架等多個(gè)核心問題, 并總結(jié)了當(dāng)前人機(jī)交互出現(xiàn)的重要思想理論, 提出在智能時(shí)代下對(duì)人機(jī)交互未來發(fā)展必要的討論和思考。 作為人類發(fā)明的一種高級(jí)工具,計(jì)算機(jī)從誕生發(fā)展到現(xiàn)在, 對(duì)人們的工作和生活都產(chǎn)生了深刻的影響。 人機(jī)交互技術(shù)作為人與計(jì)算機(jī)之間信息交流的接口和以人為中心指導(dǎo)系統(tǒng)開發(fā)的方法論, 對(duì)人和計(jì)算機(jī)的發(fā)展都起著非常重要的作用。 對(duì)人機(jī)交互的廣泛研究, 提供了人們對(duì)人的交互意圖和相應(yīng)的生理、心理限制以及相關(guān)知識(shí)的描述, 發(fā)展交互技術(shù), 幫助人們完成以前無法完成的任務(wù)。同時(shí), 人機(jī)交互的另一個(gè)主要研究目的是提供以人為中心的系統(tǒng)設(shè)計(jì)方法論, 使系統(tǒng)更好滿足用戶功效性和情感性的需求, 提高用戶與計(jì)算機(jī)之間的交互質(zhì)量和用戶體驗(yàn)。 在智能時(shí)代背景下,隨著計(jì)算機(jī)技術(shù)日益廣泛地融入人類生活各個(gè)領(lǐng)域, 人機(jī)交互也越來越無處不在、無時(shí)不在。移動(dòng)互聯(lián)網(wǎng)的普及使得人們可以時(shí)刻在線; 觸屏交互技術(shù)使各個(gè)年齡段的人都可以無障礙使用計(jì)算機(jī); 虛擬現(xiàn)實(shí)的興起使人們可以隨時(shí)沉浸到數(shù)字世界; 而人工智能的突破則使機(jī)器能更好地理解人的意圖, 滿足人的需求。然而, 人機(jī)交互技術(shù)并沒有因?yàn)樾畔⒓夹g(shù)所取得的成就而得到同步發(fā)展, 目前人與計(jì)算機(jī)的主流交互方式仍然是基于“單手單眼” 的傳統(tǒng)模式, 這使得人機(jī)交互成為了人類和計(jì)算機(jī)共同發(fā)展的瓶頸。究其原因, 主要可以歸納為兩個(gè)方面: 一是沒有充分總結(jié)吸取人機(jī)交互歷史的發(fā)展經(jīng)驗(yàn), 從歷史中尋找發(fā)展規(guī)律; 二是智能時(shí)代下應(yīng)用場景的變化帶來新的問題, 傳統(tǒng)的人機(jī)交互思想理論無法很好地適應(yīng)新的需求, 對(duì)人機(jī)交互提出了巨大的挑戰(zhàn)。 人機(jī)交互發(fā)展歷史 在1960年現(xiàn)代人機(jī)交互學(xué)科的開創(chuàng)者Licklider提出人機(jī)共生 (man-computer symbiosis) 的概念, 認(rèn)為人應(yīng)該和計(jì)算機(jī)進(jìn)行交互。1992年, 國際計(jì)算機(jī)學(xué)會(huì) (ACM) 下的人機(jī)交互興趣小組(SIGCHI)把人機(jī)交互定義為一門對(duì)人類使用的交互式計(jì)算機(jī)系統(tǒng)進(jìn)行設(shè)計(jì)、評(píng)估和實(shí)現(xiàn), 并對(duì)其所涉及的主要現(xiàn)象進(jìn)行研究的學(xué)科。1999年美國總統(tǒng)顧問委員會(huì)報(bào)告中將 “人機(jī)交互和信息處理” 列為21世紀(jì)信息技術(shù)基礎(chǔ)研究的4個(gè)主要方向之一。2007年美國國家科學(xué)基金在其信息和智能系統(tǒng)分支中把以人為本的計(jì)算列為3個(gè)核心技術(shù)領(lǐng)域之一, 其具體主題包含多媒體和多通道界面、智能界面和用戶建模、信息可視化以及高效的以計(jì)算機(jī)為媒介的人人交互模型等。同年, 歐盟第7 框架計(jì)劃中也包含了自然人機(jī)交互的內(nèi)容。從2012年開始, ACM 在計(jì)算機(jī)學(xué)科領(lǐng)域分類系統(tǒng)中把人機(jī)交互列為計(jì)算機(jī)學(xué)科重要分支領(lǐng)域, 標(biāo)志著人機(jī)交互在計(jì)算機(jī)學(xué)科中開始占據(jù)重要位置。2016年中國國家自然科學(xué)基金在《國家自然科學(xué)基金“十三五”發(fā)展規(guī)劃》中把人機(jī)交互列為重點(diǎn)支持的課題。 從人機(jī)交互相關(guān)的文章數(shù)量來看,從1980年的74篇增長到了2014年的11165篇。 其中專注于人機(jī)交互的會(huì)議有100個(gè), 期刊有25個(gè). 參與研究的單位包括了國內(nèi)外的許多知名大學(xué)和研究機(jī)構(gòu), 例如Massachusetts Institute of Technology、Carnegie Mellon University、Stanford University、北京大學(xué)、清華大學(xué)、Microsoft 研究院、Google 研究院、中國科學(xué)院軟件研究所等。 計(jì)算機(jī)發(fā)展的過程,也是人機(jī)交互發(fā)展的過程。 計(jì)算機(jī)與人的交互方式從無交互到命令語言交互, 再發(fā)展到現(xiàn)在占據(jù)主流的圖形交互, 已經(jīng)具有直接操作和 “ 所見即所得” 的特點(diǎn)。圖形用戶界面的產(chǎn)生使得計(jì)算機(jī)成為人人可以操作的工具, 使Bill Gates “每個(gè)人有一臺(tái)電腦” 的理想成為現(xiàn)實(shí)。因此, 可以說是圖形用戶界面造就了個(gè)人計(jì)算機(jī)時(shí)代的輝煌。 在圖形用戶界面時(shí)代,人機(jī)交互系統(tǒng)的研究可以簡約看作是模型、范式和開發(fā)平臺(tái)的研究, 在近三十年的發(fā)展中取得了不菲的成就。但是這些技術(shù)的核心思想和方法大都是在20世紀(jì)六七十年代提出和發(fā)展的。在多媒體、多通道、虛擬現(xiàn)實(shí)、移動(dòng)計(jì)算和人工智能迅速發(fā)展的智能時(shí)代, 計(jì)算機(jī)的處理速度和性能仍然在迅猛地提升。雖然計(jì)算機(jī)硬件技術(shù)已經(jīng)不是障礙, 但是用戶使用計(jì)算機(jī)的交互能力并沒有得到相應(yīng)的提高, 其中一個(gè)重要原因就是缺少與新交互需求相適應(yīng)的、高效自然的人機(jī)交互界面, 缺少成熟統(tǒng)一的能滿足當(dāng)代人機(jī)交互需求的交互技術(shù)。同時(shí), 要完成智能時(shí)代對(duì)人機(jī)交互提出的要求和挑戰(zhàn), 一些阻礙當(dāng)代人機(jī)交互發(fā)展的理論問題和技術(shù)問題需要得到根本性的解決。其中理論問題包括認(rèn)知模型、分布式認(rèn)知理論、基于場景上下文的知識(shí)表示、人機(jī)交互中新的理論模型研究、全球知識(shí)經(jīng)濟(jì)中的人機(jī)交互等, 技術(shù)問題包括用戶界面工具、無處不在的交互式計(jì)算、社會(huì)半透明的人機(jī)交互、人機(jī)協(xié)同設(shè)計(jì)的交互技術(shù)、支持創(chuàng)新工程的交互技術(shù)等。 人機(jī)交互核心問題 對(duì)一個(gè)領(lǐng)域中知識(shí)的掌握蘊(yùn)含著對(duì)該領(lǐng)域中歷史的理解和認(rèn)同。 通過對(duì)人機(jī)交互發(fā)展歷史和研究成果的總結(jié), 歸納出人機(jī)交互發(fā)展的若干核心問題, 包括: 發(fā)展模式、心理學(xué)模型、交互界面和研究框架。 心理學(xué)模型 研究框架 發(fā)展模式 人機(jī)交互的新思想理論 人機(jī)交互是一個(gè)不斷變化的領(lǐng)域,這種變化是為了響應(yīng)技術(shù)革新以及滿足隨之而來的、新用戶的需求。從應(yīng)用場景來看, 人機(jī)交互從圖形用戶界面過渡到自然用戶界面, 發(fā)展更人性化的交互界面成為人機(jī)交互進(jìn)一步發(fā)展迫在眉睫的任務(wù); 從研究層面來看, 人機(jī)交互從微觀上升到宏觀, 使用計(jì)算機(jī)技術(shù)使個(gè)人參與到社會(huì)管理活動(dòng)中的方法成為人機(jī)交互關(guān)注的重點(diǎn); 從研究重心來看, 人機(jī)交互從交互導(dǎo)向轉(zhuǎn)移到實(shí)踐導(dǎo)向, 其分析單元由個(gè)體交互行為上升到日常的社會(huì)實(shí)踐活動(dòng); 從研究范圍來看, 人機(jī)交互由人類、計(jì)算機(jī)的二元空間擴(kuò)展到人類、計(jì)算機(jī)和環(huán)境組成的三元空間, 人類自身所在的環(huán)境也成為了人機(jī)交互研究重點(diǎn)關(guān)注的一部分。 (1)自然用戶界面。它是人機(jī)交互界面的新興范式轉(zhuǎn)變。通過研究現(xiàn)實(shí)世界環(huán)境和情況, 利用新興的技術(shù)能力和感知解決方案實(shí)現(xiàn)物理和數(shù)字對(duì)象之間更準(zhǔn)確和最優(yōu)化的交互, 從而達(dá)到用戶界面不可見或者交互的學(xué)習(xí)過程不可見的目的, 其重點(diǎn)關(guān)注是傳統(tǒng)的人類能力(如觸摸、視覺、言語、手寫、動(dòng)作)和更重要、更高層次的過程 (如認(rèn)知、創(chuàng)造力和探索)。 (2)基于現(xiàn)實(shí)的交互。它是對(duì)新一代人機(jī)交互方式的概括, 如自然用戶界面、虛擬現(xiàn)實(shí)技術(shù)、增強(qiáng)現(xiàn)實(shí)技術(shù)、上下文感知計(jì)算、手持或移動(dòng)交互、感知和情感計(jì)算、語音交互及多模態(tài)界面等。 (3)技術(shù)媒介的社會(huì)參與。隨著互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展以及互聯(lián)網(wǎng)在全球范圍內(nèi)快速普及, 越來越多的公眾開始接觸、熟悉和運(yùn)用網(wǎng)絡(luò)平臺(tái)這一高效溝通工具。他們通過各種表達(dá)方式在網(wǎng)絡(luò)平臺(tái)上發(fā)表對(duì)于公共事務(wù)及公共話題的意見和建議, 從而促使網(wǎng)絡(luò)成為一種重要的民意表達(dá)方式。 (4)實(shí)踐導(dǎo)向的方法。相比于傳統(tǒng)的面向交互的方法, 面向?qū)嵺`的方法 (practice-oriented approaches, POA) 把視角從交互轉(zhuǎn)移到實(shí)踐活動(dòng)上, 其分析單元由個(gè)體行動(dòng)轉(zhuǎn)變?yōu)槿说娜粘?shí)踐, 關(guān)注點(diǎn)從個(gè)人行為或者社會(huì)規(guī)范上升到日常活動(dòng)的組織和重組。 (5)人機(jī)共生系統(tǒng)。計(jì)算機(jī)在我們生活的各個(gè)方面都發(fā)揮越來越大的作用, 社會(huì)和信息技術(shù)在復(fù)雜的過程中不斷相互滲透和相互影響。在這種情況下, 人機(jī)共生系統(tǒng)(CHS) 由人機(jī)交互、以人為中心的計(jì)算、通用接入、數(shù)字社會(huì)與技術(shù)等發(fā)展而來, 并進(jìn)一步擴(kuò)展到數(shù)字政府、信息隱私、人與機(jī)器人交流等概念, 其目的是探索潛在的變革和顛覆性的思想, 以及基本理論和技術(shù)的創(chuàng)新, 研究人與計(jì)算機(jī)之間日益增加的關(guān)系, 并提出增進(jìn)人類能力的廣泛目標(biāo)。 智能時(shí)代人機(jī)交互的思考 1997年, 電腦 “深藍(lán)” 戰(zhàn)勝國際象棋冠軍。這場 “人機(jī)大戰(zhàn)” 是人機(jī)競爭的序幕, 展現(xiàn)了一個(gè)新時(shí)代的來臨, 一個(gè)我們稱之為 “智能時(shí)代” 的時(shí)代。隨著深度學(xué)習(xí)方法成功應(yīng)用于多個(gè)領(lǐng)域, 人工智能迎來了第3個(gè)發(fā)展高潮。在最新的一場的 “人機(jī)大戰(zhàn)” 中, Google的人工智能AlphaGo打敗了曾獲得多項(xiàng)世界冠軍的圍棋高手李世石, 再次揭開人們對(duì)“智能革命”的關(guān)注。另一方面, 可穿戴設(shè)備等新的交互設(shè)備的出現(xiàn)使得人機(jī)交互空間發(fā)生了極大變化, 與此同時(shí), 語音分析、手勢識(shí)別、運(yùn)動(dòng)跟蹤、凝視控制等技術(shù)不斷進(jìn)步, 使用心電圖、聲音、面部特征等獨(dú)特個(gè)人特征的安全認(rèn)證技術(shù)的發(fā)展, 都在引導(dǎo)著人機(jī)交互技術(shù)的發(fā)展軌跡和范圍。在計(jì)算機(jī)技術(shù)迅速發(fā)展之際, 人機(jī)交互卻沒有取得應(yīng)有的成果, 因此需要從計(jì)算機(jī)科學(xué)角度, 探討人機(jī)交互的發(fā)展。 人機(jī)交互的新定義 在智能時(shí)代背景下,人工智能和傳感器技術(shù)迅猛發(fā)展。新技術(shù)的發(fā)展對(duì)人機(jī)交互提出了新的要求, 人機(jī)交互研究內(nèi)容從微觀到宏觀、從交互轉(zhuǎn)向?qū)嵺`、從虛擬轉(zhuǎn)向現(xiàn)實(shí)、從心理學(xué)層面轉(zhuǎn)到社會(huì)學(xué)層面。傳統(tǒng)的交互定義已經(jīng)無法滿足人機(jī)交互發(fā)展的需求。因此, 從定義上對(duì)人機(jī)交互進(jìn)行重新審視顯得十分必要。 未來的人機(jī)交互, 將會(huì)演變成 “交互人” 和 “智能機(jī)” 在物理空間、數(shù)字空間及社會(huì)空間等不同空間上的交互。這里的“交互人” 指的是能和計(jì)算機(jī)自然交互的人類, “智能機(jī)” 指的是具有人的意圖表達(dá)和感知能力的智能計(jì)算機(jī)。未來人機(jī)交互技術(shù)的發(fā)展, 除從各類不同角度上對(duì)人機(jī)交互的各類因素進(jìn)行研究外, 人作為人機(jī)交互的核心, 也將隨著技術(shù)的發(fā)展與交互設(shè)備融為一體。因此, 未來的人機(jī)交互將趨同于 “感知”, 計(jì)算機(jī)的主要交互行為將變成感知行為、感知自然現(xiàn)象、感知人的現(xiàn)象、感知人類行為, 從而實(shí)現(xiàn)為人類服務(wù)。 從人機(jī)交互到人機(jī)共生 如果說電腦改變了人們的工作方式,那么目前正以前所未有的方式快速發(fā)展的智能手機(jī)、可穿戴設(shè)備等正在改變?nèi)藗兊纳罘绞?。由于?duì)這些移動(dòng)設(shè)備的依賴, 某種程度上人與計(jì)算機(jī)已經(jīng)在一定程度上形成了一種 “共生” 關(guān)系。 人機(jī)交互發(fā)展的總體趨勢是持續(xù)向著以用戶為中心、交互方式更加直觀的方向發(fā)展。在發(fā)展過程中, 首先是側(cè)重于交互的人機(jī)交互(HCI), 然后到以人為中心的計(jì)算(HCC), 最終走向去中心化的人機(jī)共生系統(tǒng)(CHS)。 人機(jī)交互與人工智能 隨著人工智能的突破性發(fā)展,體現(xiàn)出超越人類智力、帶動(dòng)產(chǎn)業(yè)變革和深入社會(huì)生活的趨勢。人工智能迅猛發(fā)展的勢頭給人類社會(huì)的進(jìn)步帶來了美好的憧憬, 同時(shí)也帶來了關(guān)于人類未來的隱憂, 甚至不少著名的專家學(xué)者發(fā)出人工智能有可能威脅人類自身生存的警告。有些專家則認(rèn)為, 人工智能發(fā)展的未來是人機(jī)合作。智能時(shí)代下的社會(huì)是人的智能和人工智能共同創(chuàng)造的, 智能社會(huì)是人機(jī)共生的社會(huì)。人工智能能放大人的智能, 使人的智能不依賴于自然的進(jìn)化而得到迅速的發(fā)展; 人的智能發(fā)展人工智能, 人工智能的進(jìn)步依賴于人的智能進(jìn)步。人的智能和人工智能是彼此互補(bǔ)、相互促進(jìn)的。 Lighthill 報(bào)告標(biāo)志著人工智能的第1次低潮;20世紀(jì)80年代末, 隨著各國政府停止對(duì)人工智能的經(jīng)費(fèi)資助, 人工智能進(jìn)入第2次低潮?;厥讱v史, 人工智能歷史發(fā)展中的兩次低潮, 卻伴隨著人機(jī)交互的高速發(fā)展。在這一時(shí)期出現(xiàn)了包括WIMP范式、圖形用戶界面 在內(nèi)的很多人機(jī)交互的基礎(chǔ)理論與實(shí)踐成果。然而, 人機(jī)交互與人工智能并非是此消彼長的。人機(jī)交互是人工智能的一個(gè)研究途徑, 在人工智能發(fā)展遇到瓶頸之時(shí)人機(jī)交互往往能夠提供新的研究思路。而人工智能則給人機(jī)交互帶來突破, 驅(qū)動(dòng)人機(jī)交互的發(fā)展, 并把人機(jī)交互提升到一個(gè)新的發(fā)展空間。 從人工智能的角度看,人機(jī)交互是人工智能的一個(gè)研究途徑。機(jī)器學(xué)習(xí)先驅(qū)Michael Jordan 提出人工智能最先獲得突破的領(lǐng)域是人機(jī)對(duì)話, 更進(jìn)一步的成果則是能幫人類處理日常事務(wù)甚至做出決策的家庭機(jī)器人。正是由于人機(jī)對(duì)話的需求推動(dòng)了人工智能的發(fā)展。 從人機(jī)交互的角度看,人工智能為人機(jī)交互帶來突破。鼠標(biāo)鍵盤、觸屏等傳統(tǒng)的人機(jī)交互技術(shù)難以使人與計(jì)算機(jī)實(shí)現(xiàn)如同人與人之間那樣高效自然的交互, 而語音識(shí)別、圖像分析、手勢識(shí)別、語義理解、大數(shù)據(jù)分析等人工智能技術(shù)能幫助計(jì)算機(jī)更好地感知人類意圖, 完成人類無法完成的任務(wù), 驅(qū)動(dòng)著人機(jī)交互的發(fā)展。 從人類的角度看,人工智能的發(fā)展是計(jì)算機(jī)技術(shù)的發(fā)展, 而計(jì)算機(jī)技術(shù)發(fā)展的最終目的是為人類服務(wù)。 人工智能要為人類服務(wù), 就不可避免需要研究人工智能的特性, 研究人的特性, 以及研究人和人工智能交互過程中遇到的問題, 這也正是人機(jī)交互所研究的問題。 因此, 人工智能和人機(jī)交互是相輔相成,相互促進(jìn)的關(guān)系。理性認(rèn)識(shí)人機(jī)交互與人工智能的關(guān)系, 在未來人機(jī)交互的發(fā)展中將具有指導(dǎo)性意義。 來源:《中國科學(xué):信息科學(xué)》 |
|