. 機(jī)器能識(shí)別情感嗎?作者:撰文 約翰·麥奎德 (John McQuaid) 翻譯 施 懌《光明日?qǐng)?bào)》( 2022年01月27日 14版) 《環(huán)球科學(xué)》雜志社供圖 《環(huán)球科學(xué)》雜志社供圖 ??【環(huán)球視野】 1、監(jiān)控遍布的社會(huì) ??在英國利物浦,正在進(jìn)行著一場(chǎng)關(guān)于政府采購的有些乏味的會(huì)議。當(dāng)時(shí)是2020年2月,會(huì)議的展廳里擺放著各種各樣的陳列品。參會(huì)者在這些展品間四處走動(dòng),時(shí)而在某些展品前停留,其他時(shí)候則直接繞過。與此同時(shí),他們也被密切地“監(jiān)視”著。整個(gè)樓層安置著24個(gè)不顯眼的攝像機(jī),用于追蹤每個(gè)人的活動(dòng)。人的表情變化是通過面部肌肉運(yùn)動(dòng)產(chǎn)生的,因此當(dāng)參會(huì)者面對(duì)不同展品時(shí),面部肌肉會(huì)發(fā)生不同程度的收縮。盡管這些變化很細(xì)微,但24個(gè)攝像機(jī)將以每秒5到10幀的速度進(jìn)行拍攝。隨后,拍攝好的照片會(huì)傳送到計(jì)算機(jī)網(wǎng)絡(luò),利用AI算法評(píng)估每個(gè)人的性別和年齡,并分析他們的面部表情。最終,系統(tǒng)會(huì)從中找到表達(dá)“幸福”和“投入”的信號(hào)。 ??盡管利物浦的會(huì)議已經(jīng)過去了一段時(shí)間,帕諾斯·穆塔菲斯仍然對(duì)“監(jiān)視”的結(jié)果感到興奮。穆塔菲斯是一家名為“Zenus”公司的首席執(zhí)行官。這家公司位于美國得克薩斯州奧斯汀,為會(huì)議上的面部表情分析提供了AI技術(shù)?!霸谖乙娺^的商用AI系統(tǒng)中,很少能達(dá)到這樣的準(zhǔn)確度?!彼谝曨l通話中對(duì)我這樣說道。他還向我展示了一張人群照片,人群中的一些臉用方框框了出來。為了使AI系統(tǒng)學(xué)會(huì)識(shí)別人的情感,Zenus的工程師對(duì)系統(tǒng)進(jìn)行了“培訓(xùn)”。他們選取了一個(gè)龐大的面部表情數(shù)據(jù)集,每一個(gè)表情還標(biāo)注著對(duì)應(yīng)的內(nèi)心感受,并用這個(gè)數(shù)據(jù)集訓(xùn)練AI系統(tǒng)識(shí)別情感的能力。為了驗(yàn)證培訓(xùn)后的AI系統(tǒng)識(shí)別情感的能力,Zenus的工程師嘗試過多種方法。其中包括現(xiàn)場(chǎng)測(cè)試,也就是在一個(gè)人說出當(dāng)下感受的同時(shí),用攝像機(jī)拍下這個(gè)人的臉。穆塔菲斯說:“這種AI系統(tǒng)能在多種環(huán)境中識(shí)別人的情感,例如在室內(nèi)、在人們戴著口罩的條件下,或是在沒有燈光時(shí),又或者是在室外、當(dāng)人們戴著帽子和太陽鏡時(shí)?!?/p> 2、能識(shí)別情感的機(jī)器 ??最近有一種被稱作情感AI(emotion AI)或情感計(jì)算(affective computing)的新興技術(shù),它將攝像機(jī)和基于AI程序的其他設(shè)備結(jié)合在一起,用來捕捉面部表情、肢體語言、語調(diào)等線索。其中,Zenus開發(fā)的AI系統(tǒng)就是這項(xiàng)技術(shù)的一個(gè)示例。值得一提的是,情感AI的目的不只是為了辨認(rèn)并辨別面部表情,更重要的是要揭示出此前技術(shù)無法察覺到的信息,例如照片中人的內(nèi)心感受、動(dòng)機(jī)和態(tài)度。2019年曾寫過一篇題為《機(jī)器人監(jiān)視的黎明》報(bào)告的杰伊·斯坦利說:“現(xiàn)在攝像機(jī)變得越來越智能。它們正在覺醒——不再只是無聲地記錄人的活動(dòng),如今它們還能分析所記錄的信息?!?/p> ??可想而知,情感AI已經(jīng)成為一種流行的市場(chǎng)調(diào)研工具,但除此之外,情感AI還被應(yīng)用在了風(fēng)險(xiǎn)更高的領(lǐng)域。例如,有AI系統(tǒng)能讀出與感受、性格和意圖相關(guān)的線索,而人們正在計(jì)劃或已經(jīng)將這些系統(tǒng)用于檢測(cè)邊境檢查站的威脅、評(píng)估求職者的能力、監(jiān)控是否有擾亂課堂或打瞌睡的行為,以及識(shí)別攻擊性駕駛行為的跡象。主流汽車制造商計(jì)劃將這項(xiàng)技術(shù)應(yīng)用于未來的汽車??萍脊緞t結(jié)合人臉識(shí)別技術(shù),提供基于云計(jì)算的情感AI服務(wù),例如美國亞馬遜、微軟和谷歌。此外,數(shù)十家初創(chuàng)公司也推出了可以幫助企業(yè)招聘的應(yīng)用程序。在韓國,利用AI招聘的做法已經(jīng)十分普遍,因此職業(yè)培訓(xùn)師往往會(huì)讓他們的客戶練習(xí)如何通過AI面試。 ??為了識(shí)別情感和行為,AI系統(tǒng)需要使用多種類型的數(shù)據(jù)。除了面部表情、語調(diào)和肢體語言,它們還能通過分析口語或書面語的內(nèi)容,獲取其中包含的情感和態(tài)度。還有一些應(yīng)用程序收集數(shù)據(jù),不是為了探究情感,而是為了得到與情感相關(guān)的信息。例如這個(gè)人具有什么樣的人格,是否關(guān)心應(yīng)用程序的內(nèi)容,以及是否會(huì)對(duì)社會(huì)構(gòu)成潛在威脅。 ??但批評(píng)人士警告稱,情感AI的潛在危險(xiǎn)可能不是AI自身能控制的。這是因?yàn)楣こ處熢谟?xùn)練AI時(shí),可能使用的是有種族、民族和性別偏見的數(shù)據(jù)集,這些偏見又會(huì)反過來影響算法的結(jié)果。 ??情感AI背后的科學(xué)原理也存在爭(zhēng)議。這要追溯到半個(gè)世紀(jì)前,心理學(xué)家保羅·??寺腿A萊士·弗里森根據(jù)研究將一組面部表情與基本情感對(duì)應(yīng)在了一起,他們認(rèn)為這些面部表情是通用的情感語言。其中6種基本情感包括憤怒(anger)、厭惡(disgust)、恐懼(fear)、快樂(happiness)、悲傷(sadness)和驚訝(surprise),隨后,??寺?jīng)過研究發(fā)現(xiàn)蔑視(contempt)很有可能是第7種基本情感。不過現(xiàn)在,??寺透ダ锷挠^點(diǎn)受到了極大的爭(zhēng)議。這是因?yàn)榭茖W(xué)家發(fā)現(xiàn)面部表情可能具有顯著的文化和個(gè)體差異。許多研究人員表示,至少目前在分析不同個(gè)體的面部表情時(shí),算法還不能用一套規(guī)則正確地識(shí)別出表情的細(xì)微差異,因?yàn)橛袝r(shí)候不同個(gè)體的表情不能與典型的內(nèi)在感受對(duì)應(yīng)起來。??寺鼘?duì)早期情感識(shí)別技術(shù)的開發(fā)作出了重要的貢獻(xiàn),值得一提的是,現(xiàn)在他認(rèn)為這項(xiàng)技術(shù)會(huì)對(duì)隱私構(gòu)成嚴(yán)重威脅,應(yīng)該受到嚴(yán)格的監(jiān)管。 ??情感AI其實(shí)本質(zhì)上并不壞。專家表示,如果能讓機(jī)器學(xué)會(huì)可靠地解讀情感和行為,情感AI將會(huì)在機(jī)器人、衛(wèi)生保健和汽車等領(lǐng)域表現(xiàn)出巨大的潛力。不過現(xiàn)在,這一領(lǐng)域幾乎是一片“混戰(zhàn)”,也許最終會(huì)有一種未經(jīng)驗(yàn)證的技術(shù)占據(jù)主導(dǎo)地位而變得無處不在。然而,未經(jīng)驗(yàn)證的技術(shù)會(huì)對(duì)社會(huì)帶來危害,到那時(shí)我們可能會(huì)對(duì)此措手不及。 3、用AI來招聘 ??2018年,時(shí)任美國愛塔梅爾(Airtame,開發(fā)具有屏幕共享功能的設(shè)備)人力和商業(yè)運(yùn)營副總裁的馬克·格雷想要找到改善公司招聘流程的方法,包括改善招聘的效率。一方面是因?yàn)楸M管愛塔梅爾的規(guī)模不大,一共擁有約100名員工,但有時(shí)候公司會(huì)收到數(shù)百份申請(qǐng)市場(chǎng)營銷或設(shè)計(jì)崗位的簡歷。另一方面是因?yàn)殇浻脹Q策的主觀性?!坝泻芏啻危叶加X得潛意識(shí)里有個(gè)人說'噢,我很喜歡這個(gè)人’,而不是'這個(gè)人的能力很強(qiáng)’。事實(shí)上,招聘的世界里充滿了無形的東西,因此我想弄清楚如何才能在招聘中加入有形的考量?!备窭捉忉尩?。 ??美國愛塔梅爾與德國慕尼黑的Retorio公司達(dá)成了一項(xiàng)合約,其中Retorio開發(fā)了一種能用在視頻面試中的AI系統(tǒng)。視頻面試的流程很快,應(yīng)聘者只需要錄制60秒的視頻來回答2到3個(gè)問題。隨后,用算法分析應(yīng)聘者的面部表情和聲音,以及他們回答的內(nèi)容。然后,根據(jù)“大五”人格模型(OCEAN,一種心理學(xué)中常用的人格結(jié)構(gòu)模型),為每位應(yīng)聘者生成基于5種人格特質(zhì)的檔案。這5種人格特質(zhì)分別為開放性、責(zé)任心、外傾性、宜人性和神經(jīng)質(zhì)性。通過比較應(yīng)聘者的檔案和職位描述,系統(tǒng)會(huì)按照匹配度為應(yīng)聘者排序,最后招聘人員就能得到一份應(yīng)聘者的排名列表。 ??事實(shí)上,類似的軟件已經(jīng)開始改變商業(yè)決策的制定方式,以及組織與人的互動(dòng)方式。它重塑了愛塔梅爾的招聘流程,使他們很快就選拔出了更適合的應(yīng)聘者。格雷說,這是因?yàn)樯傻臋n案很有用。他分享了一張圖表,圖表顯示了最近招聘的幾名銷售人員中,工作表現(xiàn)與5種人格特質(zhì)得分之間的關(guān)系,其中在責(zé)任心、宜人性和開放性方面得分較高的員工表現(xiàn)最好。 ??長期以來,能理解人類情感的機(jī)器一直是科幻小說的主題。但在計(jì)算機(jī)科學(xué)和工程領(lǐng)域,在很長一段時(shí)間里,人類情感都是一個(gè)陌生的概念。在20世紀(jì)90年代,“它是一個(gè)禁忌話題,并不受歡迎?!泵绹槭±砉W(xué)院(MIT)的羅莎琳德·皮卡德說。 ??皮卡德和其他研究人員開發(fā)了能自動(dòng)讀取和響應(yīng)生物特征信息的工具。其中,生物特征信息涵蓋從面部表情到血液流動(dòng)的范圍,能用于指示情感狀態(tài)。不過,如今情感AI應(yīng)用場(chǎng)景的激增要追溯到2010年初,當(dāng)時(shí)深度學(xué)習(xí)開始被廣泛應(yīng)用。深度學(xué)習(xí)是一種基于人工神經(jīng)網(wǎng)絡(luò)的強(qiáng)大的機(jī)器學(xué)習(xí)形式,其中人工神經(jīng)網(wǎng)絡(luò)的原型是生物神經(jīng)網(wǎng)絡(luò)。深度學(xué)習(xí)提高了AI算法的能力和準(zhǔn)確度,使一些以前只有人類才能可靠完成的任務(wù)實(shí)現(xiàn)了自動(dòng)化,例如駕駛、人臉識(shí)別以及醫(yī)學(xué)影像分析。 4、AI的算法偏見 ??然而,這樣的AI系統(tǒng)還遠(yuǎn)遠(yuǎn)不夠完美,而且情感AI處理的是一項(xiàng)極其艱巨的任務(wù)。算法本來應(yīng)該反映的是關(guān)于世界的真相,例如它們應(yīng)該把蘋果識(shí)別為蘋果,而不是桃子。機(jī)器學(xué)習(xí)中的“學(xué)習(xí)”是反復(fù)比較原始數(shù)據(jù)和訓(xùn)練數(shù)據(jù)的過程。其中,原始數(shù)據(jù)通常是圖像,也包括視頻、音頻等數(shù)據(jù),不過這些原始數(shù)據(jù)沒有獨(dú)特的特征,而訓(xùn)練數(shù)據(jù)則標(biāo)注了與智能任務(wù)相關(guān)的特征。這就是AI系統(tǒng)學(xué)習(xí)提取潛在共性的方式,例如從蘋果的圖像中提取“蘋果感”,從而能從任意圖像中識(shí)別出蘋果。 ??但是,如果AI系統(tǒng)的任務(wù)是要識(shí)別人格或情感等難以定義的特質(zhì)時(shí),就更難獲得真相了。例如,“快樂”或“神經(jīng)質(zhì)”究竟是什么樣的?情感AI算法并不能憑直覺知道情感、人格或意圖,相反,它們是通過訓(xùn)練學(xué)會(huì)模仿人類對(duì)其他人做的判斷。其中,工程師會(huì)通過眾包(crowdsourcing)的方式采集數(shù)據(jù),來構(gòu)建用于訓(xùn)練AI的數(shù)據(jù)集。批評(píng)人士認(rèn)為,訓(xùn)練AI的過程引入了太多主觀變量。美國南加利福尼亞大學(xué)的凱特·克勞福德表示:“這些算法做出的判斷,與一個(gè)人的真實(shí)想法或情感狀態(tài)之間存在巨大差距。因此,'讓機(jī)器像人一樣感知情感’既是AI相關(guān)技術(shù)巨大的飛躍,也是有風(fēng)險(xiǎn)的一步?!?/p> ??AI系統(tǒng)識(shí)別情感等特質(zhì)的過程是復(fù)雜的,每一步都存在潛在的缺陷。深度學(xué)習(xí)對(duì)大量數(shù)據(jù)的需求是出了名的,因此情感AI也需要龐大的數(shù)據(jù)集。但這些數(shù)據(jù)集往往附加了數(shù)千甚至數(shù)十億個(gè)人的判斷。這可能會(huì)使算法在不經(jīng)意間“學(xué)習(xí)”所有數(shù)據(jù)收集者的系統(tǒng)性偏見。算法會(huì)將這些系統(tǒng)性偏見集成在一起,形成“算法偏見”,這可能來自訓(xùn)練數(shù)據(jù)集的人口統(tǒng)計(jì)學(xué)偏差和數(shù)據(jù)標(biāo)注者無意識(shí)的態(tài)度等。 ??即便是識(shí)別一個(gè)微笑也遠(yuǎn)非一項(xiàng)簡單的任務(wù)。2020年,在德國GESIS-萊布尼茨社會(huì)科學(xué)研究所的一項(xiàng)研究中,卡斯滕·施韋默和同事利用亞馬遜、微軟和谷歌基于云計(jì)算的情感識(shí)別應(yīng)用程序,分析了國會(huì)議員的照片。通過肉眼觀察,研究人員判定照片中86%的男性和91%的女性在微笑,然而,應(yīng)用程序的結(jié)果則更傾向于認(rèn)為女性在微笑。例如,谷歌云視覺為超過90%的女性照片標(biāo)注了“微笑”,而在男性照片當(dāng)中,這一比例不到25%。研究人員據(jù)此推測(cè),訓(xùn)練數(shù)據(jù)集可能存在性別偏見。而且,在研究人員對(duì)這些圖像進(jìn)行判斷時(shí),“模糊”是很常見的,但這常常會(huì)被機(jī)器忽略?!霸S多面部表情的含義并沒有那么明確。那真的是微笑嗎?傻笑也算微笑嗎?如果照片中的人露出了牙齒,但看起來并不開心呢?”他們補(bǔ)充道。 ??事實(shí)上,大多數(shù)基于深度學(xué)習(xí)的人臉識(shí)別系統(tǒng),因存在偏見而廣受批評(píng)。 ??現(xiàn)在,許多公司都在強(qiáng)調(diào),他們已經(jīng)意識(shí)到了并正在試圖解決“偏見”問題。德國Retorio公司的聯(lián)合創(chuàng)始人克里斯托夫·霍恩貝格爾表示,他們已經(jīng)在采取措施,以消除會(huì)使人格判斷具有偏向性的各種偏見,例如人口統(tǒng)計(jì)學(xué)和文化偏見。但目前該行業(yè)還缺乏監(jiān)管機(jī)制。因此,大多數(shù)情況下,我們不得不相信公司的一面之詞,盡管我們很難驗(yàn)證公司專有數(shù)據(jù)集的魯棒性和公平性。HireVue是一家致力于視頻面試的公司,他們使用算法分析應(yīng)聘者的說話內(nèi)容和聲調(diào),以此協(xié)助制定錄用決策。與此同時(shí),這家公司還會(huì)請(qǐng)外部審計(jì)師來檢查算法是否存在偏見,但會(huì)這樣做的公司還很少見。 5、關(guān)于科學(xué)原理的爭(zhēng)議 ??美國北卡羅來納大學(xué)的伊菲奧瑪·阿瓊瓦表示,情感AI不僅引發(fā)了對(duì)算法偏見的擔(dān)憂,背后的科學(xué)原理也開始受到科學(xué)家的強(qiáng)烈反對(duì)。情感AI遵循的科學(xué)觀點(diǎn)認(rèn)為,每個(gè)人的外在表現(xiàn)都能與可解讀的內(nèi)心情感相匹配。而且,這種觀點(diǎn)要追溯至50多年前。那時(shí),??寺透ダ锷诎筒紒喰聨變?nèi)亞做田野調(diào)查。他們?cè)谶@里的東南部高地找到了原住民福爾人,并研究了福爾人識(shí)別和理解面部表情的方式。研究人員選用了幾組能分別表達(dá)6種基本情感的表情圖,并將圖像展示給志愿者。結(jié)果發(fā)現(xiàn),福爾人的反應(yīng)與其他國家實(shí)驗(yàn)志愿者的幾乎完全相同,例如日本、巴西和美國。因此,研究人員認(rèn)為他們成功證明面部表情是一種人類通用的情感語言。 ????寺透ダ锷€描繪了一張包含數(shù)千種面部肌肉動(dòng)作的“地圖”,經(jīng)分析得到了面部肌肉動(dòng)作與表情之間的對(duì)應(yīng)關(guān)系,從而創(chuàng)制出了面部行為編碼系統(tǒng)(FACS)。值得一提的是,“地圖”和FACS共同構(gòu)成了情感AI的理論基石,如今已經(jīng)被整合到了許多AI應(yīng)用程序中。 ??對(duì)于埃克曼的理論,科學(xué)家提出過異議,認(rèn)為它們存在漏洞。例如,2012年,一項(xiàng)發(fā)表于《美國科學(xué)院院刊》(PNAS)的研究表明面部表情在不同文化中存在很大的差異。2019年,在美國東北大學(xué)的心理學(xué)家麗莎·費(fèi)爾德曼·巴雷特和同事分析了1000多篇關(guān)于面部表情的科學(xué)論文后,發(fā)現(xiàn)盡管認(rèn)為外在面貌能反映內(nèi)在感受的觀點(diǎn),已經(jīng)拓展到了從技術(shù)到法律的多個(gè)領(lǐng)域,但幾乎沒有確鑿的證據(jù)可以證明這種觀點(diǎn)是正確的。 ??巴雷特說,基本情感是一種寬泛且刻板的分類方式。因?yàn)槊繒r(shí)每刻,面部表情都在反映復(fù)雜的內(nèi)在狀態(tài)——一個(gè)微笑可能是在掩飾痛苦,也可能是在傳達(dá)同情。她認(rèn)為,現(xiàn)在AI系統(tǒng)還不能一致、可靠地分辨人的內(nèi)在狀態(tài),這是因?yàn)楸举|(zhì)上AI系統(tǒng)的訓(xùn)練數(shù)據(jù)是由標(biāo)注好的刻板印象組成的數(shù)據(jù)集?!八窍葴y(cè)量某些特性,然后再推測(cè)其在心理上的意義,但這本來是兩件截然不同的事。目前大肆宣傳的情感識(shí)別技術(shù)經(jīng)常將這兩件事混淆在一起?!卑屠滋卣f。 ??克勞福德說,造成這個(gè)問題的原因之一是,科技初創(chuàng)公司并不了解其他領(lǐng)域的科學(xué)辯論,而且這些公司被類似FACS的簡約之美所吸引?!鞍?寺睦碚摓槭裁磿?huì)受到機(jī)器學(xué)習(xí)領(lǐng)域的青睞?”克勞福德問道?!斑@是因?yàn)榘?寺睦碚摵芊蠙C(jī)器學(xué)習(xí)的特點(diǎn)。如果在一種理論中,表情的數(shù)量是有限的,而且表情可能對(duì)應(yīng)的情感數(shù)量也是被嚴(yán)格控制的,這種理論就能用于構(gòu)建機(jī)器學(xué)習(xí)模型。”事實(shí)上,除了??寺难芯拷Y(jié)果和OCEAN人格特質(zhì)模型,開發(fā)情感AI的公司還采用了其他理論體系。其中之一是已故心理學(xué)家羅伯特·普魯奇克提出的“情感之輪”。所有這些理論都將人類情感的復(fù)雜性轉(zhuǎn)化為了簡單直接的公式。 ??盡管如此,研究人員認(rèn)為,在了解情感應(yīng)用程序的局限性后,我們可以據(jù)此做出改善,從而使它們發(fā)揮作用。阿亞娜·霍華德是美國俄亥俄州立大學(xué)工程學(xué)院院長,同時(shí)也是機(jī)器人專家。她利用微軟面部表情識(shí)別軟件的改良版,讓機(jī)器人教自閉癥兒童學(xué)習(xí)社會(huì)行為。例如,如果機(jī)器人檢測(cè)到對(duì)話者出現(xiàn)了“憤怒”的表情,它就會(huì)調(diào)整動(dòng)作以平息局面?;羧A德說,典型的面部表情可能并不總意味著完全相同的情感,但它們?nèi)匀皇怯杏玫??!暗拇_,我們都是獨(dú)一無二的。但事實(shí)上,人與人之間的差異也沒有那么大。因此,對(duì)于廣義的情感來說,這些情感AI的判斷也許不總是正確的,但并不只是碰巧對(duì)了。與隨機(jī)相比,它們正確的可能性要更大?!彼f。 ??總體來說,能掃描和集合許多人面部反應(yīng)的算法將會(huì)更加準(zhǔn)確,例如用來解讀人群的算法。巴雷特說,這是因?yàn)樵诮y(tǒng)計(jì)學(xué)上,隨著群體規(guī)模的增加,“不可能”會(huì)變成“可能”,從而具有“比隨機(jī)正確更大的概率”。但是評(píng)估個(gè)體是有風(fēng)險(xiǎn)的,因?yàn)槿魏螠?zhǔn)確率低于100%的事情都會(huì)造成對(duì)某些個(gè)體的歧視。 ??現(xiàn)在對(duì)于面部表情,許多計(jì)算機(jī)視覺專家更偏向于一種不可知論的態(tài)度,也就是說無法通過分析面部表情得到確切的結(jié)果。而且越來越多的公司表示,他們不會(huì)直接用面部表情來描述情感或內(nèi)在狀態(tài)。美國南加利福尼亞大學(xué)的喬納森·格拉奇說:“隨著這一領(lǐng)域的發(fā)展,人們?cè)絹碓秸J(rèn)識(shí)到,許多表情其實(shí)和情感無關(guān)。表情就像對(duì)話中有含義的詞語,表情或詞語都不能直接傳達(dá)此刻的感受。” 6、潛在的隱私風(fēng)險(xiǎn) ??隨著越來越多的技術(shù)試圖描述情感、人格特質(zhì)和行為,并嘗試將相關(guān)技術(shù)推向市場(chǎng),我們的生活受到了更多的監(jiān)視。在科技公司從網(wǎng)上行為中挖掘個(gè)人數(shù)據(jù)已經(jīng)過去20年后,一個(gè)新的、更私密的領(lǐng)域準(zhǔn)備做類似的事情,那就是采集人臉和肢體信息,以及它們所傳達(dá)的信號(hào)。加拿大VSBLTY公司主要銷售智能相機(jī)和用于掃描人群的軟件,這些產(chǎn)品能為零售商分析消費(fèi)者的人口統(tǒng)計(jì)特征和對(duì)產(chǎn)品的反應(yīng)。2020年12月,VSBLTY宣布與墨西哥啤酒制造商莫德羅集團(tuán)建立合作伙伴關(guān)系,計(jì)劃到2027年,要在莫德羅集團(tuán)旗下的5萬家莫德羅拉馬便利店,和墨西哥以及其他拉丁美洲國家的社區(qū)酒店里,配置店內(nèi)攝像頭來獲取數(shù)據(jù)。 ??這就提出了一個(gè)基本的法律和社會(huì)問題:來自你的臉和身體的數(shù)據(jù)屬于你自己嗎?如果把個(gè)人身份與這些數(shù)據(jù)分開,在世界上大多數(shù)地方,答案是否定的。美國辛辛那提大學(xué)法學(xué)院教授詹妮弗·巴德研究過這一問題,她表示:“如果你想知道公共場(chǎng)所中一些人的信息,對(duì)他們進(jìn)行掃描來識(shí)別情感似乎并不受到限制?!?/p> ??大多數(shù)在公共場(chǎng)所采集數(shù)據(jù)的情感AI公司表示,他們收集的信息是匿名的,因此大眾不必對(duì)此擔(dān)憂。Zenus公司的穆塔菲斯指出,Zenus的應(yīng)用程序不會(huì)上傳相機(jī)捕捉的真實(shí)人臉圖像,只會(huì)上傳有關(guān)情感和位置的元數(shù)據(jù)。在進(jìn)行監(jiān)視時(shí),他們會(huì)在會(huì)場(chǎng)的屏幕上展示相關(guān)標(biāo)識(shí),以告知會(huì)議中的人。穆塔菲斯表示:“在采集信息時(shí)告知被采集者其實(shí)是非常好的做法。因?yàn)樽鳛楣?,我們?yīng)該在監(jiān)視行為的區(qū)域內(nèi)張貼標(biāo)志,表示這里正在被監(jiān)視?!辈贿^應(yīng)用程序的多樣性意味著沒有統(tǒng)一的標(biāo)準(zhǔn)。而且,一旦這種例行監(jiān)控成為政治和政策上的問題,普通大眾和政界人士是否會(huì)接受它,還遠(yuǎn)沒有一個(gè)明確的答案。 ??此前埃克曼曾與Emotient公司和蘋果公司在情感AI方面展開過合作,不過,現(xiàn)在他警告稱,情感AI會(huì)對(duì)隱私構(gòu)成威脅,并表示公司有法律義務(wù)取得每位被掃描者的同意?!安恍业氖?,這是一項(xiàng)可以在人們不知情的情況下使用的技術(shù)。情感AI被用在人們身上,卻并不是為了讓他們更幸福。這項(xiàng)技術(shù)還會(huì)讓人們購買原本不會(huì)購買的產(chǎn)品。不過,這可能是情感AI最良性的非良性用途了?!卑?寺a(bǔ)充道。 ??除此之外,情感AI也侵入了私人空間,私人空間儲(chǔ)存著更豐富的行為數(shù)據(jù)。亞馬遜的Alexa(亞馬遜的情感AI系統(tǒng))會(huì)通過分析用戶的語調(diào),尋找沮喪的跡象并據(jù)此改進(jìn)算法。到2023年,一些汽車制造商將推出基于AI的車載系統(tǒng),這些系統(tǒng)將生成大量關(guān)于駕駛員和乘客的行為數(shù)據(jù)。汽車制造商將利用這些數(shù)據(jù)(可能會(huì)是匿名化的),改進(jìn)系統(tǒng)響應(yīng)和車內(nèi)設(shè)計(jì)。情感AI公司Eyeris的首席執(zhí)行官莫達(dá)爾·阿拉維表示,用戶或?qū)⒖梢赃x擇激活系統(tǒng)中不同級(jí)別的功能,因此如果使用者不使用某些功能,系統(tǒng)就不會(huì)從這些地方收集數(shù)據(jù)。 ??亞歷克斯·馬丁內(nèi)斯是美國俄亥俄州立大學(xué)和亞馬遜的計(jì)算機(jī)視覺科學(xué)家。2019年,他與巴雷特合作撰寫了一篇批評(píng)面部表情與情感之間關(guān)聯(lián)性的論文。他總是會(huì)展示一張照片,照片上一個(gè)男人的臉扭曲著,看起來就像是處于一種混雜著憤怒和恐懼的情感中。然后,他將整個(gè)畫面展示出來,結(jié)果那是一名在進(jìn)球后狂喜的足球運(yùn)動(dòng)員。他指出,面部表情和手勢(shì)等信號(hào)不僅是身體和大腦的產(chǎn)物,而且與事情發(fā)生的情境有關(guān),也與一個(gè)人周圍環(huán)境中正在發(fā)生的事情有關(guān)。迄今為止,情感AI面臨的最大挑戰(zhàn)是如何解讀模棱兩可的情境。“除非我知道什么是足球,否則我將永遠(yuǎn)無法理解照片里發(fā)生了什么。因此,這些知識(shí)是基礎(chǔ),不過在解讀情境方面,現(xiàn)在還沒有任何AI系統(tǒng)能做得很好。”馬丁內(nèi)斯解釋道。 ??馬丁內(nèi)斯說,如果縮小任務(wù)的范圍、擁有簡單的環(huán)境,并采集到多樣化的生物特征信息,情感AI將會(huì)變得更加有效。不過,未來將多樣化的生物特征信息整合起來的情感AI,可能只會(huì)是社會(huì)還沒有準(zhǔn)備好迎接的、更強(qiáng)大且更具侵入性的技術(shù)。 ??(本版圖文由《環(huán)球科學(xué)》雜志社供稿 撰文:約翰·麥奎德〔John McQuaid〕 翻譯:施 懌) . |
|