(原標(biāo)題:機(jī)器視覺(jué)知名教授山世光:面對(duì)AI,人類的機(jī)會(huì)在哪里?) 5月21日,在音樂(lè),科技與藝術(shù)相結(jié)合的MTA天漠音樂(lè)節(jié),投身CV領(lǐng)域創(chuàng)業(yè)的中科院計(jì)算所山世光教授,從計(jì)算機(jī)視覺(jué)的視角與我們分享了這一輪人工智能熱潮的特點(diǎn),以及他本人投身創(chuàng)業(yè)后的一些進(jìn)展。 首先,山世光教授從事實(shí)層面列舉了我們應(yīng)用計(jì)算機(jī)視覺(jué)技術(shù)的一些例子,計(jì)算機(jī)也已經(jīng)開(kāi)始能夠執(zhí)行像我們小時(shí)候進(jìn)行的“看圖說(shuō)話”的語(yǔ)言任務(wù),這就是自動(dòng)圖題技術(shù)。而最典型的應(yīng)用可能就是時(shí)下諸多公司參與的自動(dòng)駕駛。此外,近五年來(lái),計(jì)算機(jī)分類識(shí)別物體的錯(cuò)誤率基本上都是以每年下降一半的速度在提升。 而計(jì)算機(jī)視覺(jué)技術(shù)的進(jìn)步,得益于3大引擎的推動(dòng)作用:1.GPU的普及所帶來(lái)的計(jì)算能力的提升;2.大數(shù)據(jù)的運(yùn)用;3.深度學(xué)習(xí)算法的復(fù)興。 針對(duì)人工智能的探討,永遠(yuǎn)引人入勝的話題還包括人類和智能的比較。對(duì)這一類問(wèn)題,山世光教授也分享了他的認(rèn)識(shí)。 他引用了李開(kāi)復(fù)老師在公開(kāi)發(fā)表過(guò)場(chǎng)合的觀點(diǎn):10年后,人工智能會(huì)取代世界上很多職業(yè),50%的工作都可能被取代,其中包括翻譯、記者、助理,包括保安、司機(jī)、銷售等。 或許觀點(diǎn)上存在“仁者見(jiàn)仁,智者見(jiàn)智”,那么究竟如何評(píng)判什么職業(yè)會(huì)被取代,這就先要解答AI更容易在哪些領(lǐng)域超越人類,又在哪些地方還有待突破。 山世光教授介紹,AI擅長(zhǎng)的是通過(guò)大量的數(shù)據(jù)進(jìn)行歸納學(xué)習(xí)。而人類學(xué)習(xí)除了歸納法外,還包括演繹推理,但需要推理的部分,深度學(xué)習(xí)目前還沒(méi)有辦法解決。通過(guò)自我判斷對(duì)錯(cuò)的增強(qiáng)學(xué)習(xí),也是目前機(jī)器無(wú)法做到的。所以現(xiàn)階段的AI,比較適合于數(shù)據(jù)采集、獲取、標(biāo)注比較便利的領(lǐng)域,包括計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別等領(lǐng)域。 由此可見(jiàn),AI容易超越人類的領(lǐng)域有兩大類別:第一類是巨量空間的搜索問(wèn)題或者檢索問(wèn)題;第二類是通過(guò)經(jīng)驗(yàn)習(xí)得技能的領(lǐng)域,如自動(dòng)駕駛、醫(yī)療讀圖。 那么,人類的機(jī)會(huì)在哪里?山世光教授認(rèn)為,盡管人類在認(rèn)知能力沒(méi)有像機(jī)器一樣日新月異的進(jìn)步,但人腦除了數(shù)據(jù)學(xué)習(xí)能力外,還有邏輯推理能力。人類能夠主動(dòng)為自己設(shè)計(jì)算法模型,還能夠主動(dòng)收集數(shù)據(jù)。通用的AI還沒(méi)有出現(xiàn)的跡象,當(dāng)前的AI都是針對(duì)特定領(lǐng)域的。 最后,山世光教授分享了他本人投身創(chuàng)業(yè)后的一些進(jìn)展。他在去年創(chuàng)辦了中科視拓,為各行各業(yè)的用戶、客戶,提供基于私有數(shù)據(jù),生產(chǎn)自己的AI引擎的能力。目前他們已經(jīng)為華為做了手機(jī)里的人臉識(shí)別,也與中國(guó)移動(dòng)、中國(guó)平安等客戶進(jìn)行了合作。 以下是山世光的演講原文: 大家好!我是來(lái)自中科院計(jì)算所的山世光。在大概2、3年前,我們進(jìn)入了新一輪的人工智能的熱潮,我們稱之為第三次人工智能的熱潮。我下面從計(jì)算機(jī)視覺(jué),也就是我們希望機(jī)器能夠像人一樣看世界的視角來(lái)探索一下人工智能這一輪熱潮有什么特點(diǎn)。 首先,簡(jiǎn)單舉幾個(gè)例子,計(jì)算機(jī)視覺(jué),也就是說(shuō)在機(jī)器有了攝像頭之后,它可以做什么?比如說(shuō),最典型的例子,自動(dòng)駕駛,或者是汽車輔助駕駛里,特別是以特斯拉為代表的自動(dòng)駕駛的,或者是輔助駕駛的,已經(jīng)可以實(shí)現(xiàn)對(duì)道路上的汽車、行人、車道線等這樣一些物體的檢測(cè)、識(shí)別。同時(shí),利用檢測(cè)到的車、人,能夠幫助我們進(jìn)行駕駛。 例子二:從計(jì)算機(jī)視覺(jué)做算法的角度來(lái)講,在過(guò)去3、4年時(shí)間里,我們可以明確地看到,從2012年到2015年,我們讓計(jì)算機(jī)正確的分類它所看到的物體是什么這樣一個(gè)問(wèn)題上,錯(cuò)誤率基本上都是以每年下降一半的速度在提升。 例子三:自動(dòng)圖題技術(shù) 我們可以想象成,給大家一張照片,讓機(jī)器自動(dòng)描述,或者寫(xiě)一段話來(lái)介紹這張照片里有什么樣的內(nèi)容。比如說(shuō)有一張照片,機(jī)器可以自動(dòng)生成一句話來(lái)描述這是在一個(gè)開(kāi)放的市場(chǎng)上,有很多人在購(gòu)物(菜市場(chǎng))。這是類似于我們小時(shí)候看圖作文的任務(wù),這也是計(jì)算機(jī)視覺(jué)非常重要的任務(wù)。 大家在過(guò)去1、2年里,每年刷臉的次數(shù)也在不斷增加。我相信,在未來(lái)的時(shí)間,我們每年刷臉的次數(shù),在明年也許會(huì)增加到10次,未來(lái)會(huì)是上百次,甚至是更多的場(chǎng)景。我們用這樣一個(gè)系統(tǒng)來(lái)刷你的身份證,來(lái)判斷你是不是這個(gè)身份證合法的持有人。 |
|
來(lái)自: qiangyukun > 《文件夾1》