新智元原創(chuàng)1 作者:聞菲 AlphaGo與李世石的人機(jī)大戰(zhàn)已經(jīng)落下帷幕,但人工智能的卓越表現(xiàn)相信在很長(zhǎng)一段時(shí)間內(nèi)都將深駐人心。不過(guò),在目前的硬件條件下,AlphaGo需要使用巨大的計(jì)算資源;最高配置的AlphaGo被稱為AlphaGo Distributed,它使用了1920個(gè)CPU和280個(gè)GPU。
“要是用寒武紀(jì)的硬件,只需要一個(gè)PC箱就可以運(yùn)行AlphaGo的機(jī)群?!标愄焓芯繂T笑著說(shuō)?!斑\(yùn)算速度也應(yīng)該會(huì)更快?!?/p>
2016年3月15日,新智元記者參加了中國(guó)科學(xué)院計(jì)算技術(shù)研究所舉辦的媒體沙龍,計(jì)算所體系結(jié)構(gòu)國(guó)家重點(diǎn)實(shí)驗(yàn)室未來(lái)計(jì)算課題組的陳天石研究員介紹了“寒武紀(jì)神經(jīng)網(wǎng)絡(luò)處理器”: 國(guó)際上首個(gè)深度學(xué)習(xí)處理器架構(gòu)。 深度學(xué)習(xí)是一類借鑒生物的多層神經(jīng)網(wǎng)絡(luò)處理模式所發(fā)展起來(lái)的智能處理技術(shù)。微軟、Google、Facebook、阿里、訊飛、百度等公司都廣泛地將這類技術(shù)應(yīng)用于計(jì)算機(jī)視覺、語(yǔ)音識(shí)別、自然語(yǔ)言處理、音頻識(shí)別與生物信息學(xué)等領(lǐng)域。要說(shuō)深度學(xué)習(xí)的強(qiáng)大,最好的例子,就是開頭提到的AlphaGo這款基于深度學(xué)習(xí)的圍棋程序。
但是,深度學(xué)習(xí)的基本操作是神經(jīng)元和突觸的處理,而傳統(tǒng)的處理器指令集(包括 x86 和ARM等)對(duì)深度學(xué)習(xí)的處理效率很低,往往需要數(shù)百甚至上千條指令才能完成一個(gè)神經(jīng)元的處理。例證就是,谷歌使用了上萬(wàn)個(gè) x86 CPU核,運(yùn)行了7天的時(shí)間,才訓(xùn)練出一個(gè)識(shí)別貓臉的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)。
因此,神經(jīng)網(wǎng)絡(luò)處理器一直是計(jì)算機(jī)硬件領(lǐng)域少有人觸及的課題——哪怕如今AlphaGo讓“神經(jīng)網(wǎng)絡(luò)”這個(gè)名詞大紅大紫,深度學(xué)習(xí)也成了世界公認(rèn)的重要智能處理技術(shù)。但是,早在深度學(xué)習(xí)這股熱潮興起之前的2008年,還是博士生的陳天石便注意到神經(jīng)網(wǎng)絡(luò)的存在價(jià)值,和同事一起走上了體系結(jié)構(gòu)和人工智能交叉研究的道路,探索神經(jīng)網(wǎng)絡(luò)硬件。交叉領(lǐng)域的研究要得到認(rèn)可并不容易,用陳天石的話說(shuō),就是“第一個(gè)挖坑”。 2012年,陳天石等人提出了國(guó)際上首個(gè)人工神經(jīng)網(wǎng)絡(luò)硬件的基準(zhǔn)測(cè)試集benchNN。這項(xiàng)工作提升了人工神經(jīng)網(wǎng)絡(luò)處理速度,有效加速了通用計(jì)算,大大推動(dòng)了國(guó)際體系結(jié)構(gòu)學(xué)術(shù)圈對(duì)神經(jīng)網(wǎng)絡(luò)的接納度。 此后,陳天石、陳云霽課題組接連推出了一系列不同結(jié)構(gòu)的“寒武紀(jì)”神經(jīng)網(wǎng)絡(luò)專用處理器。2014年,他們?cè)贏SPLOS的文章中實(shí)現(xiàn)了多個(gè)當(dāng)前流行的深度模型,兩獲CCF推薦A類國(guó)際學(xué)術(shù)會(huì)議的最佳論文獎(jiǎng),并被《美國(guó)計(jì)算機(jī)學(xué)會(huì)通訊》遴選為研究亮點(diǎn),在深度學(xué)習(xí)的硬件領(lǐng)域邁出了堅(jiān)實(shí)的一步。 2016年3月,陳云霽、陳天石課題組提出的寒武紀(jì)深度學(xué)習(xí)處理器指令集DianNaoYu被計(jì)算機(jī)體系結(jié)構(gòu)領(lǐng)域的頂級(jí)國(guó)際會(huì)議ISCA 2016接收,在所有近300篇投稿中排名第一。論文的第一作者為劉少禮博士。
DianNaoYu指令直接面對(duì)大規(guī)模神經(jīng)元和突觸的處理,一條指令即可完成一組神經(jīng)元的處理,并對(duì)神經(jīng)元和突觸數(shù)據(jù)在芯片上的傳輸提供了一系列專門的支持。模擬實(shí)驗(yàn)表明,采用DianNaoYu指令集的深度學(xué)習(xí)處理器相對(duì)于 x86指令集的CPU有兩個(gè)數(shù)量級(jí)的性能提升。
ISCA(International Symposium on Computer Architecture)被公認(rèn)為是計(jì)算機(jī)體系結(jié)構(gòu)領(lǐng)域最重要的國(guó)際會(huì)議。四十多年來(lái),計(jì)算機(jī)硬件的多項(xiàng)核心創(chuàng)新都出自于ISCA,包括RISC、緩存一致性、動(dòng)態(tài)多發(fā)射等。我國(guó)迄今在該會(huì)議上發(fā)表論文僅十余篇。自2014年中科院計(jì)算所提出首個(gè)深度學(xué)習(xí)處理器“寒武紀(jì)”之后,深度學(xué)習(xí)處理器已經(jīng)成為ISCA最為關(guān)注的研究方向之一。ISCA 2016上,有近1/6的論文(來(lái)自MIT、斯坦福和UCSD等國(guó)際知名機(jī)構(gòu))都引用“寒武紀(jì)”的工作進(jìn)行深度學(xué)習(xí)處理器探索。
“我們團(tuán)隊(duì)都是土博士,洋人不帶我們玩兒,完全是憑著我們的工作成果才跟隨過(guò)來(lái)?!标愄焓院赖卣f(shuō):“但即使有這么多人跟進(jìn),我們還是第一?!?/p> 指令集是計(jì)算機(jī)軟硬件生態(tài)體系的核心。Intel 和ARM正是通過(guò)其指令集控制了PC和嵌入式生態(tài)體系。寒武紀(jì)在深度學(xué)習(xí)處理器指令集上的開創(chuàng)性進(jìn)展,為中國(guó)占據(jù)智能產(chǎn)業(yè)生態(tài)的領(lǐng)導(dǎo)性地位提供了技術(shù)支撐。
陳天石研究員特別感謝了“中科院戰(zhàn)略性先導(dǎo)科技專項(xiàng)”,正是有了專項(xiàng)的資金支持,才能讓“寒武紀(jì)”這個(gè)國(guó)際首個(gè)深度學(xué)習(xí)處理器架構(gòu)保有中外專利。
據(jù)陳天石透露,與寒武紀(jì)處理器相關(guān)的產(chǎn)業(yè)化工作已經(jīng)啟動(dòng),未來(lái)幾個(gè)月之內(nèi)就會(huì)運(yùn)行寒武紀(jì)公司。接下來(lái),他們將專注于深度學(xué)習(xí)處理器的產(chǎn)業(yè)化運(yùn)營(yíng),主要分為高性能服務(wù)器芯片、高能效終端芯片和服務(wù)機(jī)器人芯片這三方面的轉(zhuǎn)化工作,力求“服務(wù)于民用市場(chǎng),滿足國(guó)家重大需求”。
“很多人都問,我們的處理器為什么要叫‘寒武紀(jì)’,”陳天石說(shuō):“因?yàn)楹浼o(jì)是生物‘大爆炸’的時(shí)代,現(xiàn)在也像是人工智能大爆炸的時(shí)代?!?/p>
“但是,寒武紀(jì)之后地球上也遭遇了生物大滅絕,”他接著說(shuō),席間有笑聲響起,“人工智能也會(huì)迎來(lái)衰退或滅絕期,這是自然規(guī)律”。不過(guò),他希望“寒武紀(jì)”能在接下來(lái)的衰退乃至滅絕(如果發(fā)生的話)當(dāng)中存活下來(lái),并且發(fā)展得更好。 “寒武紀(jì)能支持各種智能主機(jī)和終端,進(jìn)一步將應(yīng)用面擴(kuò)展到更多算法上?!?/p> |
|