今天,超模君看到斯坦福著名教授吳恩達(dá)(Andrew Ng,全球最知名的人工智能專家之一)開課講深度學(xué)習(xí)的消息刷遍票圈,百度一搜也是源源不斷的報(bào)道: 其實(shí),超模君默默研究深度學(xué)習(xí)也有一段時(shí)間了。從AlphaGo與人類的圍棋大戰(zhàn)到各種機(jī)器人,近幾年來,深度學(xué)習(xí)的熱度只增不減。 前段時(shí)間馬云爸爸搞的無(wú)人超市也火了一把,里面的智能系統(tǒng)也采用了深度學(xué)習(xí)算法。 而這一波新型人工智能應(yīng)用背后的主要驅(qū)動(dòng)因素之一就是——深度學(xué)習(xí)。 可能很多人還不太了解深度學(xué)習(xí),那今天,超模君就自己的理解,給大家講講深度學(xué)習(xí)到底是怎么個(gè)玩意兒吧~ 深度學(xué)習(xí)是機(jī)器學(xué)習(xí)研究中的一個(gè)新的領(lǐng)域,目的在于建立、模擬人腦進(jìn)行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),模仿人腦的機(jī)制來解釋數(shù)據(jù)。 通俗來說,深度學(xué)習(xí)探索了神經(jīng)網(wǎng)絡(luò)的概率空間,這是傳統(tǒng)的機(jī)器學(xué)習(xí)工具所做不到的。與其他工具相比,深度學(xué)習(xí)算法更適合未標(biāo)記數(shù)據(jù)、特征提取(深度框架),也更適合于模式識(shí)別(圖像、文本、音頻)。 從根本上說,深度學(xué)習(xí)和所有機(jī)器學(xué)習(xí)方法一樣,是一種用數(shù)學(xué)模型對(duì)真實(shí)世界中的特定問題進(jìn)行建模,以解決該領(lǐng)域內(nèi)相似問題的過程。 講到深度學(xué)習(xí),常常會(huì)提及幾個(gè)術(shù)語(yǔ):
簡(jiǎn)單地說,深度學(xué)習(xí)就是把計(jì)算機(jī)要學(xué)習(xí)的東西看成一大堆數(shù)據(jù),把這些數(shù)據(jù)丟進(jìn)一個(gè)復(fù)雜的、包含多個(gè)層級(jí)的數(shù)據(jù)處理網(wǎng)絡(luò)(深度神經(jīng)網(wǎng)絡(luò)),然后檢查經(jīng)過這個(gè)網(wǎng)絡(luò)處理得到的結(jié)果數(shù)據(jù)是否符合要求: ——如果符合,就保留這個(gè)網(wǎng)絡(luò)作為目標(biāo)模型 ——如果不符合,就不斷地調(diào)整網(wǎng)絡(luò)的參數(shù)設(shè)置,直到輸出滿足要求為止 (能不能說人話) 換種更直觀的說法~ 假設(shè)深度學(xué)習(xí)要處理的數(shù)據(jù)是信息的“水流”,而處理數(shù)據(jù)的深度學(xué)習(xí)網(wǎng)絡(luò)是一個(gè)由管道和閥門組成的巨大的水管網(wǎng)絡(luò)。網(wǎng)絡(luò)的入口是若干管道開口,網(wǎng)絡(luò)的出口也是若干管道開口。 這個(gè)水管網(wǎng)絡(luò)有許多層,每一層有許多個(gè)可以控制水流流向與流量的調(diào)節(jié)閥。根據(jù)不同任務(wù)的需要,水管網(wǎng)絡(luò)的層數(shù)、每層的調(diào)節(jié)閥數(shù)量可以有不同的變化組合。 水管網(wǎng)絡(luò)中,每一層的每個(gè)調(diào)節(jié)閥都通過水管與下一層的所有調(diào)節(jié)閥連接起來,組成一個(gè)從前到后,逐層完全連通的水流系統(tǒng)。(這里說的是一種比較基本的情況,不同的深度學(xué)習(xí)模型,在水管的安裝和連接方式上是有差別的) 以識(shí)字為例,計(jì)算機(jī)該如何使用這個(gè)龐大的水管網(wǎng)絡(luò)來學(xué)習(xí)識(shí)字呢? 比如,當(dāng)計(jì)算機(jī)看到一張寫有“田”字的圖片時(shí),就簡(jiǎn)單將組成這張圖片的所有數(shù)字(在計(jì)算機(jī)里,圖片的每個(gè)顏色點(diǎn)都是用“0”和“1”組成的數(shù)字來表示的)全都變成信息的水流,從入口灌進(jìn)水管網(wǎng)絡(luò)。 我們預(yù)先在水管網(wǎng)絡(luò)的每個(gè)出口都插一塊字牌,對(duì)應(yīng)于每一個(gè)我們想讓計(jì)算機(jī)認(rèn)識(shí)的漢字。 這時(shí),因?yàn)檩斎氲氖恰疤铩边@個(gè)漢字,等水流流過整個(gè)水管網(wǎng)絡(luò),計(jì)算機(jī)就會(huì)跑到管道出口位置去看一看,是不是標(biāo)記有“田”字的管道出口流出來的水流最多。 ——如果是這樣,就說明這個(gè)管道網(wǎng)絡(luò)符合要求 ——如果不是這樣,我們就給計(jì)算機(jī)下達(dá)命令:調(diào)節(jié)水管網(wǎng)絡(luò)里的每一個(gè)流量調(diào)節(jié)閥,讓“田”字出口“流出”的數(shù)字水流最多 下一步,學(xué)習(xí)“申”字時(shí),我們就用類似的方法,把每一張寫有“申”字的圖片變成一大堆數(shù)字組成的水流,灌進(jìn)水管網(wǎng)絡(luò),看看是不是寫有“申”字的那個(gè)管道出口流出來的水最多,如果不是,我們還得再次調(diào)整所有的調(diào)節(jié)閥。 注意!這一次,不僅要保證剛才學(xué)過的“田”字不受影響,也要保證新的“申”字可以被正確處理。 如此反復(fù)進(jìn)行,直到所有漢字對(duì)應(yīng)的水流都可以按照期望的方式流過整個(gè)水管網(wǎng)絡(luò)。這時(shí),我們就說,這個(gè)水管網(wǎng)絡(luò)已經(jīng)是一個(gè)訓(xùn)練好的深度學(xué)習(xí)模型了。 與訓(xùn)練時(shí)做的事情類似,未知的圖片會(huì)被計(jì)算機(jī)轉(zhuǎn)變成數(shù)據(jù)的水流,灌入訓(xùn)練好的水管網(wǎng)絡(luò)。這時(shí),計(jì)算機(jī)只要觀察一下,哪個(gè)出口流出來的水流最多,這張圖片寫的就是哪個(gè)字。 神經(jīng)網(wǎng)絡(luò)并不神秘,它就是利用圖的處理能力幫助我們對(duì)特征的提取和學(xué)習(xí)的過程。Hinton(人稱“深度學(xué)習(xí)開山祖師爺”)曾將深度學(xué)習(xí)總結(jié)成三個(gè)最重要的要素:計(jì)算、數(shù)據(jù)、模型。有了這三點(diǎn),就可以實(shí)現(xiàn)一個(gè)深度學(xué)習(xí)的系統(tǒng)。 深度學(xué)習(xí)在大數(shù)據(jù)集上的表現(xiàn)比其他機(jī)器學(xué)習(xí)(ML)方法都要好,所以也逐漸受到更多人的重視。 吳恩達(dá)曾說:“神經(jīng)網(wǎng)絡(luò)代表的深度學(xué)習(xí)是讓我們獲得最接近于人工智能的捷徑”。 而當(dāng)今的各行業(yè)各業(yè),一般都在經(jīng)歷著兩大技術(shù)的洗禮,一次是 IT,另一次就是 AI。雖然教育行業(yè)當(dāng)前仍以 IT 化為主要變革方向,但AI的作用也越來越重要。 人工智能的時(shí)代無(wú)疑已經(jīng)到來,這個(gè)時(shí)代需要的當(dāng)然就是掌握了人工智能并將其解決具體問題的程序猿和工程獅。而深度學(xué)習(xí),將成為解決人工智能問題的利器。 講到深度學(xué)習(xí),不得不提兩款主流學(xué)習(xí)框架:Caffe和Tensorflow。 在深度學(xué)習(xí)領(lǐng)域,Caffe框架是人們無(wú)法繞過的一座山。它在結(jié)構(gòu)、性能上、代碼質(zhì)量上,都稱得上一款十分出色的開源框架,具有上手快、速度快、模塊化等優(yōu)點(diǎn)。 TensorFlow是一個(gè)采用數(shù)據(jù)流圖(data flow graphs),用于數(shù)值計(jì)算的開源軟件庫(kù),具有高度的靈活性、真正的可移植性等優(yōu)點(diǎn)。 在圖像處理方面Tensoflow還有這種操作 ↓ 通過Tensorflow 學(xué)習(xí)Leonid Afremov 的繪畫風(fēng)格(圖二)處理的圖片效果(圖三) 以及這種 ↓ 用梵高著名的作品”星月夜“的風(fēng)格(下)加工成了新的視頻風(fēng)格(上) 這種 ↓ (給黑白素描畫自動(dòng)上色) |
|