如今,提到人工智能,幾乎無人不談深度學習,似乎不用深度學習就不好意思談人工智能。今天我們就用幾分鐘的時間來講一下深度學習到底是什么,有什么用。 首先深度學習并不等于人工智能,它只是一種算法,和普通的機器學習算法一樣,是解決問題的一種方法。真要區(qū)分起來,人工智能、機器學習和深度學習,三者大概是下圖這種關系。人工智能是一個很大的概念,機器學習是其中的一個子集,而深度學習又是機器學習的一個子集。 其次,深度學習也不是什么新技術,深度學習的概念源于人工神經(jīng)網(wǎng)絡的研究,早在上世紀 40 年代,通用計算機問世之前,科學家就提出了人工神經(jīng)網(wǎng)絡的概念。而那個時候的計算機剛剛開始發(fā)展,速度非常慢,最簡單的網(wǎng)絡也得數(shù)天才能訓練完畢,效率極其低下,因此在接下來的十幾年都沒有被大量使用。近些年,隨著算力的提升,GPU、TPU 的應用,神經(jīng)網(wǎng)絡得到了重大發(fā)展。伴隨著 AlphaGo 的勝利,深度學習也一戰(zhàn)成名。 其實,同機器學習方法一樣,深度學習方法也有監(jiān)督學習與無監(jiān)督學習之分。例如,卷積神經(jīng)網(wǎng)絡(Convolutional Neural Networks,簡稱 CNN)就是一種深度的監(jiān)督學習下的機器學習模型,而深度置信網(wǎng)絡(Deep Belief Nets,簡稱 DBN)就是一種無監(jiān)督學習下的機器學習模型。深度學習的”深度“是指從”輸入層“到”輸出層“所經(jīng)歷層次的數(shù)目,即”隱藏層“的層數(shù),層數(shù)越多,深度也越深。 所以越是復雜的選擇問題,越需要深度的層次多。除了層數(shù)多外,每層”神經(jīng)元“-小圓圈的數(shù)目也要多。例如,AlphaGo 的策略網(wǎng)絡是 13 層,每一層的神經(jīng)元數(shù)量為 192 個。深度學習的實質,是通過構建具有很多隱層的機器學習模型和海量的訓練數(shù)據(jù),來學習更有用的特征,從而最終提升分類或預測的準確性。 深度學習提出了一種讓計算機自動學習出模式特征的方法,并將特征學習融入到了建立模型的過程中,從而減少了人為設計特征造成的不完備性。但是,在有限數(shù)據(jù)量的應用場景下,深度學習算法不能夠對數(shù)據(jù)的規(guī)律進行無偏差的估計。為了達到很好的精度,需要海量數(shù)據(jù)的支撐。另外,深度學習中圖模型的復雜化導致算法的時間復雜度急劇提升,為了保證算法的實時性,需要更高的并行編程技巧和更多更好的硬件支持。 在應用方面,雖然深度學習被吵得火熱,但是也并不是無所不能。目前深度學習主要應用在圖像識別,語音識別等領域。而在很多商業(yè)場景,例如金融數(shù)據(jù),它的效果并不太好,很容易出現(xiàn)過擬合,這在機器學習中是非常致命的問題,即在訓練數(shù)據(jù)上表現(xiàn)的很好,但是泛化能力卻很差,在未見到的數(shù)據(jù)上,表現(xiàn)的很差。深度學習模型很容易受到數(shù)據(jù)中難以察覺的擾動,這些擾動會欺騙模型做出錯誤的預測或分類,而在很多場景的數(shù)據(jù)中是存在著大量噪音的。另外深度學習的過程是一個黑箱子,無法解釋其做出的決策,這也導致在某些場景難以應用,比如一個銀行審批貸款的深度學習系統(tǒng),在拒絕了客戶的貸款申請之后,而無法給出合理的解釋,那么被自動拒絕了貸款的用戶自然無法接受。深度學習模型需要海量的數(shù)據(jù)支撐,算法也比較復雜,模型的訓練速度很慢,通常要幾天甚至數(shù)周,同時還會耗費大量的計算資源,這也限制了它在各行業(yè)的廣泛應用。 因此,深度學習只是機器學習的一種,和其它算法一樣,有自己的長處也有不足。在實際應用中根據(jù)業(yè)務場景和問題選擇合適的算法才能解決問題的有效方法,而不是看誰用了深度學習就去景仰。在一些自動建模產(chǎn)品中,一般也會集成深度學習算法,用戶只要把數(shù)據(jù)丟進去,建模工具就會自動預處理數(shù)據(jù),選擇最優(yōu)算法建好模型,使用起來非常簡單方便。 對進一步數(shù)據(jù)挖掘和 AI 技術感興趣的同學還可以搜索“乾學院”,上面有面向小白的零基礎“數(shù)據(jù)挖掘”免費課程 |
|
來自: raqsoft > 《集算器&潤乾報表》