八十年代是 PC(筆記本電腦)的時(shí)代,九十年代是互聯(lián)網(wǎng)的時(shí)代,2000年至今是智能手機(jī)的時(shí)代。從現(xiàn)在起一直到未來十年,我們將逐漸邁入深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的時(shí)代。這種狀態(tài)將一直持續(xù),直到下一個(gè)范式轉(zhuǎn)變,大眾技術(shù)獲得突破。這種突破不僅僅是 AI 或機(jī)器學(xué)習(xí)方面的突破,具體來說,主要是指深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)。如果你只能看一篇文章,那么我建議你跳過這篇文章,直接閱讀鏈接中的這篇來自紐約時(shí)報(bào)的文章(https://www./2016/12/14/magazine/the-great-ai-awakening.html),文章雖然很長,但是卻非常的詳細(xì),主要討論的是下一個(gè)十年的重要的轉(zhuǎn)變趨勢。 https://www./2016/12/14/magazine/the-great-ai-awakening.html 如果可以用數(shù)字化的形式來表示(例如圖像),或者是像數(shù)據(jù)一樣從數(shù)據(jù)庫中獲取,那么就會(huì)有大量的數(shù)據(jù)樣本用于深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練。以下是其簡要概述: 人類大腦是如何學(xué)習(xí)的? 人類大腦大約由1000億個(gè)神經(jīng)元組成,神經(jīng)元之間相互連接形成大約100萬億個(gè)突觸。對(duì)于特定的輸入,神經(jīng)元要么處于關(guān)閉狀態(tài),要么處于開啟的狀態(tài)。神經(jīng)元之間的互連作用建立在積極強(qiáng)化的概念上——每組輸入對(duì)應(yīng)特定的輸出,“大腦”會(huì)正確地記住該路徑,并且以關(guān)聯(lián)的方式進(jìn)行“學(xué)習(xí)”。積極的反饋會(huì)被記住,相應(yīng)地,連接之間也會(huì)起到相互促進(jìn)的作用。隨著計(jì)算能力和其他研究在未來的進(jìn)一步突破,也許在2030年將會(huì)出現(xiàn)更好的腦機(jī)接口技術(shù)或者其他相關(guān)的技術(shù)。當(dāng)然,現(xiàn)在我們只能學(xué)習(xí)深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)。所以,今天我們就來學(xué)習(xí)一下深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)。 什么是深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)? 從計(jì)算模型來講,深度神經(jīng)網(wǎng)絡(luò)就只是一個(gè)數(shù)學(xué)公式——這是現(xiàn)今模仿人類大腦功能的最佳相似模型,雖然沒有一個(gè)地方是非常接近的,因?yàn)槿祟惖拇竽X比任何設(shè)計(jì)出來的機(jī)器大腦都更加復(fù)雜和強(qiáng)大。但是,我們能夠設(shè)計(jì)出一個(gè)僅僅擅長一項(xiàng)或者多項(xiàng)任務(wù)的神經(jīng)網(wǎng)絡(luò),而且這個(gè)神經(jīng)網(wǎng)絡(luò)能在特定的任務(wù)中良好的學(xué)習(xí),甚至比人類的表現(xiàn)更好,但是這并不是我們所理解的“智能”。它不會(huì)將在某一個(gè)任務(wù)中學(xué)到的知識(shí)遷移到另一個(gè)任務(wù)中來使用。機(jī)器學(xué)習(xí)的應(yīng)用是一種特殊的技術(shù),目前已經(jīng)從研究階段過渡到應(yīng)用階段,任何人都可以去創(chuàng)建和訓(xùn)練自己的神經(jīng)網(wǎng)絡(luò)模型。 深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)如何學(xué)習(xí)? 人工神經(jīng)元(又稱感知器或者S形神經(jīng)元等等)經(jīng)設(shè)計(jì)已經(jīng)應(yīng)用于計(jì)算模型之中,該計(jì)算模型通過其所獲取的一組輸入數(shù)據(jù)和關(guān)鍵參數(shù)來構(gòu)建模式匹配模型,并且形成一定的正反饋路徑,從而得到預(yù)期的輸出結(jié)果。例如,從一張圖片中識(shí)別出鍵盤的過程。圖片中最基本、最核心的元素是處于打開或者關(guān)閉狀態(tài)的按鍵像素點(diǎn),這些像素點(diǎn)非常小。然后,模式匹配模型會(huì)通過這些像素點(diǎn)推導(dǎo)出按鍵圖案。最后,模式匹配模型再通過其識(shí)別出的按鍵推導(dǎo)出計(jì)算機(jī)鍵盤。 上述神經(jīng)網(wǎng)絡(luò)通過成千上萬個(gè)已經(jīng)標(biāo)記好的數(shù)據(jù)(這里是鍵盤圖片)進(jìn)行訓(xùn)練,從而得到一個(gè)正反饋模型。訓(xùn)練神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)質(zhì)量越高,模型得到的效果也就越好。如果數(shù)據(jù)本身就存在一定的偏差,那么訓(xùn)練出的模型的識(shí)別系統(tǒng)仍將很差。這里并沒有什么“智能”——系統(tǒng)只是具備了你教給它的一些功能而已。 http:///mentorcontest 為什么現(xiàn)在是神經(jīng)網(wǎng)絡(luò)的時(shí)代? 大數(shù)據(jù)、機(jī)器學(xué)習(xí)和計(jì)算能力的顯著提高都是推動(dòng)深度學(xué)習(xí)不斷發(fā)展的關(guān)鍵因素。如果沒有訓(xùn)練神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù),那么就沒有 AI,更沒有什么奇跡可言。 雖然神經(jīng)網(wǎng)絡(luò)的概念已經(jīng)存在了一段時(shí)間了,但是直到2012年,Geoffrey Hinton 等研究人員才讓神經(jīng)網(wǎng)絡(luò)又一次成為熱門的基礎(chǔ)研究。Google 率先進(jìn)行了某些非常有意思的實(shí)驗(yàn),Google Brain 團(tuán)隊(duì)將神經(jīng)網(wǎng)絡(luò)的理論轉(zhuǎn)換成了現(xiàn)實(shí)。先是“發(fā)現(xiàn)貓”的實(shí)驗(yàn)演示,研究人員使用 YouTube 中貓的圖片去訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,經(jīng)過一段時(shí)間之后,模型竟然可以從沒有標(biāo)記的數(shù)據(jù)中識(shí)別出“貓”的圖片。研究人員瞬間被震驚了。 Google翻譯——從規(guī)則表達(dá)模型轉(zhuǎn)換到深度神經(jīng)網(wǎng)絡(luò)模型 真正的轉(zhuǎn)折點(diǎn)發(fā)生在2016年11月,Google 將它們的翻譯模型從原來的規(guī)則表達(dá)模型轉(zhuǎn)換到了深度神經(jīng)網(wǎng)絡(luò)模型。新的模型能夠?qū)W習(xí)先前十多年的翻譯數(shù)據(jù),翻譯效果要好得多。 TensorFlow 同時(shí),Google 還開源了自身產(chǎn)品使用的機(jī)器學(xué)習(xí)平臺(tái),這個(gè)平臺(tái)叫做 TensorFlow。在 Google 提供的預(yù)先訓(xùn)練好的深度學(xué)習(xí)模型的幫助下,任何人都能進(jìn)行深度學(xué)習(xí)。一名日本的研究員曾使用 TensorFlow 讓機(jī)器實(shí)現(xiàn)了以下功能:根據(jù)黃瓜的外形,自動(dòng)進(jìn)行分類。之所以這樣做是因?yàn)樗母改付际寝r(nóng)民,如果雇傭一名員工來分揀黃瓜,將會(huì)十分麻煩。 所有科技巨頭都對(duì)人工智能進(jìn)行了大量的投資 隨著 Google、微軟、Facebook、百度和其他科技巨頭研究水平的提高,肯定會(huì)誕生很多好的、技術(shù)過硬的產(chǎn)品,這些公司相當(dāng)于我們這一代的“貝爾實(shí)驗(yàn)室”。博士再次成為了熱門人選,我在一個(gè)關(guān)注深度學(xué)習(xí)的投資者的博客中看到,一個(gè)剛剛畢業(yè)的深度學(xué)習(xí)博士生價(jià)值高達(dá)幾百萬美元。在紐約時(shí)報(bào)的文章中, Facebook 的首席執(zhí)行官馬克·扎克伯格親自花時(shí)間和深度學(xué)習(xí)領(lǐng)域的杰出人才見面。 投資者們已經(jīng)為 AI 初創(chuàng)公司投資了10億多美元。 (http:///2016/09/29/building-an-ai-startup/) 在哪里會(huì)用到神經(jīng)網(wǎng)絡(luò)模型? 其實(shí),神經(jīng)網(wǎng)絡(luò)模型不但可以識(shí)別/分類目標(biāo),還可以進(jìn)行預(yù)測。 例如,我們只能看到一張圖片的一部分,要把剩下的圖片補(bǔ)全。其中一個(gè)應(yīng)用在 Google 的一個(gè)叫做 RAZR 的項(xiàng)目中被廣泛的測試應(yīng)用。用戶先從手機(jī)上面下載一張低分辨率的圖像,然后通過機(jī)器學(xué)習(xí)把分辨率提高,這能幫助我們節(jié)約很多流量。 那么,我們是否也可以改善放射科醫(yī)生的診斷報(bào)告呢?比如,讓全國最好的放射科醫(yī)生提供最好的數(shù)據(jù),然后用這些數(shù)據(jù)去訓(xùn)練神經(jīng)網(wǎng)絡(luò)。接下來,這個(gè)神經(jīng)網(wǎng)絡(luò)模型就可以讀取你的報(bào)告,并且分析得到結(jié)果。這種服務(wù),是不是會(huì)比單個(gè)放射科醫(yī)生給出的報(bào)告更加的好呢?或者更加的可靠? 神經(jīng)網(wǎng)絡(luò)是否還能去規(guī)劃路線呢?比如,找到從點(diǎn)A到點(diǎn)B的最便利路徑。如果可以實(shí)現(xiàn)這個(gè)功能,那么就能超越現(xiàn)在所有默認(rèn)的地圖應(yīng)用程序。事實(shí)上,Google 的 Waze 地圖應(yīng)用已經(jīng)積累了很多的用戶數(shù)據(jù),這些數(shù)據(jù)可以用來訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,從而給用戶提供更好的路線規(guī)劃。 在體育方面,我們可以讓神經(jīng)網(wǎng)絡(luò)“學(xué)習(xí)”競爭對(duì)手的視頻數(shù)據(jù),幫助教練設(shè)計(jì)更好的訓(xùn)練方案。 如果結(jié)合 AR 技術(shù),使用手機(jī)掃描餐桌上面的食物,你馬上就能知道桌上的食物是什么,它們包含了哪些營養(yǎng)成分。這個(gè)功能可以幫助人們吃得更加健康。這樣一來,對(duì)食物過敏的人,可以吃的更加放心,因?yàn)槠綍r(shí)根本不能100%的保證食品的安全。 A picture of a bread analyzed and associated labels identified by a Google service 談?wù)劻奶鞕C(jī)器人? 目前,人們對(duì)聊天機(jī)器人的熱情非常高。但是,目前的聊天機(jī)器人基本上都是一些面向用戶的界面產(chǎn)品。雖然,深度學(xué)習(xí)已經(jīng)成為了自然語言處理的基礎(chǔ),它會(huì)去推斷用戶在說些什么,并且盡可能的像人類一樣做出答復(fù)。但是真正的交易是神經(jīng)網(wǎng)絡(luò)從大量的數(shù)據(jù)中推導(dǎo)出來的高質(zhì)量的對(duì)話,而這些對(duì)話可以讓產(chǎn)品變得更加友好。這就好比麥當(dāng)勞,即使你把菜單做的比過去更加漂亮,更加友好,但是人們最關(guān)心的依舊是它的實(shí)際的產(chǎn)品——食物。利用深度學(xué)習(xí)可以讓產(chǎn)品變得越來越好——這會(huì)越來越有趣。 深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)并不是一個(gè)時(shí)髦的東西,它其實(shí)很早就存在了,只是最近才從實(shí)驗(yàn)室走出來,出現(xiàn)在消費(fèi)者的面前,并且進(jìn)入了一個(gè)快速增長的階段,滲透到了我們生活的方方面面。對(duì)于那些想要取得重大突破而又雄心勃勃的創(chuàng)業(yè)公司來說,深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)沒有什么捷徑。必須設(shè)計(jì)出自己特定的模型,更具體的說,就是讓科技巨頭很難復(fù)制自己的模型。 利用神經(jīng)網(wǎng)絡(luò)構(gòu)建圖模型 本章節(jié)是我比較喜歡的——對(duì)我來說,最有趣的事情之一就是在圖上進(jìn)行神經(jīng)網(wǎng)絡(luò)的訓(xùn)練。如果你的社交網(wǎng)絡(luò)上有你的朋友 Mark,那么你將非常有可能認(rèn)識(shí) Maria 和 Jenny,這會(huì)增強(qiáng)你的參與感,體驗(yàn)過程也會(huì)更加愉悅。這個(gè)過程非常迷人,充滿了無盡的可能性。 AI 的下一步是什么? David Quail 在另外一個(gè)論壇中對(duì)本篇文章做出了相關(guān)的評(píng)論,因?yàn)槲艺J(rèn)為這個(gè)評(píng)論跟今天的文章非常相關(guān),所以摘錄如下:
在真實(shí)世界里,AI 應(yīng)當(dāng)具備基本的“常識(shí)”,應(yīng)當(dāng)能夠預(yù)測諸如“視頻下幾個(gè)幀是什么”這樣的問題。這將是一個(gè)新的機(jī)遇和挑戰(zhàn),但是我不知道多久才能實(shí)現(xiàn)。 我認(rèn)為,目前的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)已經(jīng)足夠好了,即使它需要訓(xùn)練一個(gè)非常大的數(shù)據(jù)集才能完成訓(xùn)練過程,并且只能在某個(gè)特定的任務(wù)上面才能正常工作。我們需要通過大眾應(yīng)用程序(例如,Waze 采用的方法)或者通過其他方式(比如,特定播放器或者團(tuán)隊(duì)的體育視頻存檔)來提供大量的優(yōu)質(zhì)數(shù)據(jù)集。世界對(duì)于我們來說本來就是可視的——如果我們拍一張照片,我們可以把這張照片進(jìn)行數(shù)字化處理,從而進(jìn)行分析并訓(xùn)練神經(jīng)網(wǎng)絡(luò)。有些創(chuàng)業(yè)公司已經(jīng)開始去設(shè)計(jì)自己的特定的數(shù)據(jù)收集路線,并且把這些數(shù)據(jù)用于訓(xùn)練自己的神經(jīng)網(wǎng)絡(luò)模型,向用戶提供更好的服務(wù)。這些公司在未來將會(huì)獲得更多的收益。 強(qiáng)化人類,而不是在職業(yè)上直接替換人類? 在一個(gè)擁有70多億人口的地球上,人們的預(yù)期壽命比以往任何一個(gè)時(shí)候都要長。那么,在我們改變對(duì) AI 的態(tài)度之前,它還有多少進(jìn)步空間呢?不管怎么樣,我們都需要采取一些防范措施,防止大量失業(yè)現(xiàn)象。如果零售商、出租車司機(jī)、客服人員、教練、放射科醫(yī)生、甚至是藝術(shù)家等都被 AI 替代,因?yàn)?AI 能做的更好而且也更加便宜,那么人類會(huì)做什么工作來謀生呢?他們又需要什么技能? 即使作為一個(gè)有些水平的計(jì)算機(jī)程序員和數(shù)據(jù)分析師——我也不能確定,在10年后,計(jì)算機(jī)程序員和數(shù)據(jù)分析師是否還是一個(gè)由人類工作的職業(yè)——如果能設(shè)計(jì)出一個(gè)神經(jīng)網(wǎng)絡(luò),它就可以編寫更好的代碼,并且其分析能力比我更好。因?yàn)槲揖帉懘a和分析數(shù)據(jù)時(shí)都有一個(gè)特定的模式,AI 可以對(duì)我的工作進(jìn)行分析,然后重新對(duì)自身進(jìn)行編程,從而取代我的工作。而且,AI可以從不同的角度以更好的方式進(jìn)行學(xué)習(xí)和預(yù)測。根據(jù) WSJ 的這篇文章,即使讓 AI 自動(dòng)編碼,管理世界上最大的對(duì)沖基金也不是問題。 http://www./articles/the-worlds-largest-hedge-fund-is-building-an-algorithmic-model-of-its-founders-brain-1482423694 那么,我該怎么辦呢?或許是開始創(chuàng)建自己的大眾應(yīng)用程序,獲取大量的數(shù)據(jù)(在還沒有人做的垂直領(lǐng)域上),構(gòu)建自己的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),并且把結(jié)果針對(duì)產(chǎn)品不斷進(jìn)行反饋,不斷迭代更新。如果不這么做,那么就開個(gè)咖啡店或者什么吧,因?yàn)樵谶@些領(lǐng)域 AI 還不能很快地取代人力。但是如果人們剛剛因?yàn)?AI 失去了工作,那么他們還會(huì)到你這邊來享受這些食物嗎? 你的計(jì)劃是什么呢? 因?yàn)槟壳皺C(jī)器還不會(huì)思考,所以我的博客還是安全的。雖然我相信,不久之后互聯(lián)網(wǎng)上就會(huì)出現(xiàn)很多機(jī)器人寫的內(nèi)容(包括新聞,博客之類的)。 接下來,是本文最好的部分: “AI軟件學(xué)習(xí)構(gòu)建AI軟件。” 有一個(gè)有趣的轉(zhuǎn)折點(diǎn)——Google 的研究人員已經(jīng)開始設(shè)計(jì)一種神經(jīng)網(wǎng)絡(luò)了,這種神經(jīng)網(wǎng)絡(luò)模型可以學(xué)習(xí)建立自己的神經(jīng)網(wǎng)絡(luò)模型,不依賴于人類專家。瞧,這是一個(gè)多么令人興奮的未來啊! https://www./s/603381/ai-software-learns-to-make-ai-software/ 人類將如何適應(yīng)這樣的世界呢?或者說,是我們?nèi)绾芜m應(yīng)這樣的世界呢?我們會(huì)不會(huì)參與設(shè)計(jì)我們自己?有些人將其稱之為“人類的最后一個(gè)發(fā)明”。又或者,人工智能會(huì)釋放我們?nèi)祟?,讓我們的大腦可以從事更高級(jí)的分析工作。這會(huì)是文藝復(fù)興的新時(shí)代嗎? 在幾年以后,某些機(jī)器學(xué)習(xí)算法可能會(huì)閱讀到這篇博客,并且會(huì)對(duì)這篇文章做出進(jìn)行評(píng)價(jià)。這些算法如果認(rèn)為這是一篇優(yōu)秀的文章,那么會(huì)給予一些獎(jiǎng)勵(lì)。但也有可能會(huì)是嘲笑或者譏諷吧。 來源:
本文作者 Varun 是華爾街一家創(chuàng)業(yè)公司的創(chuàng)始人,致力于大數(shù)據(jù)與神經(jīng)網(wǎng)絡(luò)的研究。 本文由 AI100 編譯,轉(zhuǎn)載請(qǐng)聯(lián)系本公眾號(hào)獲得授權(quán) 編譯:AI100 原文鏈接:https:///@startuphackers/building-a-deep-learning-neural-network-startup-7032932e09c |
|