一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

AI 領(lǐng)域最最稀缺的人才——人工智能架構(gòu)師

 快讀書館 2018-01-09



這里,就不賣關(guān)子了。AI領(lǐng)域最最最最最稀缺的人才應(yīng)該為人工智能架構(gòu)師。有過4次技術(shù)創(chuàng)業(yè)經(jīng)歷,如今做AI投資的星瀚資本創(chuàng)始合伙人楊歌如是說。


在楊歌的身上,傳奇的經(jīng)歷多得是。


清華學(xué)霸,技術(shù)男,四次技術(shù)創(chuàng)業(yè)經(jīng)歷,創(chuàng)建青年精英商業(yè)聯(lián)合會(huì),投身PE,創(chuàng)辦星瀚資本,圈內(nèi)最懂AI技術(shù)的投資人之一......


然而,最打動(dòng)我的,并非這些光鮮的字眼,而是他身上強(qiáng)大的勢(shì)能,他眼里的平靜和堅(jiān)定,以及他完全不Care年輕時(shí)賺錢這件事。當(dāng)年,他甘愿拿很少的工資,只為去四大會(huì)計(jì)師事務(wù)所惡補(bǔ)財(cái)務(wù)知識(shí)。他賺的第一桶金,想都不想,直接扔到公司。他壓根就不理尋常的那一套活法。


他喜歡用數(shù)學(xué)模型和物理模型來比喻和解釋身邊的一切現(xiàn)象,喜歡用元認(rèn)知來節(jié)省大腦內(nèi)存,喜歡用一二三來?xiàng)l分縷析。他的語速很快,很少停頓,且無廢話,幾乎可以直接成稿。


采訪中,他對(duì)于三個(gè)問題的論述,讓我尤其印象深刻。


第一,對(duì)目前AI芯片的立體式解析(終于知道AI芯片到底為什么會(huì)火了);


第二,對(duì)于AI市場(chǎng)稀缺人才AI架構(gòu)師的三個(gè)層次解析(技術(shù)追求者必讀哲學(xué));


第三,對(duì)于AI類或一般程序員選擇創(chuàng)業(yè)的建議,針對(duì)三大特征需要補(bǔ)足的短板,并對(duì)此提出的四大方法(工程師創(chuàng)業(yè),請(qǐng)?jiān)斪x)。


楊歌很喜歡用簡(jiǎn)單的語言,把復(fù)雜的道理講清楚。每一個(gè)問題,他都能細(xì)到不能再細(xì),深到不能再深,再結(jié)合各類比喻,確保你真正聽懂了他的意思。


本文較長(zhǎng),總共分三個(gè)部分,價(jià)值含量相當(dāng)高。文中盡可能地保留楊歌的口語,以原汁原味地呈現(xiàn)他的智慧。希望對(duì)你有所啟發(fā)。

 

就在AI專用芯片在市場(chǎng)上的呼聲不斷被推向新高的當(dāng)下,作為投資人的楊歌也出手了,一舉投資鯤云科技。在看AI技術(shù)有關(guān)的創(chuàng)業(yè)中,楊歌在圈內(nèi)頗有名聲,且語言表達(dá)能力極強(qiáng)。正好借采訪之際,讓他用最直白的語言給抖明白,專用芯片到底一個(gè)怎樣的存在,到底應(yīng)該怎么理解現(xiàn)在市場(chǎng)的芯片,以及AI芯片的創(chuàng)業(yè)者們,到底需要比拼些啥?

 

以下采用第一人稱口述的形式,呈現(xiàn)三個(gè)部分內(nèi)容:

 

  • AI芯片為何突然火了?

  • AI領(lǐng)域真正最最最缺的人才到底是什么?

  • AI工程師如果選擇創(chuàng)業(yè),必須補(bǔ)足哪些功課?



AI芯片為何突然火了?


細(xì)數(shù)芯片的歷史,就是一個(gè)從專用芯片轉(zhuǎn)向通用芯片,又轉(zhuǎn)為專用芯片的過程。

 

最早追溯到上世紀(jì)60年代,Intel從專用芯片轉(zhuǎn)向通用型芯片中央處理器(CPU),英偉達(dá)轉(zhuǎn)成GPU,這兩年又產(chǎn)生了TPU。


這個(gè)整套體系都是一個(gè)把芯片越做越普世化的過程,但這兩年由于終端要降低成本,所以又要返回到專用芯片,因?yàn)橥ㄓ眯酒鄬?duì)來說,效率比較低,制作成本比較高。


所以,這兩年專用芯片開始火起來。

 

從通用型的、服務(wù)器型的、集成型的芯片,轉(zhuǎn)成專用型的,部分設(shè)備使用的,有一定功能的芯片,再加上這兩年正好趕上AI大爆發(fā),大家就很自然地把AI的需求燒制到這些芯片里,也就是我們看到的AI芯片異軍突起。

 

為何終端場(chǎng)景會(huì)催生專用芯片?


終端的場(chǎng)景為什么一定要用終端芯片,而不能通過一個(gè)捕捉器做網(wǎng)絡(luò)傳輸送到云端、送到服務(wù)器端,用服務(wù)器的CPU、或GPU、或TPU去處理,然后再返回?cái)?shù)據(jù)呢?

 

是因?yàn)槟愕木W(wǎng)絡(luò)無論多快,中間都有幾百毫秒的時(shí)間差,而終端芯片未來都需要做到當(dāng)機(jī)立斷、直接分析。

 

比如一個(gè)機(jī)器人,它看到你之后,需要迅速分析出你有什么特點(diǎn),并跟你對(duì)話。這個(gè)過程中,如果機(jī)器人只有接收器,需要傳送到云端再回來,無論網(wǎng)絡(luò)多快,都會(huì)有時(shí)間差。

 

所以,為了提高響應(yīng)速度,終端開始催生自帶處理器的需求,比如能做圖像識(shí)別、語義識(shí)別、語音識(shí)別,運(yùn)動(dòng)機(jī)能的一些處理等,那么這個(gè)時(shí)候,終端就需要具備一定的人工智能能力(AI能力)。

 

專用芯片起勢(shì)后,玩家們到底比拼什么?


當(dāng)專用芯片這個(gè)需求起來之后,玩家們就要開始比拼了,具體來說,比的是:

 

第一,你的硬件結(jié)構(gòu)是不是最優(yōu)。


硬件行業(yè)的特點(diǎn)是:沒有最優(yōu)、只有更優(yōu)。


硬件永遠(yuǎn)都在迭代,背后的原因,主要是摩爾定律在起作用。此外,當(dāng)摩爾定律晶體管變成量子化的東西后,它會(huì)繼續(xù)進(jìn)化,從分子層面進(jìn)到原子內(nèi)部層面,再繼續(xù)找其它的計(jì)算位。

 

第二,算法是不是最優(yōu)。

 

前兩年大家非常癡狂的去搞神經(jīng)網(wǎng)絡(luò)算法的時(shí)候,變體非常多,從最開始簡(jiǎn)算的RNN變到LSTM,變到更為復(fù)雜的結(jié)構(gòu),從最開始設(shè)計(jì)CNN,到CNN的復(fù)雜結(jié)構(gòu),再到用CNN做對(duì)抗網(wǎng)絡(luò)…

 

在大家瘋狂競(jìng)爭(zhēng)算法的時(shí)候,2017年又出來一個(gè)理論說:神經(jīng)元的基礎(chǔ)單元不應(yīng)該是神經(jīng),而應(yīng)該是一個(gè)膠囊;這樣一來,算法底層又改了,Hinton先生把自己30年前的學(xué)術(shù)成果給推翻了。在Capsule  Network中,in&out在單個(gè)處理單元上變得更復(fù)雜,雖然網(wǎng)絡(luò)連接過程還是原來的樣子。


所以,很多人又只能整個(gè)推翻,重來。

 

第三,工程細(xì)節(jié)是不是最優(yōu)。


人們也發(fā)明了很多種方法,比如原來是全連接的,后來又有CNN部分模塊連接,然后又出現(xiàn)了很多類似Dropout的模式,連接著同時(shí)遺忘著,發(fā)現(xiàn)比正常的還更好。

 

第四,工程上的創(chuàng)新每天都在發(fā)生。


每個(gè)工程師都有工程上的創(chuàng)新。100個(gè)工程師里如果有一個(gè)工程師有了意義深遠(yuǎn)的創(chuàng)新,那么對(duì)于整個(gè)行業(yè)來說,又是一場(chǎng)大變革。

 

無論是怎樣的創(chuàng)新,都在不斷突破,不斷提升效率。比如,在算法上,AlphaGoMaster和AlphaGo  Zero,后者的效率相對(duì)前者就有突飛猛進(jìn)的增長(zhǎng)。

 

所以,一旦底層被改變,一切又變得不一樣了,又得迭代。比如,原來可能是20秒解決,你能19.8秒解決;但現(xiàn)在,突然底層一變,你變成10秒解決了,就又是一層迭代了。


沒辦法,這個(gè)行業(yè)就是這樣。

 

從硬件、軟硬結(jié)合,軟件、算法幾個(gè)方面來看,每天都在迭代,所以它很難:由于它沒有定型,無定型態(tài)的結(jié)果導(dǎo)致對(duì)專用芯片的固定性要求是非??量痰?。


因?yàn)閷S眯酒艽蟮膯栴}是一旦定板、開模,這個(gè)東西就不能改,這是一個(gè)很大的問題。所以,如何做一個(gè)適用性最強(qiáng)的專用芯片,這是非常重要的。一般的專用芯片做完之后,比如只服務(wù)于某一種語音識(shí)別機(jī)的芯片,一旦算法更新,底層對(duì)模塊的要求就又不一樣了,那么這個(gè)專用芯片就不能用了。于是,只能再做一個(gè)新的專用芯片。

 

這個(gè)事情的迭代速度太快了。

 

芯片的三種類型


前面大致羅列了專用芯片崛起的背景,接下來我們具體聊一下芯片到底有哪三種類型:


  • 集成型的芯片(CPU、GPU、TPU),屬于它的模塊陣列非常統(tǒng)一的,它能處理幾乎所有的事情,又叫通用型芯片

  • FPGA可編程門陣列

  • 專用芯片


其中,F(xiàn)PGA相當(dāng)于編寫硬件,通過改變硬件可以隨時(shí)調(diào)整功能邏輯,但FPGA有以下幾個(gè)大問題:

 

  • 成本比較高,真正好的FPGA要8000元-1萬元。

  • 編寫復(fù)雜,門檻高,修改難度大。

  • 編程過程中的效率比高級(jí)算法低,這樣就導(dǎo)致開發(fā)難度也比較大。


所以,F(xiàn)PGA是個(gè)過渡過程,它能夠銜接通用型芯片和底層專用芯片。

 

說完FPGA,再說說專用芯片。


專用芯片的特點(diǎn)是價(jià)格極其便宜,只要你開模、打板之后,基本上一片50-100元就搞定了,但開模費(fèi)500萬,而且一旦開模就改不了。(營(yíng)長(zhǎng)注:這里500萬為概數(shù),楊歌想表達(dá)是開模費(fèi)很高,對(duì)公司來說,是一筆不小的負(fù)擔(dān)。據(jù)營(yíng)長(zhǎng)所知,開模費(fèi)的量級(jí)一般在數(shù)百萬-數(shù)千萬之間。)

 

如果用數(shù)學(xué)的方式來理解這三類芯片,那就是:


  • 專用芯片又叫階躍函數(shù),意思就是,這個(gè)東西開了模之后,下一次你要再改,你就得整個(gè)上一等;

  • FPGA是線性函數(shù),慢慢漲、慢慢漲;

  • CPU、GPU等集成型芯片是指數(shù)函數(shù),成本高,但它是一個(gè)好的模式。

 

專用芯片的成敗關(guān)鍵


目前,大家傾向于回歸專用芯片,這也是因?yàn)閷S眯酒?017年有兩大推動(dòng)力:比特幣的挖礦機(jī)人工智能

 

基于這兩股力量,編寫專用芯片需求來了,因?yàn)镕PGA和CPU成本太高了。


但專用芯片的問題也來了,那就是,無論哪個(gè)時(shí)代,不管你是20世紀(jì)70、80年代,還是現(xiàn)在,專用芯片都會(huì)有過時(shí)的一天,因?yàn)榧夹g(shù)一直在迭代。這時(shí)候,就是考驗(yàn)?zāi)銓?duì)專用芯片把控力的時(shí)候了,一句話,你設(shè)計(jì)的專用芯片到底能支撐業(yè)務(wù)走多久。

 

如果你編出來的專用芯片,能持續(xù)三年使用,那么同期你就可以去研發(fā)另外更新的專用芯片。三年后,當(dāng)原來的專用芯片產(chǎn)能要下降的時(shí)候,你可以拿新的專用芯片頂上。你要能頂上,那這個(gè)能力就厲害了。

 

但如果你的專用芯片半年就過時(shí)了,那你的成本就太高了,因?yàn)槟忝總€(gè)專用芯片的打板就需要500萬以上,對(duì)初創(chuàng)公司來講是完全承受不起的。(營(yíng)長(zhǎng)注:此為概數(shù),只是為強(qiáng)調(diào)打板花費(fèi)較大。)如果你還不停地在打板,那你的公司就危險(xiǎn)了,你還不如用FPGA和CPU來做,現(xiàn)在多核CPU也能完成。

 

現(xiàn)在專用芯片的一個(gè)競(jìng)爭(zhēng)在于,你編寫出來專用芯片是否魯棒性、適應(yīng)性和存續(xù)性足夠強(qiáng),是否能夠適應(yīng)更多的人工智能算法模塊,是否能扛住算法變體…

 

比如當(dāng)CNN一變體,卷積核一變體,這個(gè)芯片能不能扛?。慨?dāng)LSTM的循環(huán)網(wǎng)絡(luò)內(nèi)部結(jié)構(gòu)中,忘記門和記憶門這兩個(gè)發(fā)生變化,你能否扛???

 

當(dāng)然,Capsule  Network一出來,不僅你扛不住了,大家都扛不住了。

 

總的來說,你要讓你的專用芯片在容錯(cuò)性和魯棒性、適應(yīng)性上做到最強(qiáng),這樣,你的成本才能算得過賬來。但大部分技術(shù)人員的賬,可能算不了三到五年的時(shí)間。

 

還有些人把目光放在非常細(xì)的地方,一定要編到極致,保證局部的魯棒性、容錯(cuò)性提到最高,但長(zhǎng)期的、中長(zhǎng)期,比如三年期,這樣不一定行。

 

比如,在交通圖像監(jiān)察識(shí)別上,你怎么用都不出錯(cuò),正確率99.9%,但突然過兩年算法一升級(jí),你怎么辦?


因此,我不建議把目光放到單個(gè)場(chǎng)景的適應(yīng)性上,我認(rèn)為應(yīng)該放在一個(gè)長(zhǎng)期的、場(chǎng)景變革的使用性上,這點(diǎn)非常重要。

 

這些問題其實(shí)是現(xiàn)在AI芯片競(jìng)爭(zhēng)最重要的底層邏輯。在AI芯片領(lǐng)域,我們投了鯤云科技,他們的聯(lián)合創(chuàng)始人為斯坦福的客座教授、帝國(guó)理工的教授、英國(guó)皇家工程院院士,發(fā)表300多篇的論文。

 

他們的特點(diǎn)能把芯片的適用性做得很好,芯片的場(chǎng)景適應(yīng)性、網(wǎng)絡(luò)適應(yīng)性、算法適應(yīng)性非常強(qiáng)。

 

同樣做的很好的公司還有地平線、寒武紀(jì)、深鑒等,不過也有一些公司,場(chǎng)景化的正確率只有95%,甚至85%,那么這些芯片可能就沒法用,或者只能調(diào)動(dòng)一定的模塊函數(shù),不能調(diào)動(dòng)大部分模塊函數(shù)。

 

目前來說,深度學(xué)習(xí)訓(xùn)練過程是不需要用AI專用芯片的,因?yàn)锳I專用芯片主要還是在某一個(gè)終端應(yīng)用場(chǎng)景用。一般來說,終端人工智能芯片并不執(zhí)行訓(xùn)練過程,它只執(zhí)行使用過程。這是大家容易產(chǎn)生理解誤區(qū)的一個(gè)點(diǎn)。

 

AI芯片市場(chǎng)距離飽和還很遠(yuǎn)

 

說到終端市場(chǎng),英偉達(dá)也在猛攻終端市場(chǎng)。英偉達(dá)去年出了一個(gè)TX2的新型芯片(也是終端芯片)。但英偉達(dá)的終端芯片是一個(gè)輕版的集成化芯片,是把它集成化的GPU鑲在了一個(gè)小的芯片上,形式了一個(gè)專用芯片。所以,現(xiàn)在的AI專用芯片還需要扛住英偉達(dá)的競(jìng)爭(zhēng)。

 

目前,人工智能技術(shù)有三層:


  • 基礎(chǔ)數(shù)學(xué)物理層

  • 技術(shù)模塊中間層

  • 應(yīng)用層

 

技術(shù)模塊中間層(簡(jiǎn)稱模塊層)是指圖像識(shí)別、語言識(shí)別、語義識(shí)別、運(yùn)動(dòng)機(jī)能識(shí)別;底層,即基礎(chǔ)數(shù)學(xué)物理層,就是芯片,數(shù)據(jù)傳輸、數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)、算法結(jié)構(gòu)、算法模塊。

 

而應(yīng)用層中,幾個(gè)比較大的場(chǎng)景有:


  • 智能家具、智能房屋、智慧城市

  • 機(jī)器人

  • 個(gè)人語音助手

 

這幾個(gè)場(chǎng)景的入口模塊都需要完整的、完全標(biāo)準(zhǔn)的模塊層,就是說語音識(shí)別、語義識(shí)別都則需要非常精準(zhǔn),無論是器械,還是一個(gè)機(jī)器人,都需要模塊層要很成熟,同時(shí)需要底層芯片層很成熟。目前,大家都在競(jìng)爭(zhēng)這個(gè)市場(chǎng)。

 

二十年后,周圍的物體可能拍一拍都能動(dòng)、都能說話,每一個(gè)東西都需要兩個(gè)基礎(chǔ)的模塊體系。


  • 第一個(gè)模塊體系:硬件模塊體系,就是它的硬環(huán)境。

  • 第二個(gè)模塊體系:也就是軟環(huán)境。

 

軟環(huán)境就是科大訊飛、商湯、曠視等等在做的東西,硬環(huán)境就是英偉達(dá)、通訊云、鯤云、深鑒等公司在做的。

 

現(xiàn)在的AI專用芯片市場(chǎng),如果說市場(chǎng)飽和度滿分是10分,現(xiàn)在也就1分不到。

 

雖然現(xiàn)在才1分不到,但今年的AI芯片公司突然火起來,就是因?yàn)榇蠹翌A(yù)期了十年之后的應(yīng)用場(chǎng)景,十年之后這個(gè)市場(chǎng)是很大的,不過大到什么程度不好做預(yù)期。

 

現(xiàn)在市場(chǎng)上的幾家公司,顯然還是不足以形成大的競(jìng)爭(zhēng)。

 

如果做個(gè)比喻,現(xiàn)在的市場(chǎng),也就是剛剛進(jìn)入體育場(chǎng),裁判還沒有開始吹哨的時(shí)候。

 

對(duì)于AI專用芯片來說,應(yīng)用場(chǎng)景還沒有完全開發(fā)完,有人去做無人機(jī)監(jiān)測(cè)、有人去做道路攝像頭監(jiān)測(cè)、有人是做家居環(huán)境??偟膩碚f,目前各家的應(yīng)用場(chǎng)景都還沒有鎖定,還處在一個(gè)惡補(bǔ)基礎(chǔ)知識(shí)的階段。

 

當(dāng)然,這個(gè)階段完成之后,可能有的轉(zhuǎn)向交通,有的轉(zhuǎn)向家庭環(huán)境了,各有各自的立足的垂直領(lǐng)域,并繼續(xù)迭代。那么等到那時(shí)候,可能就不競(jìng)爭(zhēng)了。


AI市場(chǎng)上最稀缺的人才是?


首先,我覺得懂人工智能,我是說的是真正懂人工智能的人才,是非常稀缺的。


那么什么叫真正懂呢?


就是了解人工智能物理意義的人,而不僅僅是懂算法。

 

什么才是真正懂人工智能——庖丁解牛


舉個(gè)我自身的例子。我在清華大學(xué)念書時(shí),就用過神經(jīng)網(wǎng)絡(luò),我會(huì)用,但我不懂,不懂它的底層意義到底是什么,不懂這個(gè)東西為什么能夠訓(xùn)練出來,不理解計(jì)算機(jī)到底是怎么思考的。


這是一個(gè)非常重要的思維門檻。

 

對(duì)于深度學(xué)習(xí)來說,由于這里面是一個(gè)黑箱,你可以不知道機(jī)器在某一點(diǎn)到底在思考什么,但機(jī)器思考的那套整體邏輯和大概每一層單元在干什么,你要很清楚。

 

目前,能理解到這個(gè)層次的人非常少。

 

打個(gè)比方,有個(gè)詞叫庖丁解牛。你首先得在眼睛里,大腦里有這頭牛的全貌,然后你還必須很會(huì)使用這個(gè)刀。而不是說你拿著這把刀,你就可以迅速地把這頭牛解剖了。


你只有既理解牛、又理解刀的使用方法,你才能達(dá)到庖丁解牛的境界。


同樣,人工智能也是這么一個(gè)工具。

 

給你一大堆圖片,讓你訓(xùn)練出一個(gè)模型,你用tensorflow跑出來了,但明天讓你訓(xùn)練語音,后天訓(xùn)練物流雜亂的數(shù)據(jù)化信息,你就蒙圈了。


再比如,有個(gè)模型是要用CNN加上全連接的,你的模型是用對(duì)抗網(wǎng)絡(luò)更好一點(diǎn),那么你的模型就可以不使用神經(jīng)網(wǎng)絡(luò),而應(yīng)該使用Randomforest,有了模型你應(yīng)該使用這個(gè),你為什么要使用這個(gè),你是通過大量的算法、經(jīng)驗(yàn)做出來的。

 

對(duì)我來說,最大的幫助是,一個(gè)編程的感性認(rèn)識(shí)。我在大學(xué)研究生的時(shí)候,我做了大量的編程,天天在debug,debug特別鍛煉人對(duì)于機(jī)器底層運(yùn)轉(zhuǎn)的思考,一套10萬行的程序出錯(cuò)了,你怎么能夠迅速給他debug出來,這個(gè)你要去理解計(jì)算機(jī)到底容易在什么地方出錯(cuò)。

 

人工智能更復(fù)雜,人工智能在調(diào)試的過程中,沒有debug的提示器,因?yàn)樗菙?shù)據(jù)和數(shù)據(jù)之間,它是一個(gè)數(shù)值計(jì)算,不能收斂的過程,就是你算著算著錯(cuò)了,你也不知道什么地方出錯(cuò)了,你只能看到這個(gè)數(shù)據(jù)發(fā)散了,這是一個(gè)特別要命的問題,因?yàn)槟愕某绦蛞稽c(diǎn)都沒有寫錯(cuò),只是你的數(shù)據(jù)結(jié)構(gòu)、網(wǎng)絡(luò)結(jié)構(gòu)弄錯(cuò)了,這個(gè)要求程序員對(duì)這個(gè)算法的物理模型、場(chǎng)景模型極其明確物理意義的過程,這是非常復(fù)雜的,很難描述這個(gè)事情。

 

最稀缺人才——人工智能架構(gòu)師


我有一個(gè)特點(diǎn),我所有學(xué)到的東西,我都能從零開始推,就是老師講的所有東西我都可以從零開始推。這個(gè)東西叫元認(rèn)知。


元認(rèn)知越底層的人,他在理解一件事情的時(shí)候所占用腦子里的內(nèi)存越少。比如說讓我去描繪一個(gè)整個(gè)的商業(yè)案件,有人是背書,從頭到尾背下來,我看一遍以后,我可能一個(gè)單位我就記住了,然后就忘了,下次讓我描述這個(gè)事,我把這個(gè)單元提出來就可以描述。

 

人工智能也是,它是一套工具,一個(gè)真正好的工程師,他手里所有的人工智能都是算法,比如現(xiàn)已知的,人工智能大類的算法可能有七八類,像支持向量機(jī),神經(jīng)網(wǎng)絡(luò)、randomforest,adaboost等一大堆,他在看到一個(gè)模型后,能迅速判斷哪個(gè)模型更適合。

 

比如說為什么語義識(shí)別是用循環(huán)網(wǎng)絡(luò)和LSTM來做識(shí)別?因?yàn)檎Z義是一個(gè)線性的信息流,這個(gè)線性信息流里面要記住前面很遠(yuǎn)的信息,同時(shí)要忘掉很大一部分信息,再記住當(dāng)前的信息,所以,用LSTM能非常完美的解決這個(gè)問題,但LSTM在圖像識(shí)別上就不Work了、在量化金融中的優(yōu)勢(shì)也不明顯。

 

這里,很多人會(huì)認(rèn)為股票和語義都是一個(gè)時(shí)間序列函數(shù),或者是前后序列函數(shù)。為什么LSTM訓(xùn)練這個(gè)很好用,訓(xùn)練股票就不行了呢?


這個(gè),就需要回到元認(rèn)知。因?yàn)樗麄兊臄?shù)據(jù)結(jié)構(gòu)完全不一樣,你得理解什么模型處理什么實(shí)體結(jié)構(gòu)。


再比如,CNN適合處理大量數(shù)據(jù)、超大量的數(shù)據(jù),且數(shù)據(jù)和數(shù)據(jù)之間有明確相關(guān)條件,所以,CNN適合處理圖像,因?yàn)閳D像的像素之間具有相關(guān)性。


而同樣的一個(gè)情況,語義又不適合了。比如“我寫程序”這四個(gè)字,每個(gè)字之間一對(duì)一的相關(guān)性并不是那么強(qiáng),但他有一個(gè)整體相關(guān)性,他跟圖像識(shí)別是不一樣的。簡(jiǎn)單理解的話,語義是一維函數(shù),圖像是二維函數(shù)。


所以,這些都是很細(xì)節(jié)的東西。你只有在使用了大量的程序之后,跑著跑著,才能感知到,哦,原來這個(gè)應(yīng)該用什么算法跑,那個(gè)不能用什么算法跑。因?yàn)槿斯ぶ悄軐儆诤诎瞪?,你只能慢慢去摸索,摸索哪個(gè)是最適合的。你不可能第一天就調(diào)試出來,搞清楚哪種場(chǎng)景,到底該用什么程序,這個(gè)程序應(yīng)該有多少層的網(wǎng)絡(luò)、結(jié)構(gòu)、單元,每一層單元有什么樣的參數(shù),應(yīng)該跟什么程序進(jìn)行配合,是否需要兩個(gè)程序進(jìn)行嫁接,是否需要高級(jí)的比如對(duì)抗型的、或者輔助型、或者嫁接型等。你需要不斷地錘煉和思考,才能出來這樣的感覺,都是一點(diǎn)一點(diǎn)悟出來的。

 

所以,回到最開始的問題,我覺得如果用一個(gè)特定的職位來定義,這個(gè)最稀缺的人才是人工智能架構(gòu)師。

 

他能抽象出你最應(yīng)該使用什么樣的工具。在他之下,其他人就可以在一個(gè)更細(xì)的層面上,去琢磨這個(gè)工具具體應(yīng)該怎么來用。

 

不過,人工智能架構(gòu)師又分三個(gè)層次。

 

人工智能架構(gòu)師的三個(gè)層次

 

第一層:物理模型架構(gòu)。


有的時(shí)候大家在訓(xùn)練一件事情的相關(guān)性上,可能會(huì)把兩個(gè)事情分開放。其實(shí)應(yīng)該把兩個(gè)事件放在一起,把相關(guān)性作為訓(xùn)練對(duì)象來進(jìn)行訓(xùn)練,這樣訓(xùn)練可能會(huì)更好。


或者把一個(gè)隱藏的物理意義作為訓(xùn)練對(duì)象,把相關(guān)性和兩個(gè)事情都放在一起,然后再進(jìn)行訓(xùn)練。


但很多人就想不到這點(diǎn),就拿兩個(gè)事情直接去訓(xùn)練相關(guān)性,這是錯(cuò)誤的。

物理模型架構(gòu),這是最里的一層,需要深刻理解物理意義,當(dāng)知道各種各樣的函數(shù)該怎么去用的時(shí)候,火候就差不多了。

 

第二層:當(dāng)我們確定怎么訓(xùn)練拓?fù)淠P椭?,拓?fù)淠P涂蚣艹鰜淼臅r(shí)候,基于拓?fù)淇蚣芪疫x用什么樣的網(wǎng)絡(luò)模塊,具體需要訓(xùn)練成什么效果,然后再具體去訓(xùn)練。

 

第三層:等這些模塊全選好了,每一層用多少個(gè)單元、多少個(gè)參數(shù),你有沒有這個(gè)能力。第一層的神經(jīng)元你可以選擇100個(gè),第二層的你選10個(gè),第三個(gè)選擇多少個(gè),然后用卷積你又選擇多少個(gè),核有多大,3×3的、5×5的、10×10的,你到處去試,試一年可能才試出結(jié)果來。

 

好的工程師第一刀就可以給你切到差不多的點(diǎn)上,你這個(gè)模型基本10層網(wǎng)絡(luò),每一層大概10個(gè)神經(jīng)元,卷積核的層數(shù)大概3層,全鏈接層7層就夠了,他會(huì)一上來就給你做這個(gè)東西。

 

目前,這三種架構(gòu)人才都很稀缺。

 

要培養(yǎng)一個(gè)這樣的人才,很難很難,必須跨界,尤其物理模型架構(gòu)層面,必須跨界。你必須要能理解這個(gè)東西在物理層面上的意義,你必須經(jīng)歷過不一樣思維模式的業(yè)務(wù),有開闊的眼界,比如從事過社會(huì)、社科、商業(yè)等多種類型的工作,然后再反過來去看這件事情,就容易了。

 

為什么說一定要跨界呢?因?yàn)榭缃鐣?huì)對(duì)你補(bǔ)充另外一個(gè)部分的素養(yǎng),跨界就是補(bǔ)足你的數(shù)據(jù),這叫“一個(gè)向量空間的完備性”,你跨界是用來干這個(gè)的。

 

我見過的特別優(yōu)秀的能扛起人工智能架構(gòu)師這類角色的人很少。我很欣賞第四范式的戴文淵,他就可以把銀行所需要的算法場(chǎng)景變成一定的函數(shù)需求,他屬于在工程師里情商比較高,相對(duì)比較跨界的稀缺人才。

 

要成為一個(gè)這樣的人才,我覺得至少要十年時(shí)間。

 

這類人才,一定是有強(qiáng)感知能力的,他有感知整個(gè)社會(huì)存在的能力,而不是把眼睛全放在眼前的技術(shù)上。

 


AI工程師創(chuàng)業(yè),需補(bǔ)足哪些短板?


未來關(guān)于AI的機(jī)會(huì)太多了,各行各業(yè)都需要AI,所有有大量數(shù)據(jù)的地方都可以用AI進(jìn)行處理,因此,可能很多AI工程師也會(huì)考慮創(chuàng)業(yè)。

 

如果要?jiǎng)?chuàng)業(yè),他們又還應(yīng)該得到哪些方面的成長(zhǎng)呢?

 

要回答這個(gè)問題,我們先來看看程序員到底是一種怎樣的存在。

 

程序員是數(shù)據(jù)和人類之間的溝通者,這一點(diǎn)非常重要。什么意思呢,就是說,他能把數(shù)據(jù)翻譯成人話,把人想要執(zhí)行的東西轉(zhuǎn)化成數(shù)據(jù)、數(shù)字。


對(duì)這類人群來說,由于長(zhǎng)期跟電腦,跟技術(shù)打交道,如果要?jiǎng)?chuàng)業(yè),他們必須要有實(shí)踐經(jīng)歷,要有生活化的感知體驗(yàn)。

 

這句話怎么理解呢?

 

AI工程師必須掌握的三個(gè)特征


我舉個(gè)例子,這個(gè)例子可能有點(diǎn)抽象了。我把任何一件事分為主要特征、次要特征、長(zhǎng)尾特征。


主要特征靠看書是可以學(xué)習(xí)到的,就是老師告訴你公理一、公理二,社會(huì)規(guī)律一、社會(huì)規(guī)律二,你就記住了,這是主要特征。

 

什么是次要特征呢?一個(gè)事件有很多復(fù)雜的次要特征,這個(gè)老師講不清楚,你只能通過實(shí)踐,比如你在干工作的時(shí)候,如果財(cái)務(wù)不留準(zhǔn)備金率,那公司就非常危險(xiǎn)了;此外,對(duì)于合規(guī)這件事,在實(shí)踐中你才能知道為什么要做合規(guī),是因?yàn)楹芏嗉?xì)節(jié),工商、稅務(wù)、法律等問題都會(huì)影響到你的效率。


長(zhǎng)尾特征屬于感性化的層面了,比如你在人和人接觸的時(shí)候,你對(duì)這個(gè)人要稍微好一點(diǎn),生意就變得更順暢一點(diǎn),這個(gè)老師都不會(huì)教給你。

 

總的來說,主要特征靠看書解決,次要特征靠實(shí)踐解決,長(zhǎng)尾特征靠情商培養(yǎng)。如果你只有主要特征,你就永遠(yuǎn)解決不了一個(gè)完整的事情。


程序員今后不管是創(chuàng)業(yè),還是說要有更大的發(fā)展,需要加強(qiáng)次要特征和長(zhǎng)尾特征兩個(gè)方面。

 

對(duì)于三種特征,如何真正學(xué)會(huì)和掌握呢?

 

四種學(xué)習(xí)方法,AI工程師應(yīng)補(bǔ)足后三種


為了很好地掌握這三種特征,我有一個(gè)很重要的學(xué)習(xí)方法可以跟大家分享:學(xué)習(xí)多樣性。


具體而言,有四個(gè)層面:


  • 第一種:理解;

  • 第二種:理會(huì);

  • 第三種:感受;

  • 第四種:感知。


“理解”:是看書和通過理論化的知識(shí)去學(xué)習(xí),學(xué)習(xí)完全結(jié)構(gòu)化的知識(shí)叫“理解”,程序員多數(shù)有一個(gè)很大的問題,程序員的知識(shí)結(jié)構(gòu)大都是理解來的。


“理會(huì)”:是與人交流,通過跟別人交流學(xué)到知識(shí),這點(diǎn)是我從24歲之后大量去做的。因?yàn)槿撕腿私涣鞯臅r(shí)候,是別人已經(jīng)加工過的知識(shí),通過一個(gè)相對(duì)柔和的、說人話的方式讓你聽懂了。


與一個(gè)智者聊天勝讀十年書,因?yàn)樗阉甑臇|西全總結(jié)給你了,而且都是精華。


多與智者交談,你會(huì)發(fā)現(xiàn),你的整個(gè)世界觀都對(duì)了。


“感受”:智者不能告訴你的細(xì)節(jié),你以實(shí)踐出真知,從實(shí)踐中去感受,能感受到細(xì)節(jié)。


“感知”:主要來自于看不同文化的影片、電影、電視劇和書籍文章等;還有出去旅行。


舉個(gè)例子,比如你去日本,語言、貨幣、文化什么都不通,你在那兒待20天,回來之后你發(fā)現(xiàn)你身上會(huì)有一些日本人的習(xí)慣,思維方法跟他們很相似,因?yàn)檫@是一套環(huán)境在影響你,這套環(huán)境在數(shù)學(xué)上叫高階小量。這些東西在不斷地影響你的一些行為習(xí)慣。久而久之,你的思考方式跟他們很類似,你就能處理一些原來你不能處理的事情,這非常有意思。


我去日本、英國(guó)最典型的感受就是這樣的。因?yàn)檫@兩個(gè)國(guó)家的文化氣息是非常濃烈且集中的,你去了英國(guó)之后,你整個(gè)人就變成那種狀態(tài)了,詼諧、思考、謹(jǐn)慎。然后你能想象出來一些東西,為什么這個(gè)國(guó)家和文化下的人會(huì)有這種狀態(tài)。


此外,電影熏陶也是我常常借助的方法。


當(dāng)我對(duì)一件事情很不理解的時(shí)候,我就開始放那一類電影,一直循環(huán)播放,熏到一定程度的時(shí)候,電影里面的每個(gè)言行舉止,我都能被強(qiáng)烈地代入進(jìn)去,然后我就突然就理解了,原來這么干是有原因的,為什么是這樣不是那樣。

 

在這四種學(xué)習(xí)中,AI工程師最應(yīng)該補(bǔ)齊的是后面三種學(xué)習(xí)方法,尤其是中國(guó)的工程師,應(yīng)多學(xué)學(xué)硅谷工程師的跨界,一定要從自己的理解層面的學(xué)習(xí)方法、相對(duì)固化的學(xué)習(xí)方法中跳出來。

 

當(dāng)然,這是一個(gè)逐漸豐滿的過程,AI工程師,或者其他程序員有志于未來創(chuàng)業(yè),一定要多從這幾個(gè)方面去鍛造自己。




    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多

    高清免费在线不卡视频| 国产亚洲神马午夜福利| 女厕偷窥一区二区三区在线| 欧美日韩精品综合一区| 四十女人口红哪个色好看| 激情丁香激情五月婷婷| 国产不卡在线免费观看视频| 日韩在线精品视频观看| 国产精品日本女优在线观看| 亚洲伦片免费偷拍一区| 在线观看日韩欧美综合黄片| 亚洲一级二级三级精品| 久久精品偷拍视频观看| 国产又色又粗又黄又爽| 人妻亚洲一区二区三区| 少妇淫真视频一区二区| 色婷婷中文字幕在线视频| 午夜福利视频偷拍91| 国产精品午夜一区二区三区| 最近中文字幕高清中文字幕无| 老外那个很粗大做起来很爽| 欧美一级特黄特色大色大片| 国产成人精品国内自产拍| 毛片在线观看免费日韩| 麻豆欧美精品国产综合久久| 正在播放玩弄漂亮少妇高潮| 欧美日韩精品人妻二区三区| 99在线视频精品免费播放| 国产成人精品午夜福利av免费| 国产精品免费无遮挡不卡视频| 日本免费一区二区三女| 欧美成人精品国产成人综合 | 深夜福利欲求不满的人妻| 最新69国产精品视频| 夫妻性生活动态图视频| 国产美女网红精品演绎| 日韩aa一区二区三区| 自拍偷女厕所拍偷区亚洲综合| 国产精品视频一区麻豆专区| 午夜精品福利视频观看| 色好吊视频这里只有精|