相信每個入行人工智能的老手,對自己過往的幾年學(xué)習(xí)生涯都或多或少會有一些遺憾:如果我當(dāng)年先從基本概念入手就好了,如果我當(dāng)年把核心算法吃的更透一點(diǎn)就好了…… 最近,一位在行業(yè)內(nèi)工作了幾年的斯坦福人工智能”師兄“就根據(jù)自己的工作和學(xué)習(xí)經(jīng)驗(yàn),為入學(xué)的師弟師妹們送出了一份大禮:人工智能的本科4年課程清單,希望想要了解人工智能的新生能夠靠著這份指路圖,少走彎路。 這位學(xué)長名叫Mihail Eric,本人也是一位妥妥的“學(xué)霸”。在斯坦福大學(xué)的NLP研究組里,與Christopher Manning, Percy Liang, Christopher Potts(三位巨佬)一起做研究,度過了3年非常充實(shí)的研究時光,收獲頗多。同時Eric向ACL\EMNLP\NLP for AI work投稿論文,均已發(fā)表,目前正在擔(dān)任ACL的審稿人,也是業(yè)內(nèi)人工智能公司Alexa AI的工程師。 作為已經(jīng)畢業(yè)的學(xué)長,Eric離開學(xué)校已經(jīng)有一段時間了,總結(jié)了一下自己的學(xué)習(xí)和工作經(jīng)歷,Eric為自己的人工智能和機(jī)器學(xué)習(xí)的職業(yè)生涯,設(shè)計一個完整的4年制人工智能本科學(xué)位基礎(chǔ)課程。這些課程是為AI和CS領(lǐng)域的萌新提供的,雖然是萌新定位,但Eric覺得這些課程直到今天都還在用,是基礎(chǔ)必會的技能。 第1年,打基礎(chǔ)假設(shè)你沒有CS的經(jīng)驗(yàn),這一年的大部分時間應(yīng)該用在CS和機(jī)器學(xué)習(xí)的核心概念和算法上,推薦的課程有: 1.編程基礎(chǔ)這是AI從業(yè)人員必需具備的軟件工程學(xué)的基本技能。
2.計算機(jī)系統(tǒng)這門課的重點(diǎn)在于計算機(jī)的基礎(chǔ)設(shè)計和構(gòu)建,尤其是學(xué)習(xí)軟件編譯的時候,運(yùn)行一個程序會發(fā)生什么,以及程序是如何在內(nèi)存中運(yùn)行的。
3.算法概論這門課包含了計算機(jī)算法背后的數(shù)學(xué)和理論基礎(chǔ),比如最優(yōu)搜索算法和動態(tài)編程,以及如何分析這些算法的內(nèi)存和優(yōu)缺點(diǎn)。
4.概率論概率論和統(tǒng)計學(xué)是機(jī)器學(xué)習(xí)算法中的核心,尤其是分析數(shù)據(jù)在實(shí)戰(zhàn)里很重要。
5.線性代數(shù)如何計算矩陣和向量,線性方程組,最小二乘法,這些都是機(jī)器學(xué)習(xí)需要用到的數(shù)學(xué)基礎(chǔ)。
6.多維微積分調(diào)試函數(shù)的梯度,反向傳播以及機(jī)器學(xué)習(xí),這些都是經(jīng)常用到的。
第2年,慢慢探索AI本科的第二年,至少要明白人工智能的一些原理,應(yīng)該用什么樣的理論去解決問題,還需要加強(qiáng)對計算機(jī)系統(tǒng)運(yùn)行的理解。 1.人工智能概論這門課包括了人工智能領(lǐng)域所運(yùn)用的研究,比如搜索,游戲,邏輯以及圖像還有機(jī)器學(xué)習(xí)算法的應(yīng)用。
2.編譯原理主要是講編譯器背后的設(shè)計和理論,你學(xué)了之后,至少應(yīng)該了解一個編譯器是如何構(gòu)建的,還有編譯器的模塊化組件,也需要了解。如果你對語義識別感興趣,可以好好琢磨一下編譯器的設(shè)計和傳統(tǒng)的自然語言處理堆棧之間的相似之處,非常有趣。
3.數(shù)據(jù)庫原理主要講數(shù)據(jù)庫管理系統(tǒng)背后的原則,比如關(guān)系數(shù)據(jù)模型、索引、模式等主題,但凡你想成為數(shù)據(jù)專家或者機(jī)器學(xué)習(xí)工程師,就必須要懂得數(shù)據(jù)庫的原理。
4.并行計算并行計算這門課會講Apache Spark到GPU這些系統(tǒng)背后的原理,
5.操作系統(tǒng)你如果想要擅長系統(tǒng)編程,就一定要上這門課,這門課是講如何從頭開始搭建一個操作系統(tǒng),不僅需要設(shè)計系統(tǒng),還需要明白如何調(diào)試和代碼管理。如果你不明白,你手下的人敲完:sudo rm -rf /*就撤了,你該如何拯救你的代碼?
第3年,開啟提升課程這個時候應(yīng)該開始學(xué)高級課程,開始NLP,BA,CV這些方向的研究 1.機(jī)器學(xué)習(xí)監(jiān)督學(xué)習(xí)和模型訓(xùn)練的概念,比如偏差、方差,正則化以及模型選擇,這些內(nèi)容看上去簡單,實(shí)際上每個AI從業(yè)者天天都在用的。
2.凸優(yōu)化這門課運(yùn)用很廣,比如統(tǒng)計學(xué),機(jī)器學(xué)習(xí),信號處理和其它使用凸優(yōu)化的領(lǐng)域,雖然現(xiàn)在有不少問題都是非凸化的,但是你最好還是要懂背后的邏輯。
3.概率圖模型像CV和NLP就會經(jīng)常用到,所以還是需要了解。
4.數(shù)據(jù)挖掘大數(shù)據(jù)與數(shù)據(jù)挖掘,這門課涵蓋了處理大型數(shù)據(jù)集的技術(shù)方法,會運(yùn)用到推薦算法、聚類以及大規(guī)模的數(shù)據(jù)集計算與分析,要知道每天產(chǎn)生的數(shù)量還是比較大的。
5.NLP自然語言處理,讓機(jī)器懂得文本數(shù)據(jù)的理論和時間,而且還會在這門課里學(xué)到傳統(tǒng)自然語言處理,老師會教如何用深度學(xué)習(xí)技術(shù)來處理這些。
6.基于CV的卷積神經(jīng)網(wǎng)絡(luò)基本包含了深度學(xué)習(xí)背后的理論,比如CV模型就經(jīng)常運(yùn)用,只要學(xué)過人工智能課程的人,沒錯,是來自李飛飛教授的CS231N吧。
第4年,開始打比賽經(jīng)過前面3年課程的訓(xùn)練,你應(yīng)該對計算機(jī)系統(tǒng)和人工智能概念、應(yīng)用有了清楚的理解,找到你比較感興趣的方向,拿起數(shù)據(jù)集,就要開始自己跑模型,做數(shù)據(jù)分析,調(diào)參還有解決Bug。想要成為一個真正的人工智能專家,不僅得學(xué),還得上手練。 1.做研究項(xiàng)目有的學(xué)校會提供這類課程,在這門課里,你需要深入研究整個項(xiàng)目的情況。
2.參加課題研究主動去找研究生學(xué)長學(xué)姐,做他們的助理,將基礎(chǔ)知識再過一遍,也可以選擇自己開一個課題項(xiàng)目,進(jìn)行研究,主要是讓你有一個項(xiàng)目經(jīng)驗(yàn)。 3.大廠實(shí)習(xí)如果你要是時間管理的好,可以考慮在課余時間去AI公司實(shí)習(xí),一般大廠都有這種3-6個月的實(shí)習(xí)機(jī)會,在實(shí)習(xí)里,不僅讓你了解書本上的基礎(chǔ)知識,還能使用基礎(chǔ)知識進(jìn)行落地的運(yùn)用,這種應(yīng)該算比較好的實(shí)戰(zhàn)機(jī)會了。 尾巴以上就是作為一個人工智能從業(yè)者的斯坦福畢業(yè)生Eric,送給AI萌新的4年規(guī)劃安排,如果你覺得上面的課程比較難,可以適當(dāng)調(diào)整,當(dāng)然也歡迎你與大家分享你的學(xué)習(xí)之路。 就像歌詞所說“一代人終將老去,但總有人正年輕?!癆I之路任重且道遠(yuǎn),不管是不是萌新,只要你還愿意學(xué)習(xí),就一直在路上,加油?。?! |
|
來自: CharlseShan > 《IT》