本人準(zhǔn)備市場營銷研究生畢業(yè),以前有學(xué)過sql,也懂一丟丟sas,現(xiàn)在想往數(shù)據(jù)分析的方向轉(zhuǎn),長期想偏data science,目前準(zhǔn)備學(xué)習(xí)下python和R,另外也想再補(bǔ)補(bǔ)統(tǒng)計的知識,我知道coursera,udemy,edx這些平臺,但是課程類型太多了~~~~大家有上過的嗎??求各位大神推薦下(希望能把課名列出來哈)。另外如果你有學(xué)習(xí)方案推薦,也想一睹為快哈!我大概有一年時間去準(zhǔn)備~~ 先射射各位了?。。海?br style="box-sizing: border-box;"> 在我看來, Data Science/Analytics 大致需要掌握以下幾方面的技能: 1. SQL, 數(shù)據(jù)庫相關(guān)的技能 這個是所有從事數(shù)據(jù)分析的第一步:獲取數(shù)據(jù),而絕大部分的數(shù)據(jù)儲存在數(shù)據(jù)庫中,所以SQL的技能很關(guān)鍵,事實(shí)上也是以后也會占用你工作的大部分時間。 SQL不難,但是想要快速熟練的掌握光靠背幾個 select, from, where, group by 是遠(yuǎn)遠(yuǎn)不夠的,最好的聯(lián)系方法是能一邊寫一邊看得出的結(jié)果,從而搞清楚每條語句實(shí)際在背后對數(shù)據(jù)做了什么操作,邏輯是什么。 SQL也是數(shù)據(jù)分析面試時重點(diǎn)考察的方面,Google, Facebook, Uber, Slack等等這些大的科技公司都會去著重考察,不需要你會很fancy的命令語句,但是會讓你利用簡單的命令語句去實(shí)現(xiàn)很復(fù)雜的邏輯關(guān)系, 這方面的資源比較入門級的有 SQLZOO 和 W3 School的SQL部分,這兩個相對來說好快速上手,而且都是我前面說的可以讓你一邊寫SQL一邊看你query出來的結(jié)果, 這樣會讓你對命令語句具體對數(shù)據(jù)本身做了什么。 https:/// https://www./sql/ 進(jìn)階的資源有微軟在edx上的一門MOOC:Querying with Transact-SQL, 這門課也適用于初學(xué)者,不過學(xué)習(xí)的時間要長一些,因?yàn)閮?nèi)容會講的深一些(比如window function 和 table expression) https://www./course/querying-transact-sql-microsoft-dat201x-7 2. 統(tǒng)計的基本原理 大部分傳統(tǒng)的機(jī)器學(xué)習(xí)的算法來自于統(tǒng)計學(xué),而且統(tǒng)計學(xué)的知識也被大量的用在了數(shù)據(jù)探索階段(Explanatory Data Analysis) 和工作中各種各樣的Statistical Testing上面 這方面就是傳統(tǒng)的統(tǒng)計知識,盡量選一些名牌大學(xué)的通俗易懂的基礎(chǔ)統(tǒng)計課即可。 3. Data Science/Machine Learning Modeling 這塊的課程最多,但也最難選,因?yàn)楹芏嗾n程要么太注重理論,需要有很好的數(shù)學(xué)基礎(chǔ)才能理解,要么就是相對來說太過簡單,下面是我覺得蠻好的課程,兼顧了理論深度,理解難度和實(shí)踐程度。 Udemy: Python for Data Science and Machine Learning Bootcamp https://www./python-for-data-science-and-machine-learningbootcamp/ 這門課的特點(diǎn)是講解很清晰,信息量很大,講師既講了Python編程也講了些ML的算法知識,不過相對來說不是很深。 Edx: Analytic Edge https://www./course/analytics-edge-mitx-15-071x-3 如果你是個對理論數(shù)學(xué)化的東西不大感興趣,只注重怎么把ML的算法應(yīng)用在實(shí)際中,那這門課是很好的入門課。 這門來自MIT的神課介紹每個算法時都是通過一個相應(yīng)的現(xiàn)實(shí)中真實(shí)應(yīng)用的案例來講的,而且講的通俗易懂,全部課程的語言為,也很容易上手 Udacity: Intro to Machine Learning https://www./course/intro-to-machine-learning–ud120 這門課是Google X 實(shí)驗(yàn)室的創(chuàng)始人 Sebastian Thrun (同時也是Udacity的創(chuàng)始人)講授的,全面的涵蓋了主流ML的算法,中間每講一個新的算法,都會穿插了很多小練習(xí)幫助你鞏固新學(xué)到的知識,而且Sebastian作為業(yè)界大牛,對ML的講解也很清晰直白易懂。 Stanford Online: Statistical Learning http://online./course/statistical-learning-self-paced 如果你想探究ML算法背后的數(shù)學(xué)理論基礎(chǔ),那這門來自斯坦福的神課就是你的不二選擇,雖然課程的數(shù)學(xué)理論涉及較多,但是只要跟著兩位教授(兩位大牛,其中一位發(fā)明了大名鼎鼎的LASSO Regression)一步步來,還是比較容易懂的,本課程也采用了較易上手的R作為編程語言 以上這些都是Data Science/Analytics 的入門課,歡迎各位大牛繼續(xù)補(bǔ)充! 當(dāng)然還有很有名的coursea上的JHU的data science系列,我在這里就不多描述了。 希望能幫到你! Bobby |
|