本文為 AI 研習(xí)社編譯的技術(shù)博客,原標(biāo)題 : 7 Resources for Those Wanting to Learn Data Science 作者 | Bruno Trentini 翻譯 | 凱伊·斯特朗、Eli伊萊、唯愛(ài)我清、Ophria 校對(duì) | 鄧普斯·杰弗 整理 | 菠蘿妹 https:///7-resources-for-those-wanting-to-learn-data-science-a89e25d1b55e 有時(shí)你只需要知道如何開(kāi)始即可,以下是那些適用于我的經(jīng)驗(yàn)。 數(shù)據(jù)科學(xué)從一開(kāi)始就是一個(gè)交叉學(xué)科,要求從業(yè)者在計(jì)算機(jī)、數(shù)學(xué)領(lǐng)域具備一定的技能,同時(shí)還要具備在同人與生意打交道的經(jīng)驗(yàn)。有些人會(huì)在多年的工作生活中慢慢累積相關(guān)的經(jīng)驗(yàn),但是如果那兒有一個(gè)捷徑存在呢? 現(xiàn)在我決定同大家分享我在數(shù)據(jù)科學(xué)這條路上幫我打基礎(chǔ)的7大資源。選取的這些資源即兼顧了趣味兒性的同時(shí)也兼顧了包含在內(nèi)的數(shù)據(jù)與科學(xué)原理。 寫(xiě)在前面 '數(shù)據(jù)科學(xué)'的關(guān)鍵詞不是數(shù)據(jù),而是科學(xué)。--杰夫·萊克 約翰霍普金斯大學(xué)彭博公共衛(wèi)生學(xué)院教授Jeff Leek在5年前寫(xiě)道:'數(shù)據(jù)科學(xué)中的關(guān)鍵詞不是'數(shù)據(jù)',是'科學(xué)'。僅在使用數(shù)據(jù)回答問(wèn)題時(shí)數(shù)據(jù)科學(xué)才有用。這是等式的科學(xué)部分。這種數(shù)據(jù)科學(xué)觀點(diǎn)的問(wèn)題在于它比關(guān)注數(shù)據(jù)大小或工具的觀點(diǎn)要困難得多。計(jì)算數(shù)據(jù)集的大小要容易得多,并且說(shuō)'我的數(shù)據(jù)比你的大',或者說(shuō)'我能在 Hadoop 中編碼,你能嗎?' 而不是說(shuō)'我有這個(gè)非常難的問(wèn)題,我可以用我的數(shù)據(jù)回答嗎?'。' 數(shù)據(jù)科學(xué)是個(gè)老概念了,John Graunt 在它還是個(gè)新概念的時(shí)候就研究它了。正是在15世紀(jì)的小冰期,他利用概率模型開(kāi)發(fā)了人口統(tǒng)計(jì)學(xué)的第一部作品。到1960年,該主題已經(jīng)非常成熟并且被稱(chēng)為數(shù)據(jù),但是僅在2012年哈佛商業(yè)評(píng)論發(fā)表文章'數(shù)據(jù)科學(xué)家:21世紀(jì)最性感的工作'后這個(gè)詞和這個(gè)工作才越來(lái)越受歡迎。此后僅兩年,就可以獲得關(guān)于該主題的大量在線(xiàn)課程。谷歌趨勢(shì)顯示了一些有趣的東西:盡管自2004年以來(lái)'統(tǒng)計(jì)學(xué)家'一詞呈下降趨勢(shì),但'數(shù)據(jù)科學(xué)家'這一術(shù)語(yǔ)在哈佛商業(yè)評(píng)論的文章之后有了更強(qiáng)烈的積極變動(dòng),并且當(dāng)在線(xiàn)課程的提供增加時(shí),它得到了提升。 考慮到這一點(diǎn),我要說(shuō)清楚:數(shù)據(jù)科學(xué)家不是統(tǒng)計(jì)學(xué)家,并且他們也不會(huì)代替統(tǒng)計(jì)學(xué)家(反之亦然),但對(duì)統(tǒng)計(jì)學(xué)和數(shù)學(xué)的真正興趣才是正確進(jìn)行數(shù)據(jù)科學(xué)的關(guān)鍵。我自己不是個(gè)統(tǒng)計(jì)學(xué)家,但是下面的第一個(gè)資源讓我喜歡上這個(gè)主題。 還請(qǐng)觀察下面資源如何更多地關(guān)注'好奇心'和'理解'而不是'應(yīng)用'。 你喜歡清單嗎? 簡(jiǎn)而言之,7個(gè)資源是: Machine Learning Course,由斯坦福大學(xué)創(chuàng)建并由Andrew Ng執(zhí)教 Introduction to Mathematical Thinking,同樣由斯坦福大學(xué)創(chuàng)建并由Keith Devlin執(zhí)教 該清單既不是按照時(shí)間順序也不是按重要性順序,很多這些事情會(huì)同時(shí)發(fā)生并且4-7項(xiàng)幾乎肯定會(huì)并且永遠(yuǎn)成為你作為數(shù)據(jù)科學(xué)家日常工作的一部分。 來(lái)讓我看看細(xì)節(jié)部分吧! 醉漢漫步 (譯者注:這是一本書(shū),豆瓣地址:https://book.douban.com/subject/3102009/) 許多年前(大概是2009年?)當(dāng)我在圣誕節(jié)收到這本書(shū)時(shí),對(duì)它并沒(méi)有很深的印象,但是多年后它變成了我一直以來(lái)的最?lèi)?ài)。 醉漢漫步這本書(shū)是幫助我們理解隨機(jī)性對(duì)我們生活造成的影響,亞馬遜的產(chǎn)品描述是這樣的'它揭露了這些心理錯(cuò)覺(jué)是如何阻擋我們理解生活,從選股到品酒'。 它幫助我覺(jué)察到我們是多么容易成為概率的受害者,也幫助我理解為什么我們更容易推到理解導(dǎo)致事件發(fā)生的所有因素,而預(yù)測(cè)類(lèi)似情況會(huì)不會(huì)再次發(fā)生卻很難的原因。 從分析者的角度來(lái)說(shuō),這本書(shū)向我們展示了預(yù)測(cè)模型的重要性也從統(tǒng)計(jì)數(shù)據(jù)的角度證明了歷史事件發(fā)生的必然性,同樣還向我們展示了如何使用數(shù)據(jù)來(lái)解答一些難以理解的問(wèn)題,以及為什么有些問(wèn)題仍舊無(wú)法獲得答案。我把這本書(shū)認(rèn)為是我同'數(shù)據(jù)科學(xué)'的第一次親密接觸。 另外一本很好的同類(lèi)讀物是:《Algorithms to Live by: The Computer Science of Human Decisions.》(《生活中的算法:人類(lèi)決策中的計(jì)算機(jī)科學(xué)》) 機(jī)器學(xué)習(xí) 這門(mén)課是斯坦福大學(xué)在Coursera上的公開(kāi)課,是很多朋友也是我在機(jī)器學(xué)習(xí)中的入門(mén)課,在我看來(lái)這是一個(gè)必讀的課程。 它會(huì)首先幫你復(fù)習(xí)線(xiàn)性代數(shù)中的核心概念,然后會(huì)教你基礎(chǔ)的Matlab(Octave)編程。完成這些后,才會(huì)提出第一個(gè)關(guān)于一元回歸的概念。之后,課程會(huì)帶你學(xué)習(xí)一些有趣的部分,比如做數(shù)據(jù)分析的一些主要方法工具以及神經(jīng)網(wǎng)絡(luò),但是如果你想很認(rèn)真很認(rèn)真的學(xué)習(xí),那你就要多做練習(xí)并且在過(guò)程中會(huì)接觸到很多課外知識(shí),這些都會(huì)幫助你建立在機(jī)器學(xué)習(xí)中的直覺(jué)與數(shù)學(xué)能力。 數(shù)學(xué)思維概論 2008年我的大學(xué)階段我很開(kāi)心,因?yàn)槲以谶@個(gè)階段學(xué)習(xí)了不同種類(lèi)的數(shù)學(xué)。即便這樣,我也打算來(lái)聽(tīng)斯坦福大學(xué)在Coursera上的這門(mén)公開(kāi)課,通過(guò)它來(lái)幫助我回顧數(shù)學(xué)中的一些核心概念,同時(shí)增強(qiáng)我的數(shù)學(xué)技能。這門(mén)課不僅覆蓋了我在第一學(xué)期中學(xué)到的一些概念,它還提升了我在分析思維上的能力。對(duì)于大多數(shù)人來(lái)說(shuō),這門(mén)課在幫助大家從傳統(tǒng)的推理思維轉(zhuǎn)換到數(shù)學(xué)思維這件事兒上建立了一個(gè)很好的范例。除此以外,部分課程會(huì)在數(shù)學(xué)證明上具有一定的挑戰(zhàn)性。特別是對(duì)于普通的書(shū)寫(xiě)語(yǔ)言而言,它會(huì)讓你有一種在學(xué)習(xí)一門(mén)新語(yǔ)言的感覺(jué)。 你不會(huì)感到學(xué)習(xí)'一門(mén)新語(yǔ)言'這件事很痛苦,因?yàn)榕兴季S對(duì)數(shù)據(jù)科學(xué)尤為重要。另外一個(gè)重要的點(diǎn)(或者說(shuō)減輕痛苦的點(diǎn))是這門(mén)課會(huì)幫助你在探索數(shù)據(jù)科學(xué)時(shí)掃清一些常見(jiàn)謬誤的概念。 Master List of Logical Fallacies 邏輯謬論列表 utminers.utep.edu/omwilliamson/emgl1311utminers.utep.edu 如果在剛開(kāi)始學(xué)習(xí)這些內(nèi)容時(shí)把你自己所在一個(gè)籠子里幾周,出來(lái)后你會(huì)對(duì)很多你聽(tīng)到的、你見(jiàn)到的事情產(chǎn)生質(zhì)疑。不要忘了目標(biāo):數(shù)據(jù)科學(xué)! Dilbert列舉了許多常見(jiàn)謬誤 編程 總的來(lái)說(shuō),無(wú)論你的職業(yè)選擇是如何,你都要學(xué)會(huì)編程。它能在很多方面讓你的工作生活變的有趣和方便。 大體來(lái)說(shuō),對(duì)于生活中遇到的一些數(shù)據(jù)科學(xué)問(wèn)題我們已經(jīng)漸漸不用再自己去編程,這部分任務(wù)已經(jīng)被 Alteryx, Azure Studio, Dataiku, H2O.ai, or Knime這些平臺(tái)完成。然而,成為一個(gè)通用框架或編程專(zhuān)家在很長(zhǎng)一段時(shí)間內(nèi)都能給你在快速高效處理未清洗的機(jī)器學(xué)習(xí)數(shù)據(jù)時(shí)極強(qiáng)的自信。 在最開(kāi)始時(shí)你的問(wèn)題可能是'我如何把csv文件的內(nèi)容讀取到數(shù)據(jù)框架里?我如何做一些簡(jiǎn)單的數(shù)據(jù)可視化工作?我如何把所有類(lèi)里的數(shù)據(jù)值變成數(shù)值?我如何處理多列表數(shù)據(jù)集?',在過(guò)了某個(gè)時(shí)間節(jié)點(diǎn)后,你的問(wèn)題就變成'這里用loopsin合適嗎,還是有其他的方式能達(dá)到這個(gè)目標(biāo),比如vectorised?我如何才能把我的算法簡(jiǎn)化從而降低所占用的計(jì)算機(jī)資源?' 幸運(yùn)的是你有很多種選擇來(lái)解決這些問(wèn)題與挑戰(zhàn):更多有經(jīng)驗(yàn)的人,Stack Overflow、Quora還有其他一些社區(qū)。 對(duì)編程語(yǔ)言來(lái)說(shuō),我推薦Python作為人工智能的入門(mén)語(yǔ)言,因?yàn)樗苋菀咨鲜?,而且它在?shù)據(jù)科學(xué)家中很流行,因?yàn)樗腜andas,Numpy,Matplotlib等多個(gè)庫(kù)可以幫助他們很好的處理數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)清洗及可視化等問(wèn)題,而且它和機(jī)器學(xué)習(xí)框架TensorFlow配合很好,可以讓你很輕松的就調(diào)用GPU的算力。 另外一條比較通用的路徑就是R語(yǔ)言了。相對(duì)于Python可能會(huì)讓你花點(diǎn)時(shí)間進(jìn)入'數(shù)據(jù)科學(xué)'的世界這件事來(lái)講,R會(huì)讓你立馬進(jìn)入統(tǒng)計(jì)模型的世界。相比之下,選擇Python除了數(shù)據(jù)科學(xué)這個(gè)功能外,它還能幫助你更好的理解編程這件事,讓你上手其他語(yǔ)言如C++,Java更快。但是無(wú)論你選擇R還是選擇Python,都是可以的。 看看Udemy的這個(gè)課程,我沒(méi)去學(xué)習(xí)它,但是就課程內(nèi)容和價(jià)格來(lái)講,看起來(lái)還不錯(cuò),鏈接如下: https://www./the-data-science-course-complete-data-science-bootcamp/ 另外一個(gè)比較好的資源就是Gareth James的 An Introduction to Statistical Learning with Applications in R(R語(yǔ)言在統(tǒng)計(jì)學(xué)習(xí)中的應(yīng)用)。這本書(shū)在鏈接中就能看到,它的核心內(nèi)容是如何使用R語(yǔ)言進(jìn)行統(tǒng)計(jì)編程。如果你線(xiàn)性代數(shù)沒(méi)有學(xué)的很扎實(shí),這本書(shū)會(huì)嚇到你(你第10頁(yè)就會(huì)遇到)。無(wú)論你如何選擇,你都需要學(xué)習(xí)數(shù)學(xué)。。。 對(duì)數(shù)學(xué)的無(wú)偏見(jiàn)評(píng)論 我一直很喜歡數(shù)學(xué),但是我在高中的時(shí)候?qū)W的比較一般。在大學(xué)階段我就學(xué)的比較好了,當(dāng)然是通過(guò)不懈的努力(2013年的時(shí)候)。差不多這個(gè)時(shí)候我決定我將在未來(lái)的某個(gè)時(shí)間節(jié)點(diǎn)去攻讀碩士研究生,然而在學(xué)習(xí)Gre和GMAT的過(guò)程中,我就發(fā)現(xiàn)了我一些基礎(chǔ)知識(shí)薄弱的地方,中間還有個(gè)有趣的插曲,就是我是通過(guò)看視頻學(xué)習(xí)的,這個(gè)視頻不是一般的視頻,而且給孩子學(xué)習(xí)數(shù)學(xué)看的lol。 多年后,我開(kāi)始接觸到了數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)的邊角:高級(jí)線(xiàn)性代數(shù)和計(jì)算。雖然說(shuō)這對(duì)于成為一個(gè)數(shù)據(jù)科學(xué)家來(lái)說(shuō)并不是一個(gè)必須品,但是它對(duì)你理解數(shù)據(jù)很有幫助,比如說(shuō)一個(gè)主成分分析(PCA)倒是在做什么。懂的數(shù)據(jù)背后的數(shù)學(xué)可以在講述故事的時(shí)候幫助你很多,當(dāng)日是在開(kāi)始的時(shí)候。 2個(gè)群在3個(gè)主成分中的繪圖(自有資源)。數(shù)學(xué)直覺(jué)可以很好的幫助你理解這個(gè)。 總的來(lái)說(shuō),Manhattan Prep的線(xiàn)上課程雖然昂貴,但是對(duì)我學(xué)習(xí)數(shù)學(xué)起到了至關(guān)重要的作用。它幫助在今天更容易的理解機(jī)器學(xué)習(xí),統(tǒng)計(jì)學(xué)和金融分析。擁有一個(gè)牢固的數(shù)學(xué)基礎(chǔ)可以幫助你學(xué)習(xí)新知識(shí)時(shí)更快更好,同樣它在工作效率和自我認(rèn)同上也提供了非常重要的作用。 看看下邊的資源: GRE Just Math | Manhattan Prep GRE Just Math is your live, comprehensive GRE Math prep course taught by a 99th-percentile GRE Math expert. In one…www.manhattanprep.com Manhattan Prep GRE Set of 8 Strategy Guides, 4th Edition : Manhattan Prep : 9781937707910 Manhattan Prep GRE Set of 8 Strategy Guides, 4th Edition by Manhattan Prep, 9781937707910, available at Book Depository…www.bookdepository.com 除非你想獨(dú)自研究或者學(xué)習(xí)算法,高級(jí)線(xiàn)性代數(shù)與計(jì)算并不是必備的,它對(duì)我來(lái)說(shuō)是更快理解核心觀念的工具,尤其是在統(tǒng)計(jì)模型中。 人 作為一個(gè)數(shù)據(jù)科學(xué)可能需要你安靜的坐下來(lái),然后敲無(wú)止盡的代碼,做成天上月的特征工程,最后才能得到一些有意義的數(shù)據(jù)。在這樣的情況下,一個(gè)人如果無(wú)法能從高認(rèn)知層面上解釋或者理解它在干什么以及它為什么這么干,那么他是無(wú)法從中獲得樂(lè)趣的。當(dāng)日,最關(guān)鍵的是你需要首先定義清楚你要解決的問(wèn)題。 假設(shè)你是一個(gè)電子商務(wù)公司的數(shù)據(jù)科學(xué)家,你突然接到報(bào)告說(shuō)'信用卡欺詐交易數(shù)量突然間上升了'。雖然說(shuō)你對(duì)于這個(gè)問(wèn)題還沒(méi)有任何線(xiàn)索,但是你心中已經(jīng)知道大概可以先從這幾個(gè)點(diǎn)入手。一個(gè)新手會(huì)犯的錯(cuò)誤是直接去看一個(gè)分類(lèi)或者群模型,只是因?yàn)?欺詐'這個(gè)字眼影響你這么做。探索性的數(shù)據(jù)分析可以在最開(kāi)始的時(shí)候幫助你,但是核心問(wèn)題仍舊無(wú)法被回答:應(yīng)該去分析什么,從哪兒開(kāi)始,最終的目標(biāo)是什么,如何來(lái)衡量你工作的影響。最終可能你會(huì)發(fā)現(xiàn)問(wèn)題是出在版本發(fā)行中的一個(gè)bug,一個(gè)你無(wú)須什么數(shù)據(jù)分析技巧就能解決的問(wèn)題。 事實(shí)上設(shè)計(jì)思維是一個(gè)在People中被廣泛認(rèn)知的方法論。尤其是在基礎(chǔ)交流、講故事、定義問(wèn)題和產(chǎn)品開(kāi)發(fā)中。盡管設(shè)計(jì)思維同數(shù)據(jù)科學(xué)沒(méi)有直接的聯(lián)系,但是它可以幫助數(shù)據(jù)科學(xué)家同身邊的人交流并交付'數(shù)據(jù)產(chǎn)品'。 總的來(lái)說(shuō),一個(gè)人在某一個(gè)方面越專(zhuān)精,越容易通過(guò)支持?jǐn)?shù)據(jù)定義一個(gè)問(wèn)題,并基于支持?jǐn)?shù)據(jù)來(lái)快速高效的提出解決方案。不可忽略的是,哪怕是一個(gè)資深數(shù)據(jù)科學(xué)家,也要通過(guò)同人來(lái)交流從而幫助他解決遇到的挑戰(zhàn)。 A Virtual Crash Course in Design Thinking This is an online version of one of our most frequently sought after introductory learning experiences. Using a video…dschool.stanford.edu 在很多情況下,理解更有經(jīng)驗(yàn)的人的觀點(diǎn)是非常有用的,同時(shí)這也是一種捷徑。你可以和來(lái)自世界各個(gè)角落的人分享觀點(diǎn),參加黑客馬拉松和各種聚會(huì),世界上的大多數(shù)城市都會(huì)有諸如此類(lèi)的活動(dòng)。核心是交流,學(xué)習(xí)和分享。完全沒(méi)有理由孤立自己。 '正統(tǒng)'經(jīng)濟(jì)學(xué)和'異端'經(jīng)濟(jì)學(xué) 如果你正在處理消費(fèi)者數(shù)據(jù),這些資源將會(huì)特別有用。但是如果你正在處理數(shù)據(jù)中心監(jiān)控?cái)?shù)據(jù),藥品數(shù)據(jù),金融監(jiān)控,工廠傳感器上的生物醫(yī)學(xué)數(shù)據(jù),這些資源基本用不上。記住,這篇文章是基于我自身的經(jīng)驗(yàn),但是這里的要點(diǎn)是獲取某一專(zhuān)業(yè)領(lǐng)域的知識(shí)。 我用簡(jiǎn)單的方式介紹一下兩者的不同:正統(tǒng)經(jīng)濟(jì)學(xué)著重用一串的主流模型解釋過(guò)去,現(xiàn)在和未來(lái)。然而'異端'經(jīng)濟(jì)學(xué)加入了很多的社會(huì)中的個(gè)人情況,經(jīng)常在均衡中帶入一些主觀性。 拿巴西汽車(chē)價(jià)格舉例。雖然巴西仍然在與高物價(jià),荒謬的稅收,僅僅只有12%的地方鋪有公路等情況做著斗爭(zhēng),但是汽車(chē)制造商仍然有很高的利潤(rùn)率。除此之外,當(dāng)人們?cè)谫I(mǎi)車(chē)的時(shí)候,人們更傾向購(gòu)買(mǎi)高檔次的汽車(chē),有時(shí)不惜以過(guò)高的利率分72期進(jìn)行償還。這又很多客觀的和主觀的原因在里面。相比于公共交通的質(zhì)量,有一輛好車(chē)既是地位的象征,同時(shí)在繁忙的交通中人們有一輛車(chē)感覺(jué)會(huì)更好......這些變量可以用'正統(tǒng)'經(jīng)濟(jì)學(xué)進(jìn)行評(píng)估,但是當(dāng)每一個(gè)人都有自己的價(jià)值感知時(shí),這些變量就不能直接進(jìn)行評(píng)估了。這個(gè)挑戰(zhàn)是在購(gòu)買(mǎi)者和利潤(rùn)率都最大化時(shí)定義產(chǎn)品和價(jià)格。所以理解文化價(jià)值和宏觀經(jīng)濟(jì)因素對(duì)感知的影響之間的對(duì)抗是重要的,這將對(duì)你進(jìn)行分析更加有利。而且,理解個(gè)人行為是個(gè)性化的關(guān)鍵,同時(shí)這也是數(shù)據(jù)科學(xué)中的一個(gè)重要主題。順便說(shuō)一句,根據(jù)以上的例子,利率同樣來(lái)自主觀的因素,比如借款人和貸款人的時(shí)間偏好。 理解經(jīng)濟(jì)學(xué)是處理國(guó)際業(yè)務(wù)的關(guān)鍵。明知道宏觀經(jīng)濟(jì)動(dòng)態(tài)并不能夠徹底地被GDP或者(貿(mào)易)順差這樣的主流指標(biāo)解決,將迫使你自然而然地陷入可選擇但強(qiáng)制的辯解中。 出于我個(gè)人對(duì)金融危機(jī)的好奇,我大約在2008年的時(shí)候啟動(dòng)了這些課題,但是我直到2012年的時(shí)候才發(fā)布了以下這些資源: 這些是怎么結(jié)合起來(lái)的呢? 現(xiàn)在,假設(shè)你是在一家負(fù)責(zé)CRM(客戶(hù)關(guān)系管理)和訂閱主要寵物產(chǎn)品供應(yīng)商的內(nèi)容管理的機(jī)構(gòu)工作。 以你對(duì)商業(yè)和人群不斷變化的理解,你寫(xiě)了一個(gè)包含能夠?qū)撛诳蛻?hù)分類(lèi),并能識(shí)別'呼叫中心背景噪音有多大'與發(fā)表在企業(yè)APP上的'不斷增長(zhǎng)的有關(guān)丑陋的狗狗內(nèi)容'的綜合因素有關(guān)的根本原因的代碼。 你還了解到'客戶(hù)中心的響度'與'狗狗的丑陋'不是獨(dú)立思考的客戶(hù)流失的主要原因。你把這些你用python的Season庫(kù)并且你允許它使用這些數(shù)據(jù)并用數(shù)據(jù)可視化工具活動(dòng)起來(lái)建立起來(lái)的圖表呈遞給你的首席戰(zhàn)略官。你已經(jīng)成功地向組織的主要領(lǐng)導(dǎo)解釋了結(jié)論是如何形成的,就像指揮管弦樂(lè)隊(duì)的大師,但是你用對(duì)數(shù)學(xué)和統(tǒng)計(jì)建模的扎實(shí)理解的能力替代了指揮棒。你很自信,你的論點(diǎn)很有道理,這導(dǎo)致了領(lǐng)導(dǎo)層的認(rèn)可,因?yàn)槟悻F(xiàn)在正在創(chuàng)造一個(gè)欣欣向榮的環(huán)境來(lái)討論真正的問(wèn)題,而不是謬誤。CRM將解決客戶(hù)容易流失的客戶(hù)案例,內(nèi)容經(jīng)理現(xiàn)在將開(kāi)始發(fā)布有關(guān)llamas的更多信息,這將增加節(jié)假日的附加銷(xiāo)售,因?yàn)槟拇蠖鄶?shù)客戶(hù)都居住在秘魯一個(gè)旅游頻繁的城市。 最后,您還使用在GPU上運(yùn)行的密集神經(jīng)網(wǎng)絡(luò)的TensorFlow來(lái)訓(xùn)練這種流失預(yù)測(cè)算法,來(lái)處理數(shù)十億條記錄和特性。它的部署方式是,即時(shí)評(píng)估應(yīng)用程序、網(wǎng)站、實(shí)體商店和呼叫中心內(nèi)客戶(hù)的所有交互,使系統(tǒng)能夠了解模式,并在檢測(cè)到高流失可能性時(shí)通知您。 聽(tīng)起來(lái)很瘋狂,但這就是數(shù)據(jù)科學(xué)的重點(diǎn):將問(wèn)題轉(zhuǎn)化為答案,將挑戰(zhàn)轉(zhuǎn)化為巨大的機(jī)遇(在許多情況下,需要幾個(gè)月甚至幾年時(shí)間!) 總體思路 當(dāng)然,你接觸新信息的速度將超過(guò)你吸收新信息的能力。我仍然在學(xué)習(xí)許多我不完全理解的事情的進(jìn)程上。誠(chéng)然,我的學(xué)位和專(zhuān)業(yè)經(jīng)驗(yàn)幾乎是自然地幫助我在這一領(lǐng)域中立足的,但以上資源是獨(dú)立的,我可以放心地說(shuō),幾乎每個(gè)職業(yè)都有可轉(zhuǎn)移的技能,可以用于數(shù)據(jù)科學(xué)。選擇一個(gè)開(kāi)始的地方可能是令人望而生畏的,特別是有這么多可用的信息,但我希望經(jīng)驗(yàn)可以幫助您找到一些資源開(kāi)始。 展望未來(lái) 我對(duì)數(shù)據(jù)科學(xué)有很多樂(lè)趣,我相信那些喜歡多學(xué)科領(lǐng)域和不斷學(xué)習(xí)的人也會(huì)有?,F(xiàn)在,我仍然依靠上面的一些資源來(lái)繼續(xù)前進(jìn)。不過(guò),我更重視傾聽(tīng)人們的經(jīng)歷。 事實(shí)上,它周?chē)某醋骱臀宋寺晻?huì)讓很多人感到沮喪,許多神話(huà)-和過(guò)于簡(jiǎn)單化-出現(xiàn),但無(wú)論你是開(kāi)始或只是路過(guò),我希望這些資源對(duì)你有用。 想聽(tīng)聽(tīng)關(guān)于數(shù)據(jù)科學(xué)和A.I.的更多信息嗎? 在 twitter 上和媒體上關(guān)注我,在媒體上我會(huì)更經(jīng)常地分享和發(fā)布這些主題。 想要繼續(xù)查看該篇文章相關(guān)鏈接和參考文獻(xiàn)? 長(zhǎng)按鏈接點(diǎn)擊打開(kāi)或點(diǎn)擊【如果你想學(xué)數(shù)據(jù)科學(xué),這7類(lèi)資源千萬(wàn)不能錯(cuò)過(guò)】: https://ai./page/TextTranslation/1213 AI研習(xí)社每日更新精彩內(nèi)容,觀看更多精彩內(nèi)容:雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)(公眾號(hào):雷鋒網(wǎng)) 命名實(shí)體識(shí)別(NER)綜述 杰出數(shù)據(jù)科學(xué)家的關(guān)鍵技能是什么? 初學(xué)者怎樣使用Keras進(jìn)行遷移學(xué)習(xí) 如果你想學(xué)數(shù)據(jù)科學(xué),這 7 類(lèi)資源千萬(wàn)不能錯(cuò)過(guò) 等你來(lái)譯: 深度學(xué)習(xí)目標(biāo)檢測(cè)算法綜述 一文教你如何用PyTorch構(gòu)建 Faster RCNN 高級(jí)DQNs:利用深度強(qiáng)化學(xué)習(xí)玩吃豆人游戲 用于深度強(qiáng)化學(xué)習(xí)的結(jié)構(gòu)化控制網(wǎng)絡(luò) (ICML 論文講解) |
|
來(lái)自: flyk0tcfb46p9f > 《電腦》