本科畢業(yè)的時(shí)候,小編并不知道什么是機(jī)器學(xué)習(xí),因?yàn)椴皇怯?jì)算機(jī)專業(yè),也沒(méi)有寫過(guò)大型程序。那些機(jī)器學(xué)習(xí)的算法在小編眼里就像一隊(duì)隊(duì)小蟲爬來(lái)爬去,最后全部變成了黃色星星。但是小編管理類專業(yè)所學(xué)習(xí)的課程中修習(xí)過(guò)統(tǒng)計(jì)相關(guān)知識(shí),一直對(duì)數(shù)據(jù)比較感興趣,希望能系統(tǒng)地學(xué)習(xí)數(shù)據(jù)知識(shí)。說(shuō)實(shí)話,在接觸一個(gè)新領(lǐng)域之初,迷茫、憂慮是每一個(gè)新人的通病。很多學(xué)習(xí)數(shù)據(jù)挖掘的人會(huì)因?yàn)樽约菏欠怯?jì)算機(jī)專業(yè),而對(duì)數(shù)據(jù)挖掘心生畏懼,望而卻步。實(shí)際上,非計(jì)算機(jī)專業(yè)出來(lái)學(xué)挖掘的,一般對(duì)數(shù)據(jù)庫(kù)編程要求不會(huì)很高。進(jìn)行數(shù)據(jù)挖掘通常都是由團(tuán)隊(duì)進(jìn)行的,團(tuán)隊(duì)一般會(huì)有人幫你寫,你主要是對(duì)業(yè)務(wù)要了解。如果要自己寫,也不用很精通,只要能取出自己想要的數(shù)據(jù)就行了。優(yōu)化方面起碼要會(huì)寫存儲(chǔ)過(guò)程,讓數(shù)據(jù)自己自動(dòng)執(zhí)行。如果公司要求在程序開發(fā)情況下進(jìn)行挖掘,一般要求會(huì)JAVA。主流的數(shù)據(jù)挖掘是必須會(huì)的。當(dāng)然了,如果有編程基礎(chǔ)就更好了,學(xué)習(xí)起來(lái)能更快地輕車熟路起來(lái)。 學(xué)習(xí)數(shù)據(jù)挖掘,必須明確自己的發(fā)展方向和目標(biāo)。很多人對(duì)數(shù)據(jù)行業(yè)里發(fā)展方向并不清楚,我們先來(lái)說(shuō)說(shuō)數(shù)據(jù)行業(yè)的職業(yè)發(fā)展方向。 數(shù)據(jù)行業(yè)從廣義上講可以分為以下幾個(gè)職位: 一、數(shù)據(jù)挖掘工程師 數(shù)據(jù)挖掘工程師多是通過(guò)對(duì)海量數(shù)據(jù)進(jìn)行挖掘,尋找數(shù)據(jù)的存在模式,從而通過(guò)數(shù)據(jù)挖掘來(lái)解決具體問(wèn)題。其更多是針對(duì)某一個(gè)具體的問(wèn)題,是以解決具體問(wèn)題為導(dǎo)向的。例如:聚類分析,通過(guò)對(duì)于會(huì)員各種人口統(tǒng)計(jì)學(xué)、行為數(shù)據(jù)進(jìn)行分析,對(duì)客戶進(jìn)行分類,更好地理解客戶,知道公司會(huì)員是到底如何?高、中、低低價(jià)值的客戶構(gòu)成,既可以后期公司的運(yùn)營(yíng)提供指導(dǎo),提高活動(dòng)效率,可以指導(dǎo)公司的營(yíng)銷。 做數(shù)據(jù)挖掘工程, 必須精通數(shù)據(jù)庫(kù)。很多時(shí)候,你模型的數(shù)據(jù)預(yù)處理,可能完成在數(shù)據(jù)庫(kù)里完成,你用到的數(shù)據(jù)庫(kù)技巧更高。必須要會(huì)成熟的數(shù)據(jù)挖掘工具、數(shù)據(jù)挖掘算法,等,當(dāng)然如果你會(huì)一、二款開源軟件,并會(huì)寫一些程序代碼那是最好的,大公司都喜歡用開源的軟件。 二、數(shù)據(jù)分析師 數(shù)據(jù)分析師更注意是對(duì)數(shù)據(jù)、數(shù)據(jù)指標(biāo)的解讀,通過(guò)對(duì)數(shù)據(jù)的分析,來(lái)解決商業(yè)問(wèn)題。主要有包括:(1)業(yè)務(wù)監(jiān)控:診斷當(dāng)前業(yè)務(wù)是否正常?是否存在問(wèn)題?業(yè)務(wù)發(fā)展是否達(dá)到預(yù)期?如果沒(méi)有達(dá)到預(yù)期,問(wèn)主要問(wèn)題在哪?是什么原因引起的?(2)建立分析體系:這些數(shù)據(jù)分析師已經(jīng)對(duì)業(yè)務(wù)有一定的理解,對(duì)業(yè)務(wù)也相對(duì)比較熟悉,更多幫業(yè)務(wù)方建立一套分析體系,或者更高級(jí)是做成數(shù)據(jù)產(chǎn)品。例如:營(yíng)銷活動(dòng)。分析師會(huì)告訴業(yè)務(wù)方,在活動(dòng)前你應(yīng)該分析哪些數(shù)據(jù),從而制定恰當(dāng)?shù)臓I(yíng)銷計(jì)劃。在營(yíng)銷過(guò)程中,你應(yīng)該看哪些數(shù)據(jù),從而及時(shí)做出營(yíng)銷活動(dòng)調(diào)整。在營(yíng)銷活動(dòng),應(yīng)該如何進(jìn)行活動(dòng)效果評(píng)估以及行業(yè)未來(lái)發(fā)展的趨勢(shì)分析。 三、商業(yè)分析師。 商業(yè)分析師在行業(yè)、宏觀的層面進(jìn)行業(yè)務(wù)分析,預(yù)測(cè)未來(lái)行業(yè)的發(fā)展,競(jìng)爭(zhēng)對(duì)手的業(yè)務(wù)構(gòu)成,幫助公司制定戰(zhàn)略發(fā)展計(jì)劃,并及時(shí)跟蹤、分析市場(chǎng)動(dòng)態(tài),從而及時(shí)對(duì)戰(zhàn)略進(jìn)行不斷優(yōu)化。主要技能要求:要熟悉基本的統(tǒng)計(jì)分析知識(shí)、對(duì)于與網(wǎng)站相關(guān)的業(yè)務(wù)還可能要求掌握等網(wǎng)站分析工具等。 四、數(shù)據(jù)建模師 這個(gè)職位與數(shù)據(jù)挖掘工程師還是有本質(zhì)區(qū)別的。數(shù)據(jù)建模師,更多偏向于中、小數(shù)據(jù)量,而且其使用更多更多是統(tǒng)計(jì)學(xué)的方法,數(shù)據(jù)建模師其實(shí)很少會(huì)提到算法這個(gè)詞。但是有時(shí)候,這二個(gè)模型越來(lái)越?jīng)]有明確的分工,一般來(lái)說(shuō)都會(huì)二個(gè)職位的人都會(huì)去學(xué)習(xí)對(duì)方的知識(shí),所以這二個(gè)職位有合并的趨勢(shì)。 新進(jìn)入數(shù)據(jù)行業(yè)的同學(xué),可以根據(jù)自己的背景背景選擇相應(yīng)的職位,學(xué)數(shù)據(jù)、統(tǒng)計(jì)學(xué)的朋友更多可以偏向于建模師,而計(jì)算機(jī)特別是寫編程好的同學(xué),可以走數(shù)據(jù)挖掘工程師,也許適應(yīng)性更好,但這不是絕對(duì)的。 那么如何學(xué)習(xí)數(shù)據(jù)挖掘呢?小編來(lái)談?wù)勅绾巫詫W(xué)數(shù)據(jù)挖掘。 首先,小編還是建議大家按照自己當(dāng)前程度,選擇適合自己的數(shù)據(jù)挖掘的書?,F(xiàn)在微信比較流行,很多人在閱讀學(xué)習(xí)方面更依賴微信。但微信的文章雖然也有比較詳細(xì)的,但對(duì)于沒(méi)有編程基礎(chǔ)的童鞋,學(xué)習(xí)難度還是不小。所以小編更建議大家買書學(xué)習(xí),把基礎(chǔ)知識(shí)掌握牢固。 其次,在學(xué)習(xí)數(shù)據(jù)挖掘的過(guò)程中必須注意培養(yǎng)你的思維,盡量縝密敏捷。這樣才可以發(fā)現(xiàn)數(shù)據(jù)中的不同!因?yàn)橛械臄?shù)據(jù)挖掘是計(jì)算機(jī)處理的。有的則是紙面上的。所以必須學(xué)會(huì)記錄。 掌握數(shù)據(jù)挖掘理論之后,要把它應(yīng)用到實(shí)踐中。具體項(xiàng)目大家自己去找。 在實(shí)際的數(shù)據(jù)挖掘項(xiàng)目中: (1)明確你希望挖的東西能產(chǎn)生什么業(yè)務(wù)價(jià)值,而非用什么挖掘算法,挖掘算法是手段,后面再關(guān)注它就行。要能夠具體描繪你的挖掘目標(biāo)、價(jià)值,以及挖掘成果的預(yù)期展現(xiàn)形式,說(shuō)服力如何,等等。 (2)為了得到你想要的成果,要多和相關(guān)的小伙伴討論,比如需要利用到哪些數(shù)據(jù)?這些數(shù)據(jù)中,哪些是已經(jīng)有的,哪些還需要想辦法去收集?其中是否有些數(shù)據(jù)根本是不可能收集到的?這些收集不到的數(shù)據(jù)對(duì)于你想挖的成果會(huì)有什么影響?如果是致命影響,直接導(dǎo)致你的挖掘成果缺乏說(shuō)服力,那就另找其他方向吧。反之,則安排計(jì)劃和資源,把能收集到的數(shù)據(jù)盡快收集起來(lái)。 (3)根據(jù)收集到的數(shù)據(jù)的特點(diǎn)和收集過(guò)程的質(zhì)量情況,清洗收集到的數(shù)據(jù)。根據(jù)挖掘目標(biāo)的情況和收集到的數(shù)據(jù)的特點(diǎn),制定挖掘規(guī)劃,選擇合適的挖掘算法??偨Y(jié)一個(gè)成果,為了你的說(shuō)法,把數(shù)據(jù)再針對(duì)性地洗幾遍,給出一個(gè)更加干凈的分析成果,更有說(shuō)服力。 (4)再畫個(gè)信息圖什么的,圖文并茂,就可以初步交差。:在真實(shí)的項(xiàng)目中,還有一步,就是選取重要的評(píng)估視角和指標(biāo),根據(jù)具體的業(yè)務(wù)特點(diǎn),把你的分析過(guò)程做成每周每小時(shí)都能給個(gè)角度固定的分析報(bào)告的服務(wù)。再往前一步,如果你對(duì)這塊業(yè)務(wù)真的很熟的話,還可以針對(duì)不同類型的分析結(jié)果,能給出相應(yīng)的建議應(yīng)對(duì)措施,這樣這此挖掘的業(yè)務(wù)價(jià)值就真正明確了。 數(shù)據(jù)挖掘包括的東西很多,大家學(xué)習(xí)數(shù)據(jù)挖掘一定要耐心,不要老想著短期內(nèi)就要看到成果。知識(shí)都是積累的,積累完再到靈活運(yùn)用都需要時(shí)間。 關(guān)于數(shù)據(jù)挖掘的書,小編上一篇文章已經(jīng)說(shuō)過(guò),這里就不再重復(fù)。小編在這里強(qiáng)調(diào)一下:大家學(xué)習(xí)數(shù)據(jù)挖掘的時(shí)候一定要注意分級(jí),找準(zhǔn)自己的定位。欲速則不達(dá),不要一心求速忽略學(xué)習(xí)質(zhì)量。 |
|
來(lái)自: wzw69 > 《學(xué)習(xí)》