從事數(shù)據(jù)分析一定要選一門編程語言和工具,技多不壓身嘛。 數(shù)據(jù)分析的工具有很多,按功能和側(cè)重點來分有統(tǒng)計工具、可視化工具等等。 應用最廣的也是最常被提到的,無非是Excel、SAS、Python、R等等。那么,這么多工具是否都要學?都適用于什么情況?又應該如何使用呢? Excel EXCEL是其中最簡單的,倒不是容易而是人人都會。但如果是用來分析的話,圖表只是基礎(chǔ),還要學會使用透視圖以及VBA函數(shù)。Excel的功能其實非常強大,尤其是通過學習VBA,幾乎能解決所有的問題,但成本就高了,而且Excel的數(shù)據(jù)處理量并不是很大,幾十萬而已,大數(shù)據(jù)量還要另尋方法。 SPSS SPSS最初是社會科學統(tǒng)計軟件,如果剛?cè)腴T數(shù)據(jù)分析,懂點SPSS事非常有好處的,當然前提是要懂SQL。SPSS得使用對人的能力要求不高,編程模塊很少使用,通常用于科學、市場之類的調(diào)研,在院校中使用較多。 有了以上的基礎(chǔ)之后,可能就需要精通一門統(tǒng)計分析軟件。 近幾年的互聯(lián)網(wǎng)潮,R語言流行起來了,在互聯(lián)網(wǎng)行業(yè)運用較多。R語言是開源的,學習起來并不容易,需要一個長期的過程。 SPSS剛剛有提到,適用于市場研究,上手較快。如果會編程的話,功能還是蠻強大的。 SAS一般是金融行業(yè)應用較廣,特別是銀行業(yè)和醫(yī)學統(tǒng)計,包括一些制造業(yè)也很多。銀行業(yè)通常會用SAS來做統(tǒng)計,數(shù)據(jù)挖掘也會用到,價格昂貴,學起來比較難,建議網(wǎng)上尋找一些課程和教材來學。 所以打擊愛可以針對自己的行業(yè)和實際情況來做選擇,以上列舉的只是大致情況。 Python Python&R的比較 以上就是各種數(shù)據(jù)分析工具和語言的介紹,其次還要掌握一些第三方工具,這些工具一般偏業(yè)務(wù)化應用,可視化數(shù)據(jù)展示類偏多,所以在技術(shù)上沒有太多要求,不過SQL需要掌握。 Tableau 多次介紹過的一款可視化工具,可視化方面應該是做得最不錯的工具了,偏前端分析。不懂python不懂R的可以試試。有點貴,土豪們加油! Qlikview 相對tableau有點丑,不要噴,畢竟人家走數(shù)據(jù)處理路線,作為BI產(chǎn)品,數(shù)據(jù)處理速度還是不錯的,取個數(shù)不至于像tableau慢。兩者像互補兄弟,各有優(yōu)勢,但都一樣貴,哈哈!所以對數(shù)據(jù)處理要求較高的話,建議嘗試。 FineBI 國內(nèi)的可視化軟件,bi工具。無功無過,重在穩(wěn)定和應用,國內(nèi)有一定市場,企業(yè)應用挺廣。有一定數(shù)據(jù)分析基礎(chǔ)的同學,應該說很快就能上手,免費版無限用! 還有一些D3之類的chart軟件這里由于篇幅就不介紹了,主要偏應用,在工作中使用還是蠻廣的。 總體來將,每個工具各有優(yōu)勢,但最關(guān)鍵的還是對于業(yè)務(wù)的熟悉度,沒有遠離和思路,任何工具都用不起來,所以在做數(shù)據(jù)分析時,一定要扎根學習業(yè)務(wù)和數(shù)據(jù)建模方法,工具不是萬能的! |
|