對于數(shù)據(jù)分析工具,我們通過會有一個疑問,在眾多的數(shù)據(jù)分析工具中,到底有什么區(qū)別,哪一個更好,我又應(yīng)該學(xué)習(xí)哪一個呢? 雖然這是一個老生常談的問題了,但它卻是非常重要,我也一直在努力尋找最終的答案。如果你到網(wǎng)上去搜索相關(guān)的問題,很難得到一個完全公正的觀點(diǎn)。因此,我們通過調(diào)查問卷,采訪了多位數(shù)據(jù)分析師,得出了數(shù)據(jù)分析行業(yè)最實(shí)用的數(shù)據(jù)分析工具,前6位結(jié)果如下: 1、Excel Excel 具有多種強(qiáng)大的功能,諸如創(chuàng)建表單、數(shù)據(jù)透視表和 VBA 編程等,其強(qiáng)大的功能令任何數(shù)據(jù)分析工具都無法超越它,從而確保人們可以根據(jù)自身的需要來分析數(shù)據(jù)。 然而一些精通計(jì)算機(jī)編程語言的人可能并不愿意使用 Excel 作為分析工具,因?yàn)?Excel 并不能很好的處理大數(shù)據(jù)。但是請思考一下,我們?nèi)粘I钪械臄?shù)據(jù),是否真的達(dá)到了大數(shù)據(jù)的級別?在我看來,Excel 是多功能的工具,它非常適合處理小型數(shù)據(jù),而且還用于各類插件,用于處理數(shù)以百萬的數(shù)據(jù)。 綜上所述,基于 Excel 的強(qiáng)大功能和龐大的用戶基礎(chǔ),它仍然是數(shù)據(jù)分析師們必不可少的工具。如果你想學(xué)習(xí)數(shù)據(jù)分析,Excel 絕對是首選工具。 2、BI tools 商業(yè)智能誕生于數(shù)據(jù)分析,而且它誕生于一個很高的起點(diǎn)上。它誕生的目的就是為了縮短業(yè)務(wù)數(shù)據(jù)到業(yè)務(wù)決策的時間,并通過數(shù)據(jù)來影響決策。 雖然 Excel 可以做很多事情,但是 Excel 的產(chǎn)品目標(biāo)并不是這樣的。你可以使用 Excel繪制課程表,制作問卷或者當(dāng)作計(jì)算器使用,甚至可以畫圖,如果你掌握了 VBA 編程,你甚至還可以制作小型的游戲。但是這些都不是真正的數(shù)據(jù)分析功能。 但是 BI 工具是專門用來做數(shù)據(jù)分析的。 以常見的 BI 工具為例,例如 Power BI,F(xiàn)ineReport 和 Tableau。你會發(fā)現(xiàn)它們都是根據(jù)數(shù)據(jù)分析流程來進(jìn)行設(shè)計(jì)的。首先是數(shù)據(jù)處理,數(shù)據(jù)清洗,然后是數(shù)據(jù)建模,最后則是數(shù)據(jù)可視化。通過可視化的圖表來直觀的展示分析結(jié)果并影響最終的決策。 這個流程就是數(shù)據(jù)分析的唯一方法,而且在此過程中會有各種各樣困擾人們的痛點(diǎn)。 例如,可以使用 BI 工具簡化重復(fù)和低廉的數(shù)據(jù)清洗工作。 如果數(shù)據(jù)量非常巨大,那么傳統(tǒng)的 Excel 則很難完成透視表的處理。 如果我們使用 Excel 進(jìn)行圖表展示,也需要花費(fèi)大量的時間來編輯圖表的顏色,字體等信息。 這些都是 BI 工具可以為我們解決的痛點(diǎn)。 3、Tableau Tableau 的核心本質(zhì)是 Excel 的 PivotTable 和 PivotChart,可以說 Tableau 敏銳的意識到 Excel 的這一功能的強(qiáng)大之處,很早就進(jìn)入了市場,并且延續(xù)了這一核心價值。 從發(fā)展歷史和當(dāng)前市場的反饋來看, Tableau 的可視化效果更好。我并不認(rèn)為這是因?yàn)樗膱D表做的多么的炫酷,而是因?yàn)樗脑O(shè)計(jì)和用戶體驗(yàn)給了我們簡單而新鮮的感覺。 的確,就像是 Tableau 自己宣傳的那樣,它們投入了大量的學(xué)術(shù)力量來研究人們喜歡什么樣的圖表,怎樣給用戶提供操作和體驗(yàn)上的終極體驗(yàn)。 此外,Tableau 還增加了數(shù)據(jù)清洗功能和智能分析功能,這也是 Tableau 未來的產(chǎn)品優(yōu)勢。 4、Power BI Power BI 的優(yōu)勢在于其業(yè)務(wù)模型和數(shù)據(jù)分析能力。 Power BI 最開始是 Excel 的插件,但是發(fā)展的并不好。所以后來它脫離了 Excel 并發(fā)展成為 BI 工具。作為一個后來者,Power BI 每個月都有迭代更新并且正在迎頭趕上。 Power BI 當(dāng)前有三種許可方式:Power BI free,Power BI Pro 和 Power BI Premium。同 Tableau 一樣,其免費(fèi)版本并不包含所有的功能,但是對于個人用戶而言,已經(jīng)足夠用了。而且 Power BI 的數(shù)據(jù)分析功能十分強(qiáng)大,它的 PowerPivot 和 DAX 語言可以使我們能夠類似于在 Excel 中編寫公式的方式完成更加復(fù)雜高級的分析。 5、FineReport FineReport 之所以與眾不同,就是因?yàn)槠渥灾鷶?shù)據(jù)分析功能非常適合企業(yè)用戶。通過一些簡單的拖拽操作,你就可以使用 FineReport 設(shè)計(jì)各式各樣的報(bào)表,并能夠輕松構(gòu)建數(shù)據(jù)決策分析系統(tǒng)。 FineReport 可以直接連接到各種數(shù)據(jù)庫上,并且可以方便快捷的自定義各種樣式來制作每周,每月和年度報(bào)告。它的操作頁面類似 Excel 的界面,功能包括報(bào)告創(chuàng)建,報(bào)告權(quán)限分配,報(bào)告管理和數(shù)據(jù)導(dǎo)入等等。 此外,FineReport 的可視化功能也是非常突出的,它提供了多種儀表盤模板和眾多可進(jìn)行二次開發(fā)的插件庫。 而 FineReport 的個人版是完全免費(fèi)的,而且可以使用所有的功能。 6、R & Python R 和 Python 是我要討論的第三種工具,雖然像 Excel 和 BI 工具這些軟件已經(jīng)盡最大的努力來滿足數(shù)據(jù)分析的需求,但是這些軟件還是無法完全自定義的。如果我們存在一些需要超級自定義的需求,那么這些軟件就無能為力了。 但是編程語言則不同,它們靈活且強(qiáng)大,你可以編寫代碼來執(zhí)行個人所需要的任何操作。例如,R 和 Python 是數(shù)據(jù)科學(xué)家們必不可少的工具,從某些專業(yè)角度看,它們絕對比 Excel 和 BI 工具更加強(qiáng)大。 那么 R 和 Python 可以實(shí)現(xiàn)哪些 Excel 和 BI 無法實(shí)現(xiàn)的場景呢? 1)專業(yè)統(tǒng)計(jì)分析 就 R 語言而言,它最擅長統(tǒng)計(jì)分析,比如正態(tài)分布,使用算法對數(shù)據(jù)進(jìn)行分類和回歸分析等。這種分析就像是將數(shù)據(jù)用作實(shí)驗(yàn)一樣,可以幫助我們回答下面的問題: 數(shù)據(jù)是正態(tài)分布,三角分布還是其他類型的分布? 什么是離散情況? 當(dāng)前數(shù)據(jù)十分在我們想要達(dá)到的控制范圍內(nèi)? 不同的參數(shù)對最終的結(jié)果影響是怎樣的? 如果某個參數(shù)發(fā)生變化,將會帶來什么影響? 2)個體預(yù)測分析 比如我們想要預(yù)測消費(fèi)者的行為: 用戶會在我們的店里停留多久? 用戶會消費(fèi)多少錢? 我們還可以找出用戶的個人信用狀況,再根據(jù)他在線消費(fèi)記錄來進(jìn)行貸款操作。 我們還可以根據(jù)用戶的網(wǎng)上瀏覽情況推送不同的信息。 當(dāng)然以上這些多少會涉及到當(dāng)下流行的機(jī)器學(xué)習(xí)和人工智能的概念。 結(jié)論 通過上面的比較,能夠得到各種工具之間的區(qū)別。最后我想說的是,存在即是合理的。Excel,BI 工具和編程語言可能在某些功能上是有重疊的,但是它們也是互補(bǔ)的。 在選擇數(shù)據(jù)分析工具之前,你必須首先明確自己的工作內(nèi)容:是否會使用到我上面提到的應(yīng)用場景?;蛘呖紤]下你個人的職業(yè)方向:是面向數(shù)據(jù)科學(xué)還是業(yè)務(wù)分析領(lǐng)域。 |
|