我喜歡數(shù)據(jù),并將它廣為人知。 如果您最近和我參加聚會,我在您耳邊說的都是有關(guān)數(shù)據(jù)可視化工具或者最近使用的酷R包,對此我在這向您表示歉意。 如果您和我玩范特西游戲,歡迎您來到圖表世界,這里有很多的圖表。 不要為越來越頻繁地聽到下面的問題感到驚訝:“Nick,我想走向數(shù)據(jù)分析和數(shù)據(jù)可視化,我應(yīng)該從哪里開始?” 不幸的是,沒有一個(gè)完美的答案適合所有的人–每一個(gè)人的需求不同且人們已經(jīng)知道的東西相差很大。但令我高興的是一件關(guān)于最近科技/教育/商業(yè)環(huán)境事情: 來自不同職業(yè)道路和背景的聰明人都對自己說:“我需要從數(shù)據(jù)中得到更多”。 但是,在很多初學(xué)者溝通后,發(fā)現(xiàn)了的共性。很明顯,這些共性不是適合每一個(gè)人的: 一個(gè)老練的工程師會嘲笑共性上說的第一時(shí)間學(xué)習(xí)Java腳本或者Python。 早已知道D3.js 的人會疑惑選擇哪一個(gè)可視化工具?或者疑惑怎么樣將數(shù)據(jù)驅(qū)動轉(zhuǎn)換應(yīng)用頂級的3D中? 這些適合想進(jìn)一步了解接近數(shù)據(jù)可視化的學(xué)術(shù)科學(xué)家、學(xué)校老師、研究咨詢師、項(xiàng)目經(jīng)理、失業(yè)快樂族或者M(jìn)BA畢業(yè)生……。 如果符合你,我認(rèn)為你應(yīng)該開始于從“無編碼”有計(jì)劃地學(xué)習(xí)到“愛編碼”。 無編碼首先,如果你對excel一無所知,這是值得去做的。嚴(yán)肅地告訴你至少得學(xué)會透視表,聽起來有些差勁,但是Excel能做很多超乎人們想象的事情。如果你善于嘗試,Excel甚至能做出很多漂亮的圖表。 如果你已經(jīng)有一些數(shù)據(jù),僅僅想用一個(gè)好的工具來探索可視化或者輸出更多引人注目的圖表。Tableau 就很流行、功能驚人,它有免費(fèi)的公共版和一個(gè)十分昂貴費(fèi)用的付費(fèi)版, 不過如果你是學(xué)生就可以享受到免費(fèi)版。它一般會在網(wǎng)上,或者論文上以靜態(tài)圖表形式發(fā)布,也可以傳送到Instagram上或者以墻圖輸出。在它的官網(wǎng)上可以找到很多模板,激發(fā)你的靈感。 遺憾地是,將要探討的另一個(gè)工具–Infoactive,可惜已經(jīng)下架了,但沒關(guān)系,Tableau吸收了Infoative所有優(yōu)點(diǎn)。這個(gè)意味著Tableau很有可能是未來公認(rèn)的好工具。我將牽頭一本免費(fèi)的書,它是Infoactive團(tuán)隊(duì)帶領(lǐng)下涉及數(shù)據(jù)可視化設(shè)計(jì)工具的背景資料,下面談?wù)摰娜魏喂ぞ? 數(shù)據(jù)+設(shè)計(jì)一個(gè)簡單有關(guān)準(zhǔn)備和可視化信息的說明介紹 簡單編碼如果要選擇一款獨(dú)立的程序語言來操作單機(jī)數(shù)據(jù),我會選擇R語言。因?yàn)镽語言是免費(fèi)的,且支持大量的在線開發(fā)加載有用的頂級基礎(chǔ)語言程序包,并且有大量的免費(fèi)資源學(xué)習(xí)如何運(yùn)用它。在這些資源中–我極力推薦Coursera課程: 數(shù)據(jù)科學(xué)家證書|課程約翰霍普金斯大學(xué)驗(yàn)證通過的數(shù)據(jù)科學(xué)專業(yè)化專家成為數(shù)據(jù)科學(xué)家自由談?wù)摗?/p> 它們可能會抹殺一個(gè)真正的初學(xué)者,但是課程能帶你走出一條重要數(shù)據(jù)科學(xué)項(xiàng)目和想法的路線,通過所有的方式探索數(shù)據(jù)分析(它涵蓋了有用的R包,例如ggplot,一個(gè)十分受歡迎的可視化工具)的交互性,通過Shiny和數(shù)據(jù)故事發(fā)布在網(wǎng)頁上。 R是我最常用來處理小型快速的分析和數(shù)據(jù)可視化工具–如果有一個(gè)數(shù)據(jù)(數(shù)據(jù)量大、不易于可視化)Excel處理不了,R最適合快速探索。 “是的,你可能要學(xué)些一些SQL”,另外一個(gè)快速入門的語言–SQL,與R相比(實(shí)際上,這已經(jīng)超出了蘋果和蘋果的比較),SQL是一門比較有針對性的語言: 如果你希望在數(shù)據(jù)庫中用任何工具或者語言集成數(shù)據(jù),這將是一個(gè)很好的機(jī)會讓你有學(xué)習(xí)SQL的興趣。 愛編碼通常,在網(wǎng)頁上看到一個(gè)美好的交互式可視化界面,都會浮現(xiàn)一個(gè)問題“我們要從何學(xué)起?”。我著迷于這個(gè)創(chuàng)新的領(lǐng)域(點(diǎn)擊這可以看更多深入的調(diào)查)。 不幸地是,如果你喜歡這些作品: 一個(gè)機(jī)器學(xué)習(xí)的可視化介紹讓我們重新審視73英尺高的邊界,提出了我們的建議,看看我們是怎樣地提高直覺。明顯地…… ……它可以令你沮喪的發(fā)現(xiàn)還有多少東西需要自己學(xué)習(xí)。反復(fù)的實(shí)踐以求得“《紐約時(shí)報(bào)》一樣好”是一個(gè)艱難的目標(biāo),值得但是困難。 幸運(yùn)的是,這里有很多幫助資源。 交互式的作品后面的邏輯庫,和很多在網(wǎng)頁上運(yùn)行的數(shù)據(jù)可視化作品都是Mike Bostock創(chuàng)作的D3.js。D3.js是一個(gè)很好的工具去學(xué)習(xí)作品網(wǎng)頁發(fā)布和交互式。 博斯托克(Bostock)的網(wǎng)站是一個(gè)有關(guān)金礦的例子和教程網(wǎng)站(你不需要筋疲力竭地從邏輯庫的創(chuàng)建者學(xué)起……)。 我也推薦Murry創(chuàng)建的網(wǎng)頁版交互式數(shù)據(jù)可視化,你可以從 O’Reilly 那購買或者網(wǎng)上在線免費(fèi)使用: 網(wǎng)頁交互式數(shù)據(jù)可視化這是一個(gè)關(guān)于非程序員的編程數(shù)據(jù)可視化的書。如果你是一個(gè)擁有視覺技能的藝術(shù)家或圖形設(shè)計(jì)師,但沒有從事數(shù)據(jù)或代碼工作的先驗(yàn)經(jīng)驗(yàn),這本書適合你。如果你是一個(gè)擁有大量數(shù)據(jù)的記者或研究人員,但沒有數(shù)據(jù)可視化或代碼的先驗(yàn)工作,這本書也適合你。 在線版本很好–你可以跟著書本本身編寫代碼腳本,運(yùn)行它并拿你的輸出結(jié)果和模板比較。Murray 還特別為初學(xué)者量身定制,這個(gè)網(wǎng)站能很好的引導(dǎo)初學(xué)者從HTML/CSS和Javascript基礎(chǔ)到深入學(xué)習(xí)相對難的D3。 D3的地理空間可視化是一個(gè)值得一提的長處。D3擅長創(chuàng)造很多不同效果的地圖,如果這是你的專業(yè)領(lǐng)域,這里可以獲得不錯的專用教程: 我以前讓地圖教程介紹了如何用D3和topojson做一個(gè)基本的地圖;現(xiàn)在是時(shí)候讓它覆蓋…… D3很難操作,但也有工具能降低難度,我建議使用最基礎(chǔ)的D3而不是復(fù)雜的繪圖程序,如果你人覺得棘手,那使用Plot.ly會更實(shí)際。 如果你要學(xué)萬能的程序語言,那Python是最適合。它功能強(qiáng)大目的性強(qiáng),很受歡迎。 我發(fā)現(xiàn)Python是一種極易上手且多用途的編程語言。但實(shí)際上,如果你要做的是探索和可視化數(shù)據(jù),它會讓你覺得吃力:例如Youtube就是用Python開發(fā)的……代碼有一百萬行。如果你想了解Python,Code Academy 課程是一個(gè)短且有趣的語言介紹。 最后,和前面介紹的D3.js , Javascript or ggplot ,R一樣, Python也有很多資料庫。最值得推薦的是,Seaborn(建立在一個(gè)年長受歡迎的庫,matplotlib)和Bokeh很有可能是一流的,但是這是一個(gè)快速發(fā)展和提升的領(lǐng)域。Seaborn and Bokeh 的網(wǎng)站包括畫廊展示你用這些工具創(chuàng)建的各種各樣的可視化作品。 ?。√嗵?!祝您愉快–如果你創(chuàng)造了一些有趣的東西,請聯(lián)系我:在Twitter上@uptownnickbrown或者發(fā)我的郵箱nick@quanticle.co 原文連接:Getting into data visualization?—?where should I start? 作者:Nick Brown 本文由Teradata挖掘顧問肖小花翻譯,轉(zhuǎn)載自36大數(shù)據(jù) |
|