關(guān)于轉(zhuǎn)載授權(quán)
引言 藝術(shù)之美根植于其所傳達(dá)的信息。有時(shí)候,現(xiàn)實(shí)并非我們所看到或感知到的。達(dá)芬奇(Da Vinci)和畢加索(Picasso)等藝術(shù)家都通過(guò)其具有特定主題的非凡藝術(shù)品,試圖讓人們更加接近現(xiàn)實(shí)。 數(shù)據(jù)科學(xué)家并不遜色于藝術(shù)家。他們用數(shù)據(jù)可視化的方式繪畫,試圖展現(xiàn)數(shù)據(jù)內(nèi)隱藏的模式或表達(dá)對(duì)數(shù)據(jù)的見(jiàn)解。更有趣的是,一旦接觸到任何可視化的內(nèi)容、數(shù)據(jù)時(shí),人類會(huì)有更強(qiáng)烈的知覺(jué)、認(rèn)知和交流。 在數(shù)據(jù)科學(xué)中,有多種工具可以進(jìn)行可視化。在本文中,我展示了使用Python來(lái)實(shí)現(xiàn)的各種可視化圖表。
涉及到的東西并不多!Python已經(jīng)讓你很容易就能實(shí)現(xiàn)可視化——只需借助可視化的兩個(gè)專屬庫(kù)(libraries),俗稱matplotlib和seaborn。聽(tīng)說(shuō)過(guò)嗎? Matplotlib:基于Python的繪圖庫(kù)為matplotlib提供了完整的2D和有限3D圖形支持。這對(duì)在跨平臺(tái)互動(dòng)環(huán)境中發(fā)布高質(zhì)量圖片很有用。它也可用于動(dòng)畫。 Seaborn:Seaborn是一個(gè)Python中用于創(chuàng)建信息豐富和有吸引力的統(tǒng)計(jì)圖形庫(kù)。這個(gè)庫(kù)是基于matplotlib的。Seaborn提供多種功能,如內(nèi)置主題、調(diào)色板、函數(shù)和工具,來(lái)實(shí)現(xiàn)單因素、雙因素、線性回歸、數(shù)據(jù)矩陣、統(tǒng)計(jì)時(shí)間序列等的可視化,以讓我們來(lái)進(jìn)一步構(gòu)建復(fù)雜的可視化。
剛出版不久的《A comprehensive guide on Data Visualization》中,介紹了最常用的可視化技術(shù)。在進(jìn)一步深入學(xué)習(xí)前,如果你尚未閱讀此書(shū),我們建議你參考此書(shū)。 以下是Python代碼與其輸出結(jié)果。我就是用下面的數(shù)據(jù)集來(lái)創(chuàng)建這些可視化的。
你可以嘗試?yán)L制基于兩個(gè)變量的熱圖,如X軸為性別,Y軸為BMI,數(shù)據(jù)點(diǎn)為銷售值。
現(xiàn)在,你肯定已經(jīng)意識(shí)到了數(shù)據(jù)可視化的美妙,為什么不自己動(dòng)手試試呢?在以后的文章中,我們還將探討用Python實(shí)現(xiàn)地圖可視化和詞云。 大數(shù)據(jù)文摘也曾經(jīng)發(fā)布過(guò)用R進(jìn)行數(shù)據(jù)可視化的文章,《用R語(yǔ)言進(jìn)行數(shù)據(jù)可視化的綜合指南(一)》和《用R語(yǔ)言進(jìn)行數(shù)據(jù)可視化的綜合指南(二)》。大家可以參考一下,做個(gè)對(duì)比。 用R語(yǔ)言進(jìn)行數(shù)據(jù)可視化的綜合指南(一) 用R語(yǔ)言進(jìn)行數(shù)據(jù)可視化的綜合指南(二) |
|