Python擁有眾多的第三方庫使我們可以方便地進行一些數(shù)據(jù)的可視化操作。目前很多庫的可視化應用都是建立在matplotlib的基礎(chǔ)上的。所以這里重點介紹matplotlib庫的基本使用方法。 基本操作 先看一個示例代碼來了解一張圖的組成部分,如下所示。 import numpy as np 運行輸出如圖所示。 下面進行簡要說明。
一般用到的就是pyplot,且按照慣例導入為plt。
這里就比較明確了,x、y是自變量和因變量數(shù)據(jù)。后面的'go'是對樣式的控制:其中g表示選擇綠色,o表示選擇點的方式顯示。更多參數(shù)設(shè)置可使用幫助命令help(plt.plot)進一步學習。
為圖添加一個標題。值得注意的是,這里使用了LaTeX的格式,因為matplotlib是兼容LaTeX的。這對書寫公式提供了極大的便利。讀者可能會遇到無法顯示中文的情況,這一點接下來會進行專門的講解。
通過show來展示圖像,在pandas和seaborn中也使用這句代碼進行圖像的展示操作。 這里只是創(chuàng)建了一個圖像,然后加了標題,還可以通過其他的設(shè)置使得圖表信息更加豐富,也更加美觀。 首先看一下增強版本的代碼,如下所示。 import numpy as np 運行輸出如圖所示。 下面進行簡要說明。
alpha參數(shù)代表透明度,從0到1表示顏色逐漸加深。
代表線條或者點的粗細程度。
按照(xmin、xmax、ymin、ymax)的格式來限制座標軸的范圍。
在plot里面使用lable,記錄了當前圖的圖例,可以通過調(diào)用legend使其顯示。在默認情況下,圖例會顯示在最合適的空白處,當然也可以手動調(diào)節(jié)其位置。
顯示背景網(wǎng)格線,也可以通過alpha參數(shù)設(shè)置其透明度。
在有些情況下,matplotlib自帶的顏色達不到效果,此時可以通過設(shè)置歸一化到[0,1]的RGB元組來指定顏色。也可以使用HTML的十六進制字符串,如'#eeefff'來指定顏色。 中文顯示問題 在初次使用matplotlib時一般都會遇到無法顯示中文的問題,無論是Windows還是Ubuntu之類的Linux系統(tǒng)。這里分別給出解決的辦法。 對于Windows,解決方法相對較為簡單,只需要在開頭處加上下面三行代碼,一般就可以了。 import matplotlib as mpl 對于Ubuntu系統(tǒng),需要手動指定字體來實現(xiàn)中文的顯示。 設(shè)置代碼如下。 import matplotlib.pyplot as plt 運行輸出如圖所示。
注意:這里表示字體的.ttc文件是從Windows系統(tǒng)中拷貝過來的,可以放到任意路徑,通過程序指定其路徑即可。當然讀者也可以從網(wǎng)上尋找其他永久設(shè)置的方法,由于大部分都比較煩瑣,這里就不展開介紹了。 matplotlib的進階使用 繪制子圖 下面介紹怎樣在一張圖上繪制多個子圖,代碼如下。 import numpy as np 運行輸出如圖所示。 下面進行簡要說明。
這里設(shè)置matplotlib的做圖的風格為ggplot(熟悉R語言的讀者可能對此并不陌生,因為ggplot2包具有強大的可視化功能)。除此之外還有很多種其他的風格,可以通過print(plt.style.available)查看。
這里subplot的參數(shù)221,應當分別解讀。22代表要繪制兩行兩列共四個子圖。1代表在第一位置做圖。這里的1可以看作(1,1),對應的2、3、4可以看作座標(1,2)、(2,1)、(2,2) 繪制填充圖 import numpy as np 運行輸出如圖所示。 以上內(nèi)容選自《Python數(shù)據(jù)分析入門——從數(shù)據(jù)獲取到可視化》。想要了解更多的數(shù)據(jù)分析技術(shù)及Python實現(xiàn)嗎?可以點擊 |
|