zarten,互聯(lián)網(wǎng)一線工作者。 博客地址:zhihu.com/people/zarten 概述 這篇將介紹Series和DataFrame公有的一些重要的基礎(chǔ)功能知識點(diǎn)。 重新索引排列 重新索引排列是指:可以將索引重新排列,若給出的新索引在舊索引中不存在時(shí),會(huì)引入缺失值NaN。 重新索引排列不會(huì)改變原來的對象,而是會(huì)生成一個(gè)重新排列索引的對象。 使用Series和DataFrame的 Series import pandas as pd 有時(shí)重新排列時(shí),若新增一個(gè)之前沒有的索引時(shí)值會(huì)自動(dòng)填充 同時(shí)也可以使用參數(shù) DataFrame DataFrame也是一樣的,若不指定,默認(rèn)是重新排列行,若指定列,也可重新排序列。
若需要重新排序列,只需指定參數(shù) 刪除指定索引 刪除指定的一個(gè)或多個(gè)索引及其對應(yīng)的值,使用 刪除多個(gè)索引時(shí)傳入一個(gè)列表 注意:若指定的索引不存在時(shí),會(huì)報(bào)錯(cuò) Series import pandas as pd 上面使用drop后都會(huì)產(chǎn)生一個(gè)新的對象,不會(huì)改變原對象。若想直接在原對象上進(jìn)行刪除,可以使用參數(shù) DataFrame 同樣,默認(rèn)是刪除行,若要?jiǎng)h除列索引及值,使用axis參數(shù),axis默認(rèn)為0代表行,1代表列
相同數(shù)據(jù)結(jié)構(gòu)間的算術(shù)運(yùn)算 相同的數(shù)據(jù)結(jié)構(gòu)(Series和DataFrame)間的算術(shù)運(yùn)算,跟并集的思想類似,也就是沒有對應(yīng)的索引時(shí),會(huì)自動(dòng)填充NaN Series import pandas as pd 若想填充自己指定的值時(shí),可以使用add方法,參數(shù)
DataFrame DataFrame數(shù)據(jù)結(jié)構(gòu)算術(shù)運(yùn)算時(shí)就比較刁鉆了,必須是行和列索引都相同時(shí)才能相加,若有一個(gè)不同就是NaN import pandas as pd 還有其他的一些算術(shù)運(yùn)算如下圖,這里將不再闡述,大同小異 Series與DataFrame之間的運(yùn)算 這兩者間的運(yùn)算會(huì)廣播到所有元素。 若互相都沒有相同的索引時(shí),同樣會(huì)產(chǎn)生NaN
從上圖可以看到,DataFrame每一行都減去了Series。 更多的操作可以詳細(xì)閱讀官方文檔。 排序 索引排序:行或列索引排序,使用sort_index()函數(shù),默認(rèn)是行索引排序,且默認(rèn)是升序 值排序:也可對值排序,使用函數(shù)sort_values()函數(shù) Series import pandas as pd 索引排序: 值排序: DataFrame
索引排序: 由上圖可看到,默認(rèn)為行索引排序,若需要列索引排序,只需指定 值排序:由于DataFrame是行和列組成,值排序是列的由上到下的排序,可指定一列或多列,通過 也可以進(jìn)行多列排序,只需傳入?yún)?shù) 統(tǒng)計(jì) 下面將介紹一些常用的統(tǒng)計(jì)方法 求和 使用函數(shù) Series import pandas as pd DataFrame
由上圖可看到,求和默認(rèn)是每列求和,若需要每行求和,可使用參數(shù) 還有其他參數(shù),如:若存在NaN時(shí),默認(rèn)結(jié)果會(huì)剔除NaN,可通過參數(shù) 其他參數(shù)如下圖所示: 其他統(tǒng)計(jì)方法 比如比較常用的 import pandas as pd 由上圖看到,結(jié)果有多項(xiàng),都是針對列而言,具體含義如下:
其他統(tǒng)計(jì)函數(shù)如下所示: 第三方庫統(tǒng)計(jì)工具 第三方庫:pandas-profiling 官方地址: https://github.com/pandas-profiling/pandas-profiling Python中文社區(qū)作為一個(gè)去中心化的全球技術(shù)社區(qū),以成為全球20萬Python中文開發(fā)者的精神部落為愿景,目前覆蓋各大主流媒體和協(xié)作平臺,與阿里、騰訊、百度、微軟、亞馬遜、開源中國、CSDN等業(yè)界知名公司和技術(shù)社區(qū)建立了廣泛的聯(lián)系,擁有來自十多個(gè)國家和地區(qū)數(shù)萬名登記會(huì)員,會(huì)員來自以工信部、清華大學(xué)、北京大學(xué)、北京郵電大學(xué)、中國人民銀行、中科院、中金、華為、BAT、谷歌、微軟等為代表的政府機(jī)關(guān)、科研單位、金融機(jī)構(gòu)以及海內(nèi)外知名公司,全平臺近20萬開發(fā)者關(guān)注。 |
|