Python中pandas是什么?Pandas是基于numpy的一種工具,該工具是為了解決數(shù)據(jù)分析任務(wù)而創(chuàng)建的。 Pandas納入了大量的庫(kù)和一些標(biāo)準(zhǔn)的數(shù)據(jù)模型,提供了高效地操作大型數(shù)據(jù)集所需的工具。Pandas提供了大量能使我們快速便捷地處理數(shù)據(jù)的函數(shù)和方法,你很快就會(huì)發(fā)現(xiàn),它是使Python成為強(qiáng)大而高效的數(shù)據(jù)分析環(huán)境的重要因素之一。 Pandas是Python的一個(gè)數(shù)據(jù)分析包,最初由AQR Capital Management于2008年4月開(kāi)發(fā),并于2009年底開(kāi)源出來(lái),目前由專(zhuān)注于Python數(shù)據(jù)包開(kāi)發(fā)的Pydata開(kāi)發(fā)team繼續(xù)開(kāi)發(fā)和維護(hù),屬于PyData項(xiàng)目的一部分,pandas最初被作為金融數(shù)據(jù)分析工具而開(kāi)發(fā)出來(lái),因此pandas為時(shí)間序列分析提供了很好的支持。 Pandas的名稱(chēng)來(lái)自于面板數(shù)據(jù)和python數(shù)據(jù)分析。panel data是經(jīng)濟(jì)學(xué)中關(guān)于多維數(shù)據(jù)集的一個(gè)術(shù)語(yǔ),在Pandas中也提供了panel的數(shù)據(jù)類(lèi)型。 Pandas數(shù)據(jù)結(jié)構(gòu): Series:一維數(shù)組,與numpy中的一維array類(lèi)似。二者與Python基本的數(shù)據(jù)結(jié)構(gòu)list相近,Series如今能保存不同種數(shù)據(jù)類(lèi)型,字符串、boolean值、數(shù)字等都能保存在series中。 Time-series:以時(shí)間為索引的series。 DataFrame:二維的表格型數(shù)據(jù)結(jié)構(gòu),很多功能與R中的data.frame類(lèi)似,可以將DataFrame理解為Series的容器。 Panel :三維的數(shù)組,可以理解為DataFrame的容器。 Panel4D:是像Panel一樣的4維數(shù)據(jù)容器。 PanelND:擁有factory集合,可以創(chuàng)建像Panel4D一樣N維命名容器的模塊。 |
|
來(lái)自: 老男孩IT教育 > 《Python培訓(xùn)》