最近收到一個(gè)求助郵件,他的需求如下:
這個(gè)問(wèn)題其實(shí)比較簡(jiǎn)單,做出來(lái)的最終形式如下: 主要涉及格式轉(zhuǎn)換和分組統(tǒng)計(jì)的需求,那么我們就開(kāi)始一步一步的完成這一次的任務(wù)。 import pandas as pd file_name = r'學(xué)生信息表.xlsx' data = pd.read_excel(file_name) data
import datetime as dt now = dt.datetime.today().year data['周歲'] = now - data['出生日期'].dt.year 新加周歲列 4、對(duì)周歲、性別同時(shí)分組 熟悉教程的小伙伴知道,這一期的分組內(nèi)容其實(shí)可以用pandas的透視表pivot_table函數(shù)解決。 這次我們就用另一種方法:groupby函數(shù)同樣能搞定。
輸出: 周歲,性別分組結(jié)果 age_single = data.groupby(['周歲']) age_single_group = age_single.agg({'學(xué)生姓名':'count'}).T age_single_group.index = ['合計(jì)']
age_union = pd.concat([age_single_group,age_single_female_group],join='outer') age_union.fillna(0) 這樣就完成了年級(jí)的分組統(tǒng)計(jì),其他的按年級(jí)分組,或者地區(qū)分組也是類(lèi)似的。是不是一步步寫(xiě)過(guò)來(lái)感覺(jué)pandas特別好用,特別簡(jiǎn)單。 |
|