相信有不少朋友日常工作會用到 Excel 處理各式表格文件,更有甚者可能要花大把時間來做繁瑣耗時的表格整理工作。最近有朋友問可否編程來減輕表格整理工作量,今兒我們就通過實(shí)例來實(shí)現(xiàn) Python 對表格的自動化整理。 首先我們有這么一份數(shù)據(jù)表 source.csv: 我們要做的是從上表中提取數(shù)據(jù),來生成一份符合以下要求的表格:
我們先看手工 Excel 如何處理以上需求:要在 source.csv 數(shù)據(jù)表中讀取讀取每條數(shù)據(jù),放入 group.xls 匹配的分組成員中,最后篩選需要的數(shù)據(jù)項(xiàng),再對特定的 “數(shù)據(jù)K”進(jìn)行運(yùn)算處理。 那么 Python 又將如何操作呢?這里我們要用到功能強(qiáng)大的 pandas 庫。 pandas 是基于NumPy 的一種工具,該工具是為了解決數(shù)據(jù)分析任務(wù)而創(chuàng)建的。Pandas 納入了大量庫和一些標(biāo)準(zhǔn)的數(shù)據(jù)模型,提供了高效地操作大型數(shù)據(jù)集所需的工具。pandas提供了大量能使我們快速便捷地處理數(shù)據(jù)的函數(shù)和方法。你很快就會發(fā)現(xiàn),它是使Python成為強(qiáng)大而高效的數(shù)據(jù)分析環(huán)境的重要因素之一。 pandas 百度百科 首先導(dǎo)入 pandas 庫,通過相關(guān)的函數(shù)讀取 csv 和 xls 表格內(nèi)容: 我們可以首先對 source.csv 中的數(shù)據(jù)項(xiàng)進(jìn)行篩選,需要的數(shù)據(jù)項(xiàng)有“角色”、“編號”、“數(shù)據(jù)B”、“數(shù)據(jù)C”、“數(shù)據(jù)D”和“數(shù)據(jù)K”: 接下來是根據(jù)分組角色來匹配角色數(shù)據(jù),注意到 group.xls 和 source.csv 共有“角色”一項(xiàng),我們可以通過此項(xiàng)將兩個表格融合從而形成匹配填充的效果。 combine = pd.merge(group,filter_merge,on='角色') 接下來我們在第二列插入運(yùn)算后的“數(shù)據(jù)K/60”:
最終,我們將生成的數(shù)據(jù)格式寫入新的 xlsx 表格中: combine.to_excel(excel_writer='result.xlsx',index=False) 最終自動生成的表格如下: 以上便是 Excel 表格整理的 Python 代碼簡單實(shí)現(xiàn),在操作過程中也遇到幾個問題貼在這里供大家參考:
源代碼:https://pan.baidu.com/s/1ro4lUaRtRb86Lf49LSjRBA |
|