一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

【數(shù)據(jù)分析丨主題周】Python數(shù)據(jù)分析四劍客:IPython、Numpy、pandas、Matpl...

 CHOK2620 2018-03-21

Python作為一門優(yōu)秀的編程語言,近年來受到很多編程愛好者的青睞。

一是因?yàn)镻ython本身具有簡捷優(yōu)美、易學(xué)易用的特點(diǎn);二是由于互聯(lián)網(wǎng)的飛速發(fā)展,我們正迎來大數(shù)據(jù)的時代,而Python無論是在數(shù)據(jù)的采集與處理方面,還是在數(shù)據(jù)分析與可視化方面都有獨(dú)特的優(yōu)勢。我們可以利用Python便捷地開展與數(shù)據(jù)相關(guān)的項(xiàng)目,以很低的學(xué)習(xí)成本快速完成項(xiàng)目的研究。

Python被大量應(yīng)用在數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)領(lǐng)域,其中使用極其廣泛的是IPython、Numpy、pandas、Matplotlib等庫。對于希望使用Python來完成數(shù)據(jù)分析工作的人來說,學(xué)習(xí)IPython、Numpy、pandas、Matplotlib這個組合是目前看來不錯的方向。

  • IPython

(圖源:ipython.org)

IPython是Python的加強(qiáng)型交互式解釋器。

IPython是使用Python進(jìn)行數(shù)據(jù)分析、處理、呈現(xiàn)的重要選擇之一。它是一個與Python科學(xué)計(jì)算包(主要包括Numpy、pandas、Matplotlib等)緊密聯(lián)系的交互式開發(fā)環(huán)境,它同時也是Python科學(xué)計(jì)算包的一部分。

主要特點(diǎn)包括:

  • 提供給用戶一個強(qiáng)大的交互界面。

  • Jupter Notebook的內(nèi)核。

  • 高效的交互式處理、呈現(xiàn)數(shù)據(jù)(特別是與Matplotlib一起使用)。

  • 適合并行處理計(jì)算。

IPython加上一個文本編輯器是科學(xué)計(jì)算者使用Python進(jìn)行數(shù)據(jù)分析、處理、呈現(xiàn)的最佳選擇之一。

IPython主要包括:

  • 一個強(qiáng)大的、交互式的Python殼

  • Jupyter內(nèi)核,支持用戶在Jupyter Notebook以及其他終端與IPython的交互

IPyton殼

2017年最新發(fā)布的IPython殼以及內(nèi)核具有以下這些重要的特性:

  • 全面的對象檢查。

  • 記錄輸入歷史。

  • 緩存輸出結(jié)果。

  • 擴(kuò)展的<Tab>代碼補(bǔ)全功能,可以補(bǔ)全變量、關(guān)鍵字、文件名、函數(shù)名等。

  • 對系統(tǒng)“魔法”方法的擴(kuò)展,可以處理與操作系統(tǒng)相關(guān)的任務(wù)。

  • 豐富的配置系統(tǒng)支持不同狀態(tài)的切換。

  • 歷史信息登錄與重載。

  • 支持不同語法。

  • 輕松嵌入到其他Python程序中。

  • 對pdb調(diào)試器和Python測試工具的集成。

  • Numpy 

(圖源:numpy.org)

Numpy是Python科學(xué)計(jì)算庫的基礎(chǔ)。

主要包括:

  • 強(qiáng)大的N維數(shù)組對象和向量運(yùn)算

  • 一些復(fù)雜的功能

  • 與C/C 和Fortran代碼的集成

  • 實(shí)用的線形代數(shù)運(yùn)算、傅立葉變換、隨機(jī)數(shù)生產(chǎn)等

Numpy提供了一個簡潔的C語言接口,可以非常方便地使用C語言編寫的代碼操作Numpy數(shù)組對象,反過來使用C語言生成的數(shù)組也可以輕松的轉(zhuǎn)化成Numpy數(shù)組對象;這一特性使得Python輕松地與其他編程語言C/C 粘結(jié)在一起。Numpy除了用作科學(xué)計(jì)算,也可以用作多維度普通數(shù)據(jù)的容器;并且可以定義任何類型的數(shù)據(jù),使得Numpy高效、無縫地與各種類型的數(shù)據(jù)分析庫連接起來。

Numpy的主要對象是一個多維度的、均勻的多維數(shù)組。Numpy提供了各種函數(shù)方法可以非常方便靈活的操作數(shù)組,熟練掌握數(shù)組的基本概念是使用數(shù)組這種數(shù)據(jù)結(jié)構(gòu)的基本要求。

  • pandas

(圖源:pandas.pydata.org)

pandas是建立在Numpy基礎(chǔ)上的高效數(shù)據(jù)分析處理庫,是Python的重要數(shù)據(jù)分析庫。

pandas提供了眾多的高級函數(shù),極大地簡化了數(shù)據(jù)處理的流程,尤其是被廣泛地應(yīng)用于金融領(lǐng)域的數(shù)據(jù)分析。

pandas主要包括:

  • 帶有標(biāo)簽的數(shù)據(jù)結(jié)構(gòu),主要包括序列(Series)和數(shù)據(jù)框(DataFrame)等。

  • 允許簡單索引和多級索引。

  • 整合了對數(shù)據(jù)集的集合和轉(zhuǎn)換功能。

  • 生成特定類型的數(shù)據(jù)。

  • 支持從Excel、CSV等文本格式中文導(dǎo)入數(shù)據(jù),以Pytables/HDF5格式高效地讀/寫數(shù)據(jù)。

  • 能夠高效地處理帶有默認(rèn)值的數(shù)據(jù)集。

  • 能夠直接進(jìn)行常規(guī)的統(tǒng)計(jì)回歸分析。

  • Matplotlib

(圖源:matplotlib.org)

Matplotlib是一個主要用于繪制二維圖形的Python庫。

數(shù)據(jù)可視化是數(shù)據(jù)分析的重要環(huán)節(jié),借助圖形能夠幫助更加直觀地表達(dá)出數(shù)據(jù)背后的”東西”。

Matplolib最初主要模仿Matlab的畫圖命令,但是它是獨(dú)立于Matlab的,可以自由、免費(fèi)使用的繪圖包。Matplotlib依賴于之前介紹的Numpy庫來提供出色的繪圖能力。Matplotlib項(xiàng)目是John Hunter在2002年發(fā)起的,目標(biāo)是建立一個具備以下特點(diǎn)的Python繪圖工具包:

  • 能夠繪制出高質(zhì)量的圖形,并且圖形里面的鑲嵌的文本必需足夠美觀。

  • 能夠和Tex文檔一起輸出。

  • 能夠嵌入到GUI(圖形用戶界面)應(yīng)用程序中。

  • 代碼足夠簡潔并且可擴(kuò)展性強(qiáng)。

  • 繪圖命令足夠方便。

經(jīng)過社區(qū)多年以來的努力,Matplotlib已經(jīng)具備了上面列出的所有特點(diǎn)?,F(xiàn)在Matplotlib被廣泛地應(yīng)用于各種生產(chǎn)、科學(xué)研究等環(huán)境中,比如在網(wǎng)絡(luò)服務(wù)中動態(tài)生成圖形、在IPython殼下交互使用Matplotlib繪圖等。

Matplotlib從概念上可以分為三層:

matplotlib.pylab,這一層給主要給用戶提供一些簡單的命令來生成圖形,語法風(fēng)格和Matlab非常接近。Matplotlib的API,這一層主要給用戶提供了直接創(chuàng)建圖形、線條、文本等的功能。這是一個抽象層,它并不關(guān)心圖形的輸出。最后一層是后端,主要是管理圖形的輸出等其他一些功能。

如果你已經(jīng)決定學(xué)習(xí)Python數(shù)據(jù)分析,但是之前沒有編程經(jīng)驗(yàn),那《Python數(shù)據(jù)分析從入門到精通》你絕不能錯過。Python數(shù)據(jù)分析“四劍客”在本書上會進(jìn)行詳細(xì)深入的介紹。

本書詳細(xì)地介紹了IPython、Numpy、pandas、Matplotlib庫的組成與使用,為科學(xué)計(jì)算相關(guān)人員提供了有用的參考資料。采取循序漸進(jìn)的寫作風(fēng)格,對于工具的安裝、使用步驟、方法技巧逐步展開,加以圖解和應(yīng)用場景,即使完全不懂Python和數(shù)據(jù)分析的人員,也可以流暢地讀完本書。

無論哪種語言,編程的方法、模式、數(shù)據(jù)結(jié)構(gòu)、算法都是相通的。本書將科學(xué)計(jì)算、數(shù)據(jù)結(jié)構(gòu)與各種工具和方法完美結(jié)合,讓非Python讀者也能融會貫通,讓學(xué)習(xí)統(tǒng)計(jì)的人能找到更適合的統(tǒng)計(jì)方法和數(shù)據(jù)分析處理方法。

本書最后的兩個實(shí)戰(zhàn)案例適合數(shù)據(jù)分析入門者,案例的步驟詳細(xì)、分析到位,能為讀者入手真實(shí)項(xiàng)目打下良好的基礎(chǔ)。

進(jìn)入小程序參與抽獎,3月22日自動開獎。


本書目錄結(jié)構(gòu)


第1篇  Python數(shù)據(jù)分析語法入門

第1章  初識Python  1

  • 1.1  Python是什么  2

  • 1.2  Python有什么優(yōu)點(diǎn)  3

  • 1.3  其他程序設(shè)計(jì)語言中的Python  5

  • 1.4  快速搭建Python開發(fā)環(huán)境  7

  • 1.5  第一個Python程序  22

第2章  Python起步必備  27

  • 2.1  Python代碼的組織形式和注釋方式  27

  • 2.2  Python的基本輸入/輸出函數(shù)  31

  • 2.3  Python對中文的支持  33

  • 2.4  簡單實(shí)用的Python計(jì)算器  37

第3章  Python的數(shù)據(jù)類型與流程控制語句  41

  • 3.1  Python數(shù)據(jù)類型:數(shù)字  42

  • 3.2  Python數(shù)據(jù)類型:字符串  45

  • 3.3  Python數(shù)據(jù)類型:列表和元組  52

  • 3.4  Python數(shù)據(jù)類型:字典  54

  • 3.5  Python數(shù)據(jù)類型:文件  55

  • 3.6  Python數(shù)據(jù)類型:布爾值  56

  • 3.7  Python的流程控制語句  56

第4章  可復(fù)用的函數(shù)與模塊  64

  • 4.1  Python自定義函數(shù)  65

  • 4.2  參數(shù)讓函數(shù)更有價值  67

  • 4.3  變量的作用域  71

  • 4.4  最簡單的函數(shù):使用lambda表達(dá)式定義函數(shù)  72

  • 4.5  可重用結(jié)構(gòu):Python模塊  73

  • 4.6  用包來管理多個模塊  80

第5章  數(shù)據(jù)結(jié)構(gòu)與算法  82

  • 5.1  表、棧和隊(duì)列  82

  • 5.2  樹和圖  88

  • 5.3  查找與排序  95

第6章  面向?qū)ο蟮腜ython  101

  • 6.1  面向?qū)ο缶幊谈攀? 101

  • 6.2  在Python中定義和使用類  103

  • 6.3  類的屬性和方法  106

  • 6.4  類的繼承  111

  • 6.5  在類中重載方法和運(yùn)算符  114

  • 6.6  在模塊中定義類  117

第7章  異常處理與程序調(diào)試  120

  • 7.1  異常的處理  120

  • 7.2  用代碼引發(fā)異常  125

  • 7.3  使用pdb模塊調(diào)試Python腳本  128

  • 7.4  在PythonWin中調(diào)試腳本  134

第8章  pip軟件包管理  137

  • 8.1  安裝pip  137

  • 8.2  更新pip  138

  • 8.3  pip常用操作  138

  • 8.4  本章小結(jié)  141


第2篇  Python數(shù)據(jù)分析工具入門

第9章  IPython科學(xué)計(jì)算庫  142

  • 9.1  IPython簡介  143

  • 9.2  安裝IPython及其他相關(guān)庫  144

  • 9.3  IPython殼基礎(chǔ)  146

  • 9.4  融合Matplotlib庫和Pylab模型  156

  • 9.5  輸入和輸出變量  157

  • 9.6  交互式調(diào)試器  158

  • 9.7  計(jì)時功能  159

  • 9.8  重新載入模塊  160

  • 9.9  配置IPython  161

  • 9.10  Jupyter  162

  • 9.11  IPython和Jupyter Notebook的關(guān)系  170

第10章  Numpy科學(xué)計(jì)算庫  174

  • 10.1  Numpy基礎(chǔ)  174

  • 10.2  數(shù)組的基本操作  184

  • 10.3  基本的分片和索引操作  186

  • 10.4  高級索引  189

  • 10.5  改變數(shù)組的形狀  193

  • 10.6  組裝、分割數(shù)組  195

  • 10.7  數(shù)組的基本函數(shù)  196

  • 10.8  復(fù)制和指代  198

  • 10.9  線性代數(shù)  199

  • 10.10  使用數(shù)組來處理數(shù)據(jù)  201

  • 10.11  Numpy的where()函數(shù)和統(tǒng)計(jì)函數(shù)  203

  • 10.12  輸入與輸出  206

  • 10.13  生成隨機(jī)數(shù)  208

  • 10.14  數(shù)組的排序和查找  210

  • 10.15  擴(kuò)充轉(zhuǎn)換  213

第11章  pandas數(shù)據(jù)分析處理庫  216

  • 11.1  pandas數(shù)據(jù)結(jié)構(gòu)介紹  217

  • 11.2  索引對象  226

  • 11.3  核心的基本函數(shù)  227

  • 11.4  索引和旋轉(zhuǎn)  229

  • 11.5  算術(shù)運(yùn)算與對齊  232

  • 11.6  處理默認(rèn)值  233

  • 11.7  多級索引  237

  • 11.8  讀/寫數(shù)據(jù)  239

  • 11.9  組合數(shù)據(jù)  243

  • 11.10  數(shù)據(jù)分組操作  247

  • 11.11  時間序列  249

第12章  Matplotlib數(shù)據(jù)可視化  260

  • 12.1  Pyplot模塊介紹  261

  • 12.2  應(yīng)用Pyplot模塊  269

  • 12.3  Artist模塊  275

  • 12.4  使用pandas繪圖  283


第3篇  Python數(shù)據(jù)分析案例實(shí)戰(zhàn)

第13章  案例1:數(shù)據(jù)挖掘  288

  • 13.1  貝葉斯理論介紹  288

  • 13.2  貝葉斯分類器的實(shí)現(xiàn)  290

  • 13.3  協(xié)同過濾推薦系統(tǒng)  295

第14章  案例2:玩轉(zhuǎn)大數(shù)據(jù)  305

  • 14.1  案例概述  306

  • 14.2  日志文件的分割  309

  • 14.3  編寫Map()函數(shù)處理小文件  311

  • 14.4  編寫Reduce()函數(shù)  313



 

博文視點(diǎn)

您閱讀的專業(yè)智庫

喜歡請分享至朋友圈

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多

    午夜国产成人福利视频| 亚洲国产性感美女视频| 国产一区二区三区丝袜不卡| 午夜视频免费观看成人| 91在线爽的少妇嗷嗷叫| 国产熟女一区二区精品视频| 日韩人妻免费视频一专区| 91后入中出内射在线| 中文字幕欧美视频二区| 黑丝国产精品一区二区| 精品一区二区三区免费看| 日韩1区二区三区麻豆| 亚洲精品日韩欧美精品| 99久久精品一区二区国产| 中文字幕人妻日本一区二区| 男人的天堂的视频东京热| 国产美女精品午夜福利视频| 久久福利视频视频一区二区| 国产99久久精品果冻传媒| 老司机这里只有精品视频| 毛片在线观看免费日韩| a久久天堂国产毛片精品| 国内真实露脸偷拍视频| 欧美一区二区口爆吞精| 精品日韩av一区二区三区| 午夜福利国产精品不卡| 亚洲精品福利入口在线| 中文字幕日韩无套内射| 97人妻精品一区二区三区男同| 欧美性猛交内射老熟妇| 国产成人亚洲综合色就色| 日韩不卡一区二区三区色图| 日韩人妻有码一区二区| 欧美日韩一区二区午夜| 日韩成人中文字幕在线一区 | 中文字幕高清免费日韩视频| 一区二区日韩欧美精品| 国产亚洲欧美一区二区| 免费午夜福利不卡片在线 视频| 九九热精品视频免费在线播放| 国产一区二区在线免费|