一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

收藏! 38個Python數(shù)據(jù)科學(xué)頂級庫

 伊伊爸 2022-08-06 發(fā)布于湖北
這篇文章中包括的類別,我們認(rèn)為這些類別考慮了通用的數(shù)據(jù)科學(xué)庫,即那些可能被數(shù)據(jù)科學(xué)領(lǐng)域的從業(yè)人員用于廣義的,非神經(jīng)網(wǎng)絡(luò)的,非研究性工作的庫:
  • 數(shù)據(jù)-用于數(shù)據(jù)管理,處理和其他處理的庫
  • 數(shù)學(xué)-雖然許多庫都執(zhí)行數(shù)學(xué)任務(wù),但這個小型庫卻專門這樣做
  • 機器學(xué)習(xí)-自我解釋;不包括主要用于構(gòu)建神經(jīng)網(wǎng)絡(luò)或用于自動化機器學(xué)習(xí)過程的庫
  • 自動化機器學(xué)習(xí)-主要用于自動執(zhí)行與機器學(xué)習(xí)相關(guān)的過程的庫
  • 數(shù)據(jù)可視化-與建模,預(yù)處理等相反,主要提供與數(shù)據(jù)可視化相關(guān)的功能的庫。
  • 解釋與探索-主要用于探索和解釋模型或數(shù)據(jù)的庫

請注意,以下按類型表示了每個庫,并按星級和貢獻(xiàn)者對其進(jìn)行了繪制,其符號大小反映了該庫在Github上的相對提交次數(shù)。

圖片

圖1:用于數(shù)據(jù)科學(xué),數(shù)據(jù)可視化和機器學(xué)習(xí)的頂級Python庫,按星級和貢獻(xiàn)者數(shù)繪制;相對大小按貢獻(xiàn)者數(shù)量

數(shù)據(jù)

1. Apache Spark
https://github.com/apache/spark
star:27600,貢獻(xiàn):28197,貢獻(xiàn)者:1638

Apache Spark-用于大規(guī)模數(shù)據(jù)處理的統(tǒng)一分析引擎

2.Pandas
https://github.com/pandas-dev/pandas
star:26800,貢獻(xiàn):24300,貢獻(xiàn)者:2126

Pandas是一個Python軟件包,提供了快速,靈活和可表達(dá)的數(shù)據(jù)結(jié)構(gòu),旨在使使用“關(guān)系”或“標(biāo)記”數(shù)據(jù)既簡單又直觀。它旨在成為在Python中進(jìn)行實用,真實世界數(shù)據(jù)分析的基本高級構(gòu)建塊。

3.Dask
https://github.com/dask/dask
star:7300,貢獻(xiàn):6149,貢獻(xiàn)者:393

任務(wù)調(diào)度的并行計算

數(shù)學(xué)

4. Scipy
https://github.com/scipy/scipy
star:7500,貢獻(xiàn):24247,貢獻(xiàn)者:914

SciPy發(fā)音為“ Sigh Pie”是用于數(shù)學(xué),科學(xué)和工程的開源軟件。它包括用于統(tǒng)計,優(yōu)化,積分,線性代數(shù),傅立葉變換,信號和圖像處理,ODE求解器等的模塊。

5. Numpy
https://github.com/numpy/numpy
star:1500,貢獻(xiàn):24266,提供者:1010

使用Python進(jìn)行科學(xué)計算的基本軟件包。

機器學(xué)習(xí)

6. Scikit-Learn
https://github.com/scikit-learn/scikit-learn
star:42500,貢獻(xiàn):26162,貢獻(xiàn)者:1881

Scikit-learn是一個基于SciPy的Python機器學(xué)習(xí)模塊,并以3條款BSD許可分發(fā)。

7. XGBoost
https://github.com/dmlc/xgboost
star:19900,貢獻(xiàn):5015,貢獻(xiàn)者:461

適用于Python,R,Java,Scala,C ++等的可擴展,便攜式和分布式梯度增強GBDT,GBRT或GBM庫。在單機,Hadoop,Spark,F(xiàn)link和DataFlow上運行

8. LightGBM
https://github.com/microsoft/LightGBM
star:11600,貢獻(xiàn):2066,貢獻(xiàn)者:172

基于決策樹算法的快速,分布式,高性能梯度提升GBT,GBDT,GBRT,GBM或MART框架,用于排名,分類和許多其他機器學(xué)習(xí)任務(wù)。

9.Catboost
https://github.com/catboost/catboost
star:5400,貢獻(xiàn):12936,貢獻(xiàn)者:188

快速,可擴展,高性能的“決策樹上的梯度提升”庫,用于對Python,R,Java,C ++進(jìn)行排名,分類,回歸和其他機器學(xué)習(xí)任務(wù)。支持在CPU和GPU上進(jìn)行計算。

10. Dlib
https://github.com/davisking/dlib
star:9500,貢獻(xiàn):7868,貢獻(xiàn)者:146

Dlib是一個現(xiàn)代的C ++工具箱,其中包含機器學(xué)習(xí)算法和工具,這些工具和工具可以用C ++創(chuàng)建復(fù)雜的軟件來解決實際問題??梢酝ㄟ^dlib API與Python一起使用

11.Annoy
https://github.com/spotify/annoy
star:7700,貢獻(xiàn):778,貢獻(xiàn)者:53

C ++ / Python中的近似最近鄰居已針對內(nèi)存使用情況以及加載/保存到磁盤進(jìn)行了優(yōu)化

12.H20ai
https://github.com/h2oai/h2o-3
star:500,貢獻(xiàn)貢獻(xiàn):27894,貢獻(xiàn)者:137

適用于更智能應(yīng)用的開源快速可擴展機器學(xué)習(xí)平臺:深度學(xué)習(xí),梯度提升和XGBoost,隨機森林,廣義線性建模邏輯回歸,彈性網(wǎng),K均值,PCA,堆疊集成,自動機器學(xué)習(xí)AutoML等。

13. StatsModels
https://github.com/statsmodels/statsmodels star:5600,承諾:13446,貢獻(xiàn)者:247

Statsmodels:Python中的統(tǒng)計建模和計量經(jīng)濟學(xué)

14. mlpack
https://github.com/mlpack/mlpack
star:3400,貢獻(xiàn):24575,貢獻(xiàn)者:190

mlpack是一個直觀,快速且靈活的C ++機器學(xué)習(xí)庫,具有與其他語言的綁定

15.Pattern
https://github.com/clips/pattern
star:7600,貢獻(xiàn):1434,貢獻(xiàn)者:20

用于Python的Web挖掘模塊,具有用于抓取,自然語言處理,機器學(xué)習(xí),網(wǎng)絡(luò)分析和可視化的工具。

16.Prophet
https://github.com/facebook/prophet
star:11500,貢獻(xiàn):595,貢獻(xiàn)者:106

用于為具有多個季節(jié)性且線性或非線性增長的時間序列數(shù)據(jù)生成高質(zhì)量預(yù)測的工具。

自動化機器學(xué)習(xí)

17. TPOT
https://github.com/EpistasisLab/tpot
star:7500,貢獻(xiàn):2282,貢獻(xiàn)者:66

一個Python自動化機器學(xué)習(xí)工具,可使用遺傳編程來優(yōu)化機器學(xué)習(xí)pipeline。

18. auto-sklearnhttps://github.com/automl/auto-sklearn
star:4100,貢獻(xiàn):2343,貢獻(xiàn)者:52

auto-sklearn是一種自動化的機器學(xué)習(xí)工具包,是scikit-learn估計器的直接替代品。

19. Hyperopt-sklearn
https://github.com/hyperopt/hyperopt-sklearn
star:1100,貢獻(xiàn):188,貢獻(xiàn)者:18

Hyperopt-sklearn是scikit-learn中機器學(xué)習(xí)算法中基于Hyperopt的模型選擇。

20. SMAC-3
https://github.com/automl/SMAC3
star:529,貢獻(xiàn):1882,貢獻(xiàn)者:29

基于順序模型的算法配置

21. scikit-optimizehttps://github.com/scikit-optimize/scikit-optimize
star:1900,貢獻(xiàn):1540,貢獻(xiàn)者:59

Scikit-Optimize或skopt是一個簡單高效的庫,可最大限度地減少非常昂貴且嘈雜的黑盒功能。它實現(xiàn)了幾種基于順序模型優(yōu)化的方法。

22. Nevergrad
https://github.com/facebookresearch/nevergrad
star:2700,貢獻(xiàn):663,貢獻(xiàn)者:38

用于執(zhí)行無梯度優(yōu)化的Python工具箱

23.Optuna
https://github.com/optuna/optuna
star:3500,貢獻(xiàn):7749,貢獻(xiàn)者:97

Optuna是一個自動超參數(shù)優(yōu)化軟件框架,專門為機器學(xué)習(xí)而設(shè)計。

數(shù)據(jù)可視化

24. Apache Superset
https://github.com/apache/incubator-superset
star:30300,貢獻(xiàn):5833,貢獻(xiàn)者:492

Apache Superset是一個數(shù)據(jù)可視化和數(shù)據(jù)探索平臺

25. Matplotlib
https://github.com/matplotlib/matplotlib
star:12300,貢獻(xiàn):36716,貢獻(xiàn)者:1002

Matplotlib是一個綜合庫,用于在Python中創(chuàng)建靜態(tài),動畫和交互式可視化。

26.Plotly
https://github.com/plotly/plotly.py
star:7900,貢獻(xiàn):4604,貢獻(xiàn)者:137

Plotly.py是適用于Python的交互式,基于開源和基于瀏覽器的圖形庫

27. Seaborn
https://github.com/mwaskom/seaborn
star:7700,貢獻(xiàn):2702,貢獻(xiàn)者:126

Seaborn是基于matplotlib的Python可視化庫。它提供了用于繪制吸引人的統(tǒng)計圖形的高級界面。

28.folium
https://github.com/python-visualization/folium
star:4900,貢獻(xiàn):1443,貢獻(xiàn)者:109

Folium建立在Python生態(tài)系統(tǒng)的數(shù)據(jù)處理能力和Leaflet.js庫的映射能力之上。用Python處理數(shù)據(jù),然后通過folium在可視化的Leaflet貼圖中顯示。

29. Bqplot
https://github.com/bqplot/bqplot
star:2900,貢獻(xiàn):3178,貢獻(xiàn)者:45

Bqplot是Jupyter的二維可視化系統(tǒng),基于圖形語法的構(gòu)造。

30. VisPy
https://github.com/vispy/vispy
star:2500,貢獻(xiàn):6352,貢獻(xiàn)者:117

VisPy是一個高性能的交互式2D / 3D數(shù)據(jù)可視化庫。VisPy通過OpenGL庫利用現(xiàn)代圖形處理單元GPU的計算能力來顯示非常大的數(shù)據(jù)集。

31. PyQtgraph
https://github.com/pyqtgraph/pyqtgraph
star:2200,貢獻(xiàn):2200,貢獻(xiàn)者:142

用于科學(xué)/工程應(yīng)用的快速數(shù)據(jù)可視化和GUI工具

32.Bokeh
https://github.com/bokeh/bokeh
star:1400,貢獻(xiàn):18726,貢獻(xiàn)者:467

Bokeh是用于現(xiàn)代Web瀏覽器的交互式可視化庫。它提供通用圖形的優(yōu)雅,簡潔的構(gòu)造,并在大型或流數(shù)據(jù)集上提供高性能的交互性。

33.Altair
https://github.com/altair-viz/altair
star:600,貢獻(xiàn):3031,貢獻(xiàn)者:106

Altair是用于Python的聲明性統(tǒng)計可視化庫。使用Altair,您可以花費更多時間來理解數(shù)據(jù)及其含義。

解釋與探索

34. eli5https://github.com/TeamHG-Memex/eli5
star:2200,貢獻(xiàn)貢獻(xiàn):1198,貢獻(xiàn)者:15

一個用于調(diào)試/檢查機器學(xué)習(xí)分類器并解釋其預(yù)測的庫

35. LIMEh
ttps://github.com/marcotcr/lime star:800,承諾:501,貢獻(xiàn)者:41

Lime:解釋任何機器學(xué)習(xí)分類器的預(yù)測

36. SHAP
https://github.com/slundberg/shap
star:10400,貢獻(xiàn):1376,貢獻(xiàn)者:96

一種博弈論方法,用于解釋任何機器學(xué)習(xí)模型的輸出。

37. YellowBrick
https://github.com/DistrictDataLabs/yellowbrick
star:300,貢獻(xiàn):825,貢獻(xiàn)者:92

可視化分析和診斷工具,有助于機器學(xué)習(xí)模型的選擇。

38.pandas-profiling
https://github.com/pandas-profiling/pandas-profiling
star:6200名,貢獻(xiàn):704名,貢獻(xiàn)者:47名

從pandas DataFrame對象創(chuàng)建HTML分析報告

作者:Python在線社區(qū);

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多

    激情亚洲内射一区二区三区| 国产高清视频一区不卡| 午夜小视频成人免费看| 爱草草在线观看免费视频| 日本婷婷色大香蕉视频在线观看| 中文字幕亚洲精品乱码加勒比| 日本婷婷色大香蕉视频在线观看 | 国产欧美精品对白性色| 东北女人的逼操的舒服吗| 欧美日韩国产另类一区二区| 最新午夜福利视频偷拍| 亚洲国产成人精品福利| 日本最新不卡免费一区二区| 欧美胖熟妇一区二区三区| 亚洲熟女国产熟女二区三区| 亚洲永久一区二区三区在线| 亚洲天堂精品1024| 日韩在线免费看中文字幕| 日本道播放一区二区三区| 91香蕉国产观看免费人人| 中文字幕乱码免费人妻av| 黑色丝袜脚足国产一区二区| 亚洲熟女乱色一区二区三区| 国产盗摄精品一区二区视频| 亚洲欧美天堂精品在线| 91精品国产av一区二区| 自拍偷拍一区二区三区| 欧美日韩国产一级91| 天堂av一区一区一区| 国产精品香蕉免费手机视频| 欧美成人欧美一级乱黄| 日本一本不卡免费视频| 国产韩国日本精品视频| 国产欧美日韩不卡在线视频| 黄色激情视频中文字幕| 日韩欧美中文字幕人妻| 国产欧美日韩一级小黄片| 免费啪视频免费欧美亚洲| 久久偷拍视频免费观看| 久久精品蜜桃一区二区av| 欧美区一区二在线播放|