目前開(kāi)源是技術(shù)創(chuàng)新和快速發(fā)展的核心。這篇文章向你展示了2016年20大Python機(jī)器學(xué)習(xí)開(kāi)源項(xiàng)目以及在分析過(guò)程中發(fā)現(xiàn)的非常有趣的見(jiàn)解和趨勢(shì)。 作者:Prasad Pore 繼續(xù)去年的分析:20大Python機(jī)器學(xué)習(xí)開(kāi)源項(xiàng)目,今年KDnuggets向您展示Github上最新的20大Python機(jī)器學(xué)習(xí)開(kāi)源項(xiàng)目。奇怪的是,一些去年最活躍的項(xiàng)目已經(jīng)變得停滯不前,而且也有一些從前20名中跌落了出來(lái)(考慮貢獻(xiàn)率和評(píng)論量),而13個(gè)新的項(xiàng)目進(jìn)入了前20名。
評(píng)論:21486,貢獻(xiàn)者:736,Github URL:Scikit-learn 2.Tensorflow最初由在Google機(jī)器智能研究組織中Google大腦團(tuán)隊(duì)的研究人員和工程師開(kāi)發(fā)出來(lái)的。設(shè)計(jì)該系統(tǒng)是為了促進(jìn)機(jī)器學(xué)習(xí)的研究并使其更加快速容易地從研究原型過(guò)渡到生產(chǎn)系統(tǒng)。 評(píng)論:10466,貢獻(xiàn)者:493,Github URL:Tensorflow 3.Theano允許您有效的定義,優(yōu)化和評(píng)估涉及多維數(shù)組的數(shù)學(xué)表達(dá)式。 評(píng)論:24108,貢獻(xiàn)者:263,Github URL:Theano 4.Caffe是一種由表達(dá)式,速度和模塊化思維構(gòu)成的深度學(xué)習(xí)框架。它是由伯克利想象力和學(xué)習(xí)中心(簡(jiǎn)稱BVLC)以及社會(huì)上的貢獻(xiàn)者共同開(kāi)發(fā)出來(lái)的。 評(píng)論:3801,貢獻(xiàn)者:215,Github URL:Caffe 5.Gensim是具有可擴(kuò)展統(tǒng)計(jì)語(yǔ)義,分析純文本文件的語(yǔ)義結(jié)構(gòu),檢索相似語(yǔ)義文件特征的一種免費(fèi)的Python庫(kù)。 評(píng)論:2702,貢獻(xiàn)者:145,Github URL:Gensim 6.Pylearn2是一種機(jī)器學(xué)習(xí)庫(kù)。它的大部分功能是建立在Theano的上層。這意味著,您可以使用數(shù)學(xué)表達(dá)式寫(xiě)Pylearn插件(新模型,算法等),而Theano會(huì)為您優(yōu)化和穩(wěn)定這些表達(dá)式,并且根據(jù)您選擇的后臺(tái)(CPU或GPU)編譯這些表達(dá)式。 評(píng)論:7100,貢獻(xiàn)者:115,Github URL:Pylearn2 7.Statsmodels是一個(gè)Python模塊,它允許用戶檢索數(shù)據(jù),評(píng)估統(tǒng)計(jì)模型,并進(jìn)行統(tǒng)計(jì)測(cè)試。一列廣泛的描述性統(tǒng)計(jì),統(tǒng)計(jì)測(cè)試,繪圖功能,以及結(jié)果統(tǒng)計(jì)列表就可用于不同類型的數(shù)據(jù)和估測(cè)對(duì)象。 評(píng)論:8664,貢獻(xiàn)者:108,Github URL:Statsmodels 8.Shogun是機(jī)器學(xué)習(xí)的工具箱,它能提供一個(gè)廣泛同一、高效的機(jī)器學(xué)習(xí)方法。這個(gè)工具箱輕松完美地實(shí)現(xiàn)多個(gè)數(shù)據(jù)表達(dá)式,算法類別以及通用工具的組合。 評(píng)論:15172,貢獻(xiàn)者:105,Github URL:Shogun 9.Chainer是一個(gè)基于Python深度學(xué)習(xí)模型的獨(dú)立開(kāi)源框架。Chainer提供一種靈活,直觀,高效的實(shí)現(xiàn)全方位深度學(xué)習(xí)模型的方法,包括最先進(jìn)的模型如周期性的神經(jīng)網(wǎng)絡(luò)和變化的自動(dòng)編碼器。 評(píng)論:6298,貢獻(xiàn)者:84,Github URL:Chainer 10.NuPIC是基于一種叫做分層時(shí)間記憶(HTM)新皮質(zhì)理論的開(kāi)源項(xiàng)目。部分HTM理論已經(jīng)在實(shí)際應(yīng)用中實(shí)施,測(cè)試和運(yùn)用了,而其他部分的HTM理論仍在開(kāi)發(fā)中。 評(píng)論:6088,貢獻(xiàn)者:76,Github URL:NuPIC 11.Neon是以Nervana's Python為基礎(chǔ)的深度學(xué)習(xí)庫(kù)。當(dāng)啟用最高性能時(shí)它提供易用性。 評(píng)論:875,貢獻(xiàn)者:47,Github URL:Neon 12.Nilearn是一種快速簡(jiǎn)單地對(duì)影像數(shù)據(jù)進(jìn)行統(tǒng)計(jì)學(xué)習(xí)的Python模塊。它利用了scikit-learn UPython工具箱的應(yīng)用如預(yù)測(cè)模型、多元統(tǒng)計(jì)分類,解碼,或連通性分析。 評(píng)論:5254,貢獻(xiàn)者:46,Github URL:Nilearn 13.Orange3是提供給新手和專家的開(kāi)源機(jī)器學(xué)習(xí)和數(shù)據(jù)可視化工具。具有大工具箱的交互式數(shù)據(jù)分析工作流程。 評(píng)論:6356,貢獻(xiàn)者:40,Github URL:Orange3 14.Pymc是是一個(gè)實(shí)現(xiàn)了貝葉斯統(tǒng)計(jì)模型和擬合算法的Python模塊,包括馬爾可夫和蒙特卡洛。它的靈活性和可擴(kuò)展性使它適用于一大系列的問(wèn)題。 評(píng)論:2701,貢獻(xiàn)者:37,Github URL:Pymc 15.pybrain是Python模塊化的機(jī)器學(xué)習(xí)庫(kù)。它的目標(biāo)是提供靈活便捷而又高效的機(jī)器學(xué)習(xí)任務(wù)算法,還有一系列預(yù)先定義的環(huán)境來(lái)測(cè)試和比較用戶算法。 評(píng)論:984,貢獻(xiàn)者:31,Github URL:pybrain 16.Fuel是一個(gè)數(shù)據(jù)管道框架,它能提供你所需要的數(shù)據(jù)的機(jī)器學(xué)習(xí)模型。Fuel計(jì)劃被用于Blocks和Pylearn2神經(jīng)網(wǎng)絡(luò)庫(kù)。 評(píng)論:1053,貢獻(xiàn)者:29,Github URL:Fuel 17.pymvpa是一個(gè)Python包,旨在緩解大數(shù)據(jù)集的統(tǒng)計(jì)學(xué)分析。它提供了一個(gè)可擴(kuò)展的框架,一個(gè)高層次的接口,廣泛的算法分類,回歸,特征選擇,數(shù)據(jù)導(dǎo)入和導(dǎo)出。 評(píng)論:9258,貢獻(xiàn)者:26,Github URL:pymvpa 18.Annoy(近似最鄰近)是一個(gè)C++庫(kù)的Python綁定搜索空間中的點(diǎn),是接近一個(gè)給定的查詢點(diǎn)。它還創(chuàng)造了基礎(chǔ),mmapped到內(nèi)存中,許多進(jìn)程可以共享相同的數(shù)據(jù)結(jié)構(gòu)大的只讀文件。 評(píng)論:365,貢獻(xiàn)者:24,Github URL:Annoy 19.Deap是一個(gè)新型的快速原型設(shè)計(jì)和測(cè)試思想的進(jìn)化計(jì)算框架。它旨在使算法顯式和數(shù)據(jù)結(jié)構(gòu)透明。它可以和類似于多進(jìn)程及SCOOP等并行化機(jī)制完美協(xié)同工作。 評(píng)論:1854,貢獻(xiàn)者:21,Github URL:Deap 20.Pattern是一個(gè)Python編程語(yǔ)言的Web挖掘模塊。它使用許多工具進(jìn)行數(shù)據(jù)挖掘(谷歌+維基百科+推特API,網(wǎng)絡(luò)爬蟲(chóng),HTML DOM解析器),自然語(yǔ)言處理(言語(yǔ)者部分n-gram搜索,情感分析,WordNet),機(jī)器學(xué)習(xí)(向量空間模型、k-均值聚類,貝葉斯+ k + SVM分類器)和網(wǎng)絡(luò)分析(圖的中心和可視化)。 評(píng)論:943,貢獻(xiàn)者:20,Github URL:Pattern 我們可以看到下面的圖,與列表中的所有項(xiàng)目對(duì)比pymvpa貢獻(xiàn)率最高。令人驚訝的是,scikit-learn的貢獻(xiàn)率低,盡管有著比其他項(xiàng)目多的貢獻(xiàn)者。原因可能是,PyMVPA是一個(gè)新的項(xiàng)目,通過(guò)早期階段的發(fā)展,由于新思想/發(fā)展特點(diǎn)、缺陷修復(fù)、重構(gòu)等導(dǎo)致有許多評(píng)論。而scikit-learn是舊的,穩(wěn)定的項(xiàng)目從而減少改善或缺陷的修復(fù)。
Happy Open Sourcing and Knowledge Sharing! Prasad Pore. 英文原文:http://www./2016/11/top-20-python-machine-learning-open-source-updated.html |
|