編輯:西和西 校對排版:bin~bin 1.Apache Spark MLlib Apache Spark算得上是Hadoop大家族中一名眾所周知的成員了,但這套存儲器數(shù)據(jù)處理框架在誕生之初卻與Hadoop并無關(guān)系,它完全依靠著自身出色的特性在Hadoop生態(tài)系統(tǒng)的庇護之外闖出了屬于自己的一片天地。Spark目前已經(jīng)成為一款實時可用的機器學(xué)習(xí)工具,這主要歸功于其能高速地將算法庫應(yīng)用至存儲器內(nèi)的數(shù)據(jù)當(dāng)中。 目前Spark的發(fā)展并沒有停滯不前,其中的可用算法在持續(xù)增加與改進。近年發(fā)布的1.5版本增加了眾多新算法,并對現(xiàn)有的算法進行了針對性的改進,在MLlib中進一步支持Python。最新的1.6版本進一步通過持續(xù)流程來暫停與恢復(fù)了MLlib中的Spark ML任務(wù)。 2. Apache Singa Singa提供一套簡單的編程模式,通過一整套設(shè)備集群來訓(xùn)練深度學(xué)習(xí)網(wǎng)絡(luò),同時支持各種常見模型,如卷積神經(jīng)網(wǎng)絡(luò)( convolutional neural networks )、受限玻爾茲曼機( restricted Boltzmann machines )與遞歸神經(jīng)網(wǎng)絡(luò)( recurrent neural networks )。各模型能夠進行同步(串行)或者異步(并行)訓(xùn)練,具體取決于實際問題的需求。Singa還利用 Apache Zookeeper 對集群設(shè)置進行了簡化。 這套“深層學(xué)習(xí)”框架能夠支持多種高強度機器學(xué)習(xí)功能,包括自然語言處理與圖像識別。Singa開源框架致力于降低大規(guī)模數(shù)據(jù)的深層學(xué)習(xí)模型訓(xùn)練難度,被納入Apache孵化器項目。 3. Caffe Caffe誕生于2013年,主要用于機器視覺項目。它是一套“立足于表達、速度與模塊化”的深層學(xué)習(xí)框架。Caffe自出現(xiàn)后就一直將語音與多媒體等多種其他應(yīng)用逐漸融入自身。 由于優(yōu)先考慮速度需求,因此Caffe全部由C++編寫而成,同時支持CUDA加速機制。它還能夠根據(jù)需要,在CPU與GPU處理流程間來回切換。其發(fā)行版中包含一系列免費與開源參考模型,主要面向各類常見的典型任務(wù)。目前Caffe用戶社區(qū)也正在積極開發(fā)其他模型。 4. Microsoft Azure ML Studio 根據(jù)機器學(xué)習(xí)任務(wù)的實際數(shù)據(jù)規(guī)模與計算性能需求,云空間往往是機器學(xué)習(xí)應(yīng)用的一大理想運行環(huán)境。微軟公司已經(jīng)立足于Azure發(fā)布了其按需計費機器學(xué)習(xí)服務(wù),即Azure ML Studio,其能夠提供按月、按小時以及免費等各類版本。Azure ML Studio允許用戶創(chuàng)建并訓(xùn)練各類模型,而后將其轉(zhuǎn)化為能夠由其他服務(wù)消費的API。每個用戶賬戶能夠為模型數(shù)據(jù)提供最高10GB存儲容量,用戶也可以將自己的Azure存儲資源連接至服務(wù)當(dāng)中以承載規(guī)模更大的模型。目前可用算法已經(jīng)相當(dāng)可觀,其分別由微軟自身以及其他第三方所提供。大家甚至不需要賬戶即可體驗這項服務(wù),用戶可以匿名登錄并最多使用8小時Azure ML Studio。 ------------------------------------------------- 關(guān)注“哇特機器人”微信公眾號, 了解更多相關(guān)資訊, 共同發(fā)現(xiàn)好用的機器人! |
|