人工智能是目前最熱門的科研領(lǐng)域之一。諸如IBM、谷歌、微軟、臉書和亞馬遜這類大型公司不僅加大了對旗下發(fā)展研究部門的資金投入,同時也開始并購一些在機器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、自然語言與圖像處理領(lǐng)域小有所成的初創(chuàng)公司。鑒于目前人工智能研究領(lǐng)域的火爆程度,斯坦福大學(xué)的教授們不久前作出了這樣一份報告:“人工智能軟件的作用越來越強大,而對人類社會、經(jīng)濟有強大影響力的人工智能軟件將于2030年前面世”。 國外網(wǎng)站Datamation今日整理了目前熱門的15款開源人工智能軟件: 1.Caffe
Caffe軟件由加州大學(xué)伯克利分校的一名博士生開發(fā),是一個基于表達構(gòu)架與可擴展編碼的深度學(xué)習(xí)框架。因其出色的處理速度而廣受研究人員與企業(yè)的喜愛。根據(jù)其主頁的介紹,只使用一顆NVIDIA K40 GPU,該軟件一天就可處理超過6000萬張圖片。Caffe軟件項目由BVLC運作,由NVIDIA和亞馬遜等公司資助其發(fā)展研究。 2.CNTK
CNTK是Computational Network Toolkit(計算網(wǎng)絡(luò)工具包)的縮寫,是微軟旗下開源人工智能軟件之一。它的過人之處在于:無論是只有CPU工作,還是單科GPU,或是或多顆GPU,亦或是多臺機器配備多顆GPU工作,它的性能都十分優(yōu)秀。雖然微軟主要用它進行語音識別的研究,但它還可以進行機器翻譯、圖像識別、圖像抓取、文本處理、語言識別與語言建模等工作。 3.Deeplearning4j
Deeplearning4j是一款JVM開源深度學(xué)習(xí)庫軟件。它能在分布式環(huán)境中運行,并整合Hadoop與Apache Spark。而這使得它可以配置深度神經(jīng)網(wǎng)絡(luò),還可運行Java、Scala等其他JVM語言。 Deeplearning4j軟件項目由Skymind商業(yè)公司運作,由Skymind負責項目的資金支持、人員培訓(xùn)與產(chǎn)品推廣。 4.DMTK
與CNTK一樣,DMTK是Distributed Machine Learning Toolkit的縮寫(分布式機器學(xué)習(xí)工具),是微軟旗下的另一款開源人工智能軟件。為大數(shù)據(jù)研究而設(shè)計,旨在縮短人工智能系統(tǒng)的訓(xùn)練時間。DMTK包括三大主要部分:DMTK框架、LightLDA模型算法與分布式(多感)字嵌入算法。為了說明DMTK的處理速度,微軟聲稱其可通過一臺8節(jié)點計算機集群,在有著超過1000億個標記的文檔合集中處理出一個包含100萬主題與1000萬文字(總計10萬億個參數(shù))的主題模型,而這是同類軟件無法匹敵的。 5.H2O
更專注于企業(yè)使用體驗而不是科學(xué)研究的H2O收獲了如Capital One、思科、Nielsen Catalina、PayPal和Transamerica等大型企業(yè)的訂單。Oxdata稱所有人都可使用H2O機器學(xué)習(xí)與預(yù)測分析能力解決商業(yè)問題。H2O還可用于預(yù)測建模、欺詐與風(fēng)險分析、保險分析、廣告工藝、醫(yī)療保健與客戶智能等方面。 H2O有兩個開源版本:標準版H2O和Sparkling Water版H2O,兩個版本都整合在Apache Spark中,Oxdata將為付費企業(yè)提供技術(shù)支持。 6.Mahout
Mahout 是 ASF(Apache軟件基金會)旗下的一個開源項目,提供開源機器學(xué)習(xí)框架。據(jù)其官方主頁描述,Mahout有三大主要特點:可擴展算法編程環(huán)境、事先寫有如Spark和H2O等工具的算法、內(nèi)置名為“Samsara”的矢量運算環(huán)境。Mahout用戶的包括Adobe、Accenture、Foursquare、英特爾、領(lǐng)英、Twitter和雅虎等公司。 7.MLlib
以處理速度而聞名的Apache Spark已成為大數(shù)據(jù)處理中最常用的軟件之一。MLlib算法是一個Spark的可擴展機器學(xué)習(xí)庫。它與Hadoop融為一體,可與NumPy和NumPy.R跨平臺操作。它囊括了大量機器學(xué)習(xí)算法類型,包括:分類、回歸、決策樹、建議、聚集、主題建模、特點轉(zhuǎn)換、模型評價、ML pipeline構(gòu)建、ML持久性、生存分析、頻繁集、序列模式挖掘、離散線性代數(shù)和數(shù)據(jù)統(tǒng)計分析。 8.NuPIC
NuPIC由Numenta公司運作,是一個基于HTM(分層時間記憶)理論的開源人工智能項目。實際上,HTM理論是想根據(jù)人大腦新皮質(zhì)結(jié)構(gòu)設(shè)計一個電腦系統(tǒng),旨在打造一臺“在處理認知型任務(wù)上,接近或超過人類能力的電腦?!?/p> Numenta不僅擁有NuPic的開放源代碼許可,還有其商業(yè)授權(quán)與專利證書。 9.OpenNN OpenNN是一款為研究人員和開發(fā)者打造的高級人工智能軟件,提供可運行神經(jīng)網(wǎng)絡(luò)的C++編程庫。其主要特點在于深度框架與高效的性能。OpenNN官網(wǎng)有關(guān)于神經(jīng)網(wǎng)絡(luò)運作的詳細介紹。為OpenNN客戶提供技術(shù)支持是來自西班牙的Artelnics公司(主攻預(yù)測分析研究)。 10.OpenCyc
由Cycorp公司開發(fā)的OpenCyc軟件內(nèi)置Cyc知識庫與常識推理引擎,含括了23.9萬條術(shù)語,約209.3萬條三元組,約6.9萬條網(wǎng)絡(luò)本體語言,就好比外接了一個語義數(shù)據(jù)庫。它在富領(lǐng)域建模、語義數(shù)據(jù)融合、文本理解、特定領(lǐng)域?qū)<蚁到y(tǒng)和游戲人工智能等方面十分有效。OpenCyc一共有兩個版本:一個是對研究員免費不開源版本,另一個是對企業(yè)收費的版本。 11.Oryx 2
Oryx 2基于Apache Spark和Kafka構(gòu)建,是一款專攻大型機器學(xué)習(xí)的發(fā)展框架軟件。它使用的是獨特的三層λ構(gòu)架。開發(fā)者可使用Oryx 2開發(fā)新軟件,其內(nèi)置了一些通用大型數(shù)據(jù)任務(wù)的程序,如協(xié)同過濾、分類、歸化和集群等。大數(shù)據(jù)工具提供商Cloudera開發(fā)了初代Oryx 1項目,現(xiàn)仍在繼續(xù)研究發(fā)展。 12.PredictionIO
早在今年二月份,Salesforce公司買下了PredictionIO軟件項目。PredictionIO軟件項目作為一個孵化項目為ASF提供了新的平臺和商標。雖然Salesforce公司通過PredictionIO軟件項目來發(fā)展自己的機器學(xué)習(xí)技術(shù),但其仍是開源。它可以利用機器學(xué)習(xí)來部署相關(guān)網(wǎng)絡(luò)服務(wù),通過對頁面動態(tài)請求實時回應(yīng)幫助用戶建立一個預(yù)測引擎。 13.SystemML
SystemML最初由IBM開發(fā),后被ASF收購,成為其大數(shù)據(jù)項目。SystemML是一個可高度擴展的平臺,可進行高級數(shù)學(xué)運算,執(zhí)行R或類Python語句。SystemML基于Spark或Hadoop運行,可用于4S店車輛維護的客戶回訪、機場領(lǐng)空管制以及銀行客戶社交媒體數(shù)據(jù)的收集。 14.TensorFlow
TensorFlow是谷歌旗下的開源人工智能軟件之一,提供一個使用數(shù)據(jù)流圖的數(shù)值計算庫,可在單/多顆CPU或GPU系統(tǒng)甚至移動設(shè)備上運行。谷歌稱TensorFlow十分靈活、真正的可移植,擁有自動鑒別能力且支持Python和C++平臺。 15.Torch
Torch這樣描述自己:“擁有科學(xué)的計算框架,支持可優(yōu)先使用GPU的機器學(xué)習(xí)算法”。Torch的特點在于其出色的靈活性與杰出的處理速度,在處理機器學(xué)習(xí)、計算機視覺、信號處理、并行處理、圖像、視頻、音頻和計算機網(wǎng)絡(luò)等方面十分得心應(yīng)手。它采用的是LuaJIT語言編寫,一種基于Lua語言的腳本語言。 來自:雷鋒網(wǎng) |
|