英特爾公司副總裁兼人工智能產(chǎn)品事業(yè)部總經(jīng)理 Naveen Rao 表示:
Nervana NNP 已經(jīng)投入生產(chǎn)并交付 對于英特爾來說,Nervana NNP 是它在神經(jīng)網(wǎng)絡(luò)處理器方面的重要產(chǎn)品,可以說是第一款 AI 商用芯片,而且這款產(chǎn)品從發(fā)布、測試、量產(chǎn)到應(yīng)用,實(shí)際上是經(jīng)歷了一個(gè)漫長的產(chǎn)品周期。 新一代 Nervana NNP 首先亮相是在 2018 年 5 月。當(dāng)時(shí),在英特爾人工智能開發(fā)者大會(huì) (AIDevCon 2018) 上,Naveen Rao 發(fā)布了新一代專為機(jī)器學(xué)習(xí)設(shè)計(jì)的神經(jīng)網(wǎng)絡(luò)處理器(NNP)芯片,并表示這是英特爾第一款商業(yè) NNP 芯片,將不止是提供給小部分合作伙伴,將在 2019 年發(fā)貨。 到了 2019 年 8 月,英特爾在 Hot Chips 大會(huì)召開期間公布了 NNP 芯片的更多信息,其中,它依據(jù)用途分為 Nervana NNP-T 和 Nervana NNP-I,分別用于訓(xùn)練和推理。 Nervana NNP-T 代號 Spring Crest,采用了臺(tái)積電的 16nm FF+ 制程工藝,擁有 270 億個(gè)晶體管,硅片面積 680 平方毫米,能夠支持 TensorFlow、PaddlePaddle、PYTORCH 訓(xùn)練框架,也支持 C++ 深度學(xué)習(xí)軟件庫和編譯器 nGraph。 而 Nervana NNP-I,代號為 Spring Hill,是一款專門用于大型數(shù)據(jù)中心的推理芯片。這款芯片是基于 10nm 技術(shù)和 Ice Lake 內(nèi)核打造的,打造地點(diǎn)是以色列的 Haifa ,Intel 號稱它能夠利用最小的能量來處理高負(fù)載的工作,它在 ResNet50 的效率可達(dá) 4.8TOPs/W,功率范圍在 10W 到 50W 之間。 按照官方說法,英特爾 Nervana 神經(jīng)網(wǎng)絡(luò)訓(xùn)練處理器(Intel Nervana NNP-T)在計(jì)算、通信和內(nèi)存之間取得了平衡,不管是對于小規(guī)模群集,還是最大規(guī)模的 pod 超級計(jì)算機(jī),都可進(jìn)行近乎線性且極具能效的擴(kuò)展。英特爾 Nervana 神經(jīng)網(wǎng)絡(luò)推理處理器(Intel Nervana NNP-I)具備高能效和低成本,且其外形規(guī)格靈活,非常適合在實(shí)際規(guī)模下運(yùn)行高強(qiáng)度的多模式推理。這兩款產(chǎn)品面向百度、 Facebook 等前沿人工智能客戶,并針對他們的人工智能處理需求進(jìn)行了定制開發(fā)。 在 2019 英特爾人工智能峰會(huì)峰會(huì)現(xiàn)場,Intel 宣布——新推出的英特爾 Nervana 神經(jīng)網(wǎng)絡(luò)處理器(NNP)現(xiàn)已投入生產(chǎn)并完成客戶交付。其中,F(xiàn)acebook 人工智能系統(tǒng)協(xié)同設(shè)計(jì)總監(jiān) Misha Smelyanskiy表示:
另外,百度 AI 研究員 Kenneth Church 在現(xiàn)場表示,在今年 7 月,百度與英特爾合作宣布了雙方在 Nervana NNP-T 的合作,雙方通過硬件和軟件的合作來實(shí)現(xiàn)用最大的效率來訓(xùn)練日益增長的復(fù)雜模型。Kenneth Church 還宣布,在百度 X-Man 4.0 的加持下,英特爾的 NNP-T 已經(jīng)推向市場。 新一代 Movidius VPU 明年見 在峰會(huì)現(xiàn)場,Intel 公布了全新一代 Movidius VPU。 下一代英特爾 Movidius VPU 的代號是 Keem Bay,它是專門為邊緣 AI 打造的一款產(chǎn)品,專注于深度學(xué)習(xí)推理、計(jì)算機(jī)視覺和媒體處理等方面,采用全新的高效能架構(gòu),并且通過英特爾的 OpenVINO 來加速。按照官方數(shù)據(jù),它在速度上是英偉達(dá) TX2 的 4 倍,是華為海思 Ascend 310 的 1.25 倍。另外在功率和尺寸上,它也遠(yuǎn)遠(yuǎn)超過對手。 Intel 方面表示,新一代 Movidius 計(jì)劃于 2020 年上半年上市,它憑借獨(dú)一無二的高效架構(gòu)優(yōu)勢,能夠提供業(yè)界領(lǐng)先的性能:與上一代 VPU 相比,推理性能提升 10 倍以上,能效則可達(dá)到競品的 6 倍。 英特爾曾經(jīng)在 2017 年 8 月推出一款 Movidius Myriad X 視覺處理器(VPU),該處理器是一款低功耗 SoC,采用了 16nm 制造工藝,由臺(tái)積電來代工,的主要用于基于視覺的設(shè)備的深度學(xué)習(xí)和 AI 算法加速,比如無人機(jī)、智能相機(jī)、VR/AR 頭盔。 除了新一代 Movidius,英特爾還發(fā)布了全新的英特爾 DevCloud for the Edge,該產(chǎn)品旨在與英特爾 Distribution of OpenVINO 工具包共同解決開發(fā)人員的主要痛點(diǎn),即在購買硬件前,能夠在各類英特爾處理器上嘗試、部署原型和測試 AI 解決方案。 另外,英特爾還介紹了自家的英特爾至強(qiáng)可擴(kuò)展處理器在 AI 方面的進(jìn)展。 英特爾方面表示,推進(jìn)深度學(xué)習(xí)推理和應(yīng)用需要極其復(fù)雜的數(shù)據(jù)、模型和技術(shù),因此在架構(gòu)選擇上需要有不同的考量。事實(shí)上,業(yè)界大部分組織都基于英特爾至強(qiáng)可擴(kuò)展處理器部署了人工智能。英特爾將繼續(xù)通過英特爾矢量神經(jīng)網(wǎng)絡(luò)指令 (VNNI) 和英特爾深度學(xué)習(xí)加速技術(shù)(DL Boost)等功能來改進(jìn)該平臺(tái),從而在數(shù)據(jù)中心和邊緣部署中提升人工智能推理的性能。 英特爾強(qiáng)調(diào)稱,在未來很多年中,英特爾至強(qiáng)可擴(kuò)展處理器都將繼續(xù)成為強(qiáng)有力的人工智能計(jì)算支柱。 總結(jié) 在本次 2019 英特爾人工智能峰會(huì)上,Intel 還公布了其在 AI 方面的整體解決方案。實(shí)際上,英特爾在 AI 方面的優(yōu)勢不僅僅局限在 AI 芯片本身的突破,更重要的是,英特爾有能力全面考慮計(jì)算、內(nèi)存、存儲(chǔ)、互連、封裝和軟件,以最大限度提升效率和可編程性,并能確保將深度學(xué)習(xí)擴(kuò)展到數(shù)以千計(jì)節(jié)點(diǎn)的關(guān)鍵能力。 不僅如此,英特爾還能夠借重現(xiàn)有的市場優(yōu)勢將自家在 AI 領(lǐng)域的能力帶向市場,實(shí)現(xiàn) AI 的商用落地——值得一提的是,在峰會(huì)現(xiàn)場,英特爾宣布,自家的人工智能解決方案產(chǎn)品組合進(jìn)一步得到強(qiáng)化,并有望在 2019 年創(chuàng)造超過 35 億美元的營收。 可見,在推進(jìn) AI 技術(shù)走向商用落地方面,英特爾終于跨出了自信的一步。 |
|