最近和很多朋友在聊智算中心的建設(shè)方案,經(jīng)常會拿“智算中心”和傳統(tǒng)的數(shù)據(jù)中心、超算中心進(jìn)行比較,很多非相關(guān)領(lǐng)域的朋友很難分清楚這三者的區(qū)別和聯(lián)系,今天我們從不同的維度和大家分析一下它們各自的特點(diǎn)。 一、“數(shù)據(jù)中心”建設(shè)是體系化工程 “智算中心”作為最近兩年興起的新生事物,可以理解為是由傳統(tǒng)“數(shù)據(jù)中心”演變而來,從本質(zhì)上講并沒有太大區(qū)別,只因?yàn)槌休d的業(yè)務(wù)重心轉(zhuǎn)為了人工智能的訓(xùn)練、推理等,因此命名為“智算中心”,介紹三類數(shù)據(jù)中心區(qū)別之前我們先從系統(tǒng)層面了解一下傳統(tǒng)“數(shù)據(jù)中心”建設(shè)的組成。 1、L0層為土建工程:傳統(tǒng)數(shù)據(jù)中心和智算中心的區(qū)別很小,因?yàn)橹撬憬ㄔO(shè)算力密度提升,往往需要對地面的的承重有所增加,在建設(shè)成本和規(guī)劃上沒有太大變化。 2、L1為機(jī)房基礎(chǔ)設(shè)施:可以理解為是給IT基礎(chǔ)設(shè)施提供支撐的,機(jī)房的裝修、供電、制冷、綜合布線、機(jī)柜、液冷系統(tǒng)等都屬于這一層,智算中心帶來的變化是由低密向高密轉(zhuǎn)變、由風(fēng)冷向液冷(或者風(fēng)液混合)轉(zhuǎn)變、由低容量向高容量供電轉(zhuǎn)變。 3、L2是IT基礎(chǔ)設(shè)施:傳統(tǒng)數(shù)據(jù)的三大件“計算、存儲、網(wǎng)絡(luò)”,在智算中心規(guī)劃中也不例外,只是結(jié)構(gòu)比例有所不同,體現(xiàn)在計算部分占比提升(約70-80%),以AI算力(主要是GPU)為主,網(wǎng)絡(luò)也由傳統(tǒng)的以太網(wǎng)方案轉(zhuǎn)為RDMA網(wǎng)絡(luò)(IB和Roce)為主,當(dāng)然存儲的性能容量也有變化。 4、L3和L4是平臺和業(yè)務(wù)層:因?yàn)橹撬阒行臉I(yè)務(wù)類型的轉(zhuǎn)變(以AI大模型的訓(xùn)練和推理為主),所以在這兩層會和傳統(tǒng)數(shù)據(jù)中心有較大的變化(下文具體展開)。 二、“智算中心”的定義和概念 怎么去理解“智算中心”其實(shí)不同的領(lǐng)域?qū)ζ涠x也有所差異,下面圖片是來自“中國通服數(shù)字基建產(chǎn)業(yè)研究院(華信咨詢設(shè)計研究院)”對智算中心的兩個定義,我們可以作為參考。 狹義的智算中心:是智能算力的物理載體,是“機(jī)房+網(wǎng)絡(luò)+GPU 服務(wù)器+算力調(diào)度平臺”的融合基礎(chǔ)設(shè)施,是傳統(tǒng)數(shù)據(jù)中心的增值性延伸。 廣義的智算中心:是人工智能軟硬件技術(shù)一體化的載體,是“算力+數(shù)據(jù)+算法”的融合服務(wù),是促進(jìn) AI 產(chǎn)業(yè)化和產(chǎn)業(yè) AI 化的重要引擎,是傳統(tǒng)云數(shù)據(jù)中心的智能化升級。 三、“智算中心”與超算和傳統(tǒng)數(shù)據(jù)中心的對比分析 數(shù)據(jù)中心的建設(shè)與社會的發(fā)展需求緊密結(jié)合,在不同發(fā)展階段出現(xiàn)了通用計算數(shù)據(jù)中心、超級中心、智算中心等不同形態(tài)的算力基礎(chǔ)設(shè)施,其本質(zhì)也是從信息化走向數(shù)字化、智能化的過程。下面從建設(shè)的目的、功能特點(diǎn)、應(yīng)用領(lǐng)域和投建運(yùn)模式幾個維度進(jìn)行簡單的對比分析: 1、建設(shè)目的:
2、功能特點(diǎn):
3、應(yīng)用領(lǐng)域:
4、投建運(yùn)模式:
以上只是簡單把三種算力中心做了比較,僅供大家參考! |
|