國內(nèi)超大型智能算力中心建設(shè)白皮書 2024

非著名問天 2024-04-06

展開全文

智算中心建設(shè)通過領(lǐng)先的體系架構(gòu)設(shè)計，以算力基建化為主體、以算法基建化為引領(lǐng)、以服務(wù)智件化為依托，以設(shè)施綠色化為支撐，從基建、硬件、軟件、算法、服務(wù)等全環(huán)節(jié)開展關(guān)鍵技術(shù)落地與應(yīng)用。

一、體系架構(gòu)

（一）總體架構(gòu)

圖8 智算中心總體架構(gòu)

智能算力中心建設(shè)白皮書，重點圍繞基礎(chǔ)、支撐、功能和目標(biāo)四大部分，創(chuàng)新性地提出了智算中心總體架構(gòu)。

其中，基礎(chǔ)部分是支撐智算中心建設(shè)與應(yīng)用的先進(jìn)人工智能理論和計算架構(gòu)；支撐部分圍繞智算中心算力生產(chǎn)、聚合、調(diào)度、釋放的作業(yè)邏輯展開；功能部分提供算力生產(chǎn)供應(yīng)、數(shù)據(jù)開放共享、智能生態(tài)建設(shè)和產(chǎn)業(yè)創(chuàng)新聚集四大平臺，以及數(shù)據(jù)、算力和算法三大服務(wù)；整體目標(biāo)是促進(jìn)AI產(chǎn)業(yè)化、產(chǎn)業(yè)AI化及政府治理智能化。

（二）技術(shù)演進(jìn)

智算中心的發(fā)展基于最新人工智能理論和領(lǐng)先的人工智能計算架構(gòu)，算力技術(shù)與算法模型是其中的關(guān)鍵核心技術(shù)，算力技術(shù)以AI芯片、AI服務(wù)器、AI集群為載體，而當(dāng)前的算法模型發(fā)展趨勢以AI大模型為代表。

在此基礎(chǔ)上，通過智算中心操作系統(tǒng)作為智算中心的“神經(jīng)中樞”對算力資源池進(jìn)行高效管理和智能調(diào)度，使智算中心更好地對外提供算力、數(shù)據(jù)和算法等服務(wù)，支撐各類智慧應(yīng)用場景落地。而軟件生態(tài)則是智算中心“好用、用好”的關(guān)鍵支撐。

1．AI芯片

基于AI芯片的加速計算是當(dāng)前AI計算的主流模式。AI芯片通過和AI算法的協(xié)同設(shè)計來滿足AI計算對算力的超高需求。當(dāng)前主流的AI加速計算主要是采用CPU系統(tǒng)搭載GPU、FPGA、ASIC等異構(gòu)加速芯片。

AI計算加速芯片發(fā)端于GPU芯片，GPU芯片中原本為圖形計算設(shè)計的大量算術(shù)邏輯單元（ALU）可對以張量計算為主的深度學(xué)習(xí)計算提供很好的加速效果。隨著GPU芯片在AI計算加速中的應(yīng)用逐步深入，GPU芯片本身也根據(jù)AI的計算特點，進(jìn)行了針對性的創(chuàng)新設(shè)計，如張量計算單元、TF32/BF16數(shù)值精度、Transformer引擎（Transformer Engine）等。

近年來，國產(chǎn)AI加速芯片廠商持續(xù)發(fā)力，在該領(lǐng)域取得了快速進(jìn)展，相關(guān)產(chǎn)品陸續(xù)發(fā)布，覆蓋了AI推理和AI訓(xùn)練需求，其中既有基于通用GPU架構(gòu)的芯片，也有基于ASIC架構(gòu)的芯片，另外也出現(xiàn)了類腦架構(gòu)芯片，總體上呈現(xiàn)出多元化的發(fā)展趨勢。但是，當(dāng)前國產(chǎn)AI芯片在產(chǎn)品性能和軟件生態(tài)等方面與國際領(lǐng)先水平還存在差距，亟待進(jìn)一步完善加強?？傮w而言，國產(chǎn)AI芯片正在努力從“可用”走向“好用”。

2．AI服務(wù)器

AI服務(wù)器是智算中心的算力機(jī)組。當(dāng)前AI服務(wù)器主要采用CPU+AI加速芯片的異構(gòu)架構(gòu)，通過集成多顆AI加速芯片實現(xiàn)超高計算性能。

為滿足各領(lǐng)域場景和復(fù)雜的AI模型的計算需求，AI服務(wù)器對計算芯片間互聯(lián)、擴(kuò)展性有極高要求。AI服務(wù)器內(nèi)基于特定協(xié)議進(jìn)行多加速器間高速互聯(lián)通信已成為高端AI訓(xùn)練服務(wù)器的標(biāo)準(zhǔn)架構(gòu)。

目前業(yè)界以NVLink和OAM兩種高速互聯(lián)架構(gòu)為主，其中NVLink是NVIDIA開發(fā)并推出的一種私有通信協(xié)議，其采用點對點結(jié)構(gòu)、串列傳輸，可以達(dá)到數(shù)百GB/s的P2P互聯(lián)帶寬，極大地提升了模型并行訓(xùn)練的效率和性能。

OAM是國際開放計算組織OCP定義的一種開放的、用于跨AI加速器間的高速通信互聯(lián)協(xié)議，卡間互聯(lián)聚合帶寬可高達(dá)896GB/s。

浪潮信息基于開放OAM架構(gòu)研發(fā)的AI服務(wù)器NF5498，率先完成與國際和國內(nèi)多家AI芯片產(chǎn)品的開發(fā)適配，并已在多個智算中心實現(xiàn)大規(guī)模落地部署。

3．AI集群

大模型參數(shù)量和訓(xùn)練數(shù)據(jù)復(fù)雜性快速增長，對智算系統(tǒng)提出大規(guī)模算力擴(kuò)展需求。通過充分考慮大模型分布式訓(xùn)練對于計算、網(wǎng)絡(luò)和存儲的需求特點，可以設(shè)計構(gòu)建高性能可擴(kuò)展、高速互聯(lián)、存算平衡的AI集群來滿足尖端的AI計算需求。

AI集群采用模塊化方法構(gòu)建，可以實現(xiàn)大規(guī)模的算力擴(kuò)展。AI集群的基本算力單元是AI服務(wù)器。數(shù)十臺AI服務(wù)器可以組成單個POD計算模組，POD內(nèi)部通過多塊支持RDMA技術(shù)的高速網(wǎng)卡連接。在此基礎(chǔ)上以POD計算模組為單位實現(xiàn)橫向擴(kuò)展，規(guī)?？啥噙_(dá)數(shù)千節(jié)點以上，從而實現(xiàn)更高性能的AI集群。

AI集群的構(gòu)建主要采用低延遲、高帶寬的網(wǎng)絡(luò)互連。為了滿足大模型訓(xùn)練常用的數(shù)據(jù)并行、模型并行、流水線并行等混合并行策略的通信需求，需要為芯片間和節(jié)點間提供低延遲、高帶寬的互聯(lián)。另外，還要針對大模型的并行訓(xùn)練算法通信模式做出相應(yīng)的組網(wǎng)拓?fù)渖系膬?yōu)化，比如對于深度學(xué)習(xí)常用的全局梯度歸約通信操作，可以使用全局環(huán)狀網(wǎng)絡(luò)設(shè)計，配置多塊高速網(wǎng)卡，實現(xiàn)跨AI服務(wù)器節(jié)點的AI芯片間RDMA互聯(lián)，消除混合并行算法的計算瓶頸。

AI集群的構(gòu)建需要配置面向AI優(yōu)化的高速存儲。通過配置高性能、高擴(kuò)展、多層級的智能存儲，為各種數(shù)據(jù)訪問需求提供優(yōu)化性能。智能存儲具備隨需擴(kuò)展功能，實現(xiàn)高IOPS處理能力，支持RDMA技術(shù)，同時實現(xiàn)高聚合帶寬。

4．AI大模型

超大規(guī)模智能模型，簡稱大模型，是近年興起的一種新的人工智能計算范式。和傳統(tǒng)AI模型相比，大模型的訓(xùn)練使用了更多的數(shù)據(jù)，具有更好的泛化性，可以應(yīng)用到更廣泛的下游任務(wù)中。按照應(yīng)用場景劃分，AI大模型主要包括語言大模型、視覺大模型和多模態(tài)大模型等。

自然語言處理是首個應(yīng)用大模型的領(lǐng)域，BERT是大模型的早期代表。隨著大模型在自然語言的理解和生成領(lǐng)域成功應(yīng)用，推動了語言大模型向更大的模型參數(shù)規(guī)模和更大訓(xùn)練數(shù)據(jù)規(guī)模的方向發(fā)展。當(dāng)前，語言大模型的單體模型參數(shù)已經(jīng)達(dá)到千億級別，訓(xùn)練數(shù)據(jù)集規(guī)模也達(dá)到了TB級別，訓(xùn)練所需計算資源超過1000PetaFlop/s-day（PD）。業(yè)界典型的自然語言大模型有GPT-4、源、悟道和文心等。自然語言大模型已經(jīng)廣泛應(yīng)用于個人知識管理、輿情檢測、商業(yè)報告生成、金融反欺詐、智能客服、虛擬數(shù)字人等場景，同時也出現(xiàn)了一系列的創(chuàng)新應(yīng)用場景，如劇本殺、反網(wǎng)絡(luò)詐騙、公文寫作等。

在語言大模型大獲成功之后，相關(guān)技術(shù)和方法也被引入計算機(jī)視覺領(lǐng)域，通過構(gòu)建更大的預(yù)訓(xùn)練模型，使其可以適用于目標(biāo)檢測、語義分割、異常檢測等廣泛的視覺任務(wù)。

在算法架構(gòu)上，視覺大模型采用以Transformer架構(gòu)為主體的神經(jīng)網(wǎng)絡(luò)架構(gòu)和自監(jiān)督的訓(xùn)練方法以及十億級的無標(biāo)注圖片數(shù)據(jù)進(jìn)行訓(xùn)練。當(dāng)前業(yè)界已經(jīng)出現(xiàn)了越來越多的通用視覺大模型和面向特定領(lǐng)域的視覺大模型。視覺大模型也已廣泛應(yīng)用于自動駕駛、智能安防、醫(yī)學(xué)影像等領(lǐng)域。

隨著大模型技術(shù)在語言、視覺等多個領(lǐng)域的應(yīng)用，融合多個模態(tài)的多模態(tài)大模型也逐漸成為了業(yè)界關(guān)注的重點。基于多模態(tài)大模型的以文生圖，文生視頻技術(shù)也迅速發(fā)展，代表性模型有DALLE-2、Stable Diffusion 3 和Sora等。由于多模態(tài)大模型的快速發(fā)展，AI內(nèi)容生成（AI Generated Content，AIGC）已成為下一個AI發(fā)展的重點領(lǐng)域。

5．智算OS

智算OS，即智算中心操作系統(tǒng)，是以智算服務(wù)為對象，對智算中心基礎(chǔ)設(shè)施資源池進(jìn)行高效管理和智能調(diào)度的產(chǎn)品方案，可以使智算中心更好地對外提供算力、數(shù)據(jù)、算法、智件等服務(wù)，有效降低算力使用門檻，提升資源調(diào)度效率，支撐各類智慧應(yīng)用場景落地，是智算中心的“中樞神經(jīng)”。

智算OS主要由三層架構(gòu)構(gòu)成，分別為基礎(chǔ)設(shè)施層、平臺服務(wù)層、業(yè)務(wù)系統(tǒng)層。基礎(chǔ)設(shè)施層主要實現(xiàn)將異構(gòu)算力、數(shù)據(jù)存儲、框架模型等轉(zhuǎn)化為有效的算力與服務(wù)資源，算力資源池能夠聚合并進(jìn)行標(biāo)準(zhǔn)化和細(xì)粒度切分，以滿足上層不同類型智能應(yīng)用對算力的多元化需求，并通過異構(gòu)資源管理和調(diào)度技術(shù)，提升可同時支撐的智算業(yè)務(wù)規(guī)模。

平臺服務(wù)層主要提供AI訓(xùn)練與推理服務(wù)、數(shù)據(jù)治理服務(wù)、運營運維服務(wù)等，并通過智算OS實現(xiàn)自動化、智能化，有效擺脫人力束縛，促進(jìn)算力高效釋放并轉(zhuǎn)化為生產(chǎn)力。業(yè)務(wù)系統(tǒng)層是面向用戶端的統(tǒng)一服務(wù)入口，向下整合各層級核心功能，為用戶提供多元化、高質(zhì)量的智算服務(wù)，滿足生產(chǎn)中不同階段、不同場景的智算需求。

智算OS以智算中心為載體，通過建設(shè)多元、開放的智算平臺，融合國際、國內(nèi)先進(jìn)人工智能技術(shù)，形成標(biāo)準(zhǔn)化、模塊化的模型、中間件及應(yīng)用軟件，以開放接口、模型庫、算法包等方式向用戶提供如行業(yè)大模型、自動駕駛、元宇宙、智慧科研等人工智能服務(wù)，促進(jìn)人工智能技術(shù)成果的開放與共享，構(gòu)建開放的智算生態(tài)。

6．軟件生態(tài)

基于業(yè)界主流、開源、開放的軟件生態(tài)建設(shè)智算中心，是智算中心能夠滿足前沿AI計算需求、提升AI創(chuàng)新和生產(chǎn)效率、豐富行業(yè)AI應(yīng)用、促進(jìn)AI產(chǎn)業(yè)快速發(fā)展的主要前提。深度學(xué)習(xí)的加速計算始于GPU，構(gòu)建于GPU之上的CUDA軟件棧為深度學(xué)習(xí)的算法開發(fā)提供了極大的便利。CUDA軟件棧為深度學(xué)習(xí)的應(yīng)用開發(fā)和計算加速提供了豐富的底層支撐，如張量和卷積計算加速、芯片互聯(lián)通信加速、數(shù)據(jù)預(yù)處理加速、模型低精度推理加速等。在此基礎(chǔ)上，學(xué)術(shù)界和工業(yè)界已經(jīng)構(gòu)建龐大的開源、開放、共享的AI軟件生態(tài)，有力促進(jìn)和加速全球AI技術(shù)與應(yīng)用的蓬勃發(fā)展。

深度學(xué)習(xí)框架是當(dāng)前主要的人工智能算法開發(fā)工具。其中TensorFlow和PyTorch的使用較為廣泛。TensorFlow因其豐富的模型開發(fā)和應(yīng)用部署組件而在工業(yè)界廣泛應(yīng)用，PyTorch則由于其易用性和靈活性在前沿算法開發(fā)和學(xué)術(shù)創(chuàng)新研究領(lǐng)域取得了領(lǐng)先地位。國內(nèi)的AI科技公司也在開發(fā)和推廣深度學(xué)習(xí)框架。其中百度開發(fā)的飛槳提供了兼具靈活和效率的開發(fā)機(jī)制，并聯(lián)合開源社區(qū)打造了一系列覆蓋主流產(chǎn)業(yè)應(yīng)用需求的工業(yè)級模型，目前在國內(nèi)已得到較多的采用。

在深度學(xué)習(xí)框架之上，為了適應(yīng)計算機(jī)視覺任務(wù)、自然語言大模型等特定場景的應(yīng)用開發(fā)需求，業(yè)界構(gòu)建了一系列的開源開發(fā)庫，比如面向目標(biāo)檢測任務(wù)的mmdetection、面向大模型訓(xùn)練任務(wù)的Megatron-LM、DeepSpeed，以及面向自監(jiān)督學(xué)習(xí)的VISSL等。

這些軟件庫進(jìn)一步簡化了模型訓(xùn)練和應(yīng)用開發(fā)的難度，已成為當(dāng)前人工智能計算的重要軟件底座。業(yè)界前沿的知名AI算法，如ChatGPT、DALLE-2、StableDiffusion等都是在這樣的架構(gòu)下實現(xiàn)的。隨著國產(chǎn)AI計算產(chǎn)業(yè)的快速發(fā)展，各廠商也高度重視并投入軟件生態(tài)建設(shè)，力求實現(xiàn)好用、易用的軟件開發(fā)和應(yīng)用生態(tài)。但總的來說，當(dāng)前國產(chǎn)AI計算軟件生態(tài)起步較晚、基礎(chǔ)薄弱，還要持續(xù)不斷加大投入，在各個層面加強建設(shè)完善。

（三）建設(shè)架構(gòu)

圖9 智算中心建設(shè)架構(gòu)

在智算中心總體架構(gòu)的基礎(chǔ)上，聚焦智算中心建設(shè)與應(yīng)用中涉及的關(guān)鍵技術(shù)，進(jìn)一步提出智算中心建設(shè)架構(gòu)。智算中心建設(shè)架構(gòu)由四大關(guān)鍵環(huán)節(jié)組成，分別是算力基建化、算法基建化、服務(wù)智件化、設(shè)施綠色化，“四化”相互支撐、相互協(xié)調(diào)，共同構(gòu)建起智算中心高效運行體系。

同時，在總體架構(gòu)三項服務(wù)、三項目標(biāo)的基礎(chǔ)上，進(jìn)一步拓展豐富智算中心的功能和目標(biāo)，實現(xiàn)對外提供數(shù)據(jù)服務(wù)、算力服務(wù)、算法服務(wù)、生態(tài)服務(wù)四大服務(wù)，支撐達(dá)成AI產(chǎn)業(yè)化、產(chǎn)業(yè)AI化、治理智能化、產(chǎn)業(yè)集群化四大目標(biāo)。

二、技術(shù)路線

智算中心建設(shè)的關(guān)鍵技術(shù)涉及與其建設(shè)和應(yīng)用相關(guān)的各類基建、硬件、軟件，體現(xiàn)在智算中心算力基建化、算法基建化、服務(wù)智件化、設(shè)施綠色化過程中。

（一）以算力基建化為主體

以智算中心為代表的算力基礎(chǔ)設(shè)施能夠有效促進(jìn)AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化，是支撐數(shù)字經(jīng)濟(jì)發(fā)展的重要基礎(chǔ)底座。為了讓AI真正地賦能到千行百業(yè)，并推動產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型發(fā)展，智算中心要具備對外提供高性價比、普惠、安全算力資源的能力，使AI算力像水、電一樣成為城市的公共基礎(chǔ)資源，供政府、企業(yè)、公眾自主取用。算力基建化供給成為支撐產(chǎn)業(yè)轉(zhuǎn)型升級以及創(chuàng)新發(fā)展的剛性需求和必然選擇。

1．面向潛在算力需求，適度超前規(guī)?；渴鹚懔Y源數(shù)據(jù)量的爆炸式增長以及萬億參數(shù)大模型的出現(xiàn)，使智能算力需求呈現(xiàn)高速增長態(tài)勢，并為算力基礎(chǔ)設(shè)施帶來巨大挑戰(zhàn)。在數(shù)據(jù)量方面，IDC發(fā)布的《數(shù)據(jù)時代2025》預(yù)測，到2025年，全球數(shù)據(jù)量將達(dá)到175 ZB，而中國數(shù)據(jù)量的平均增速快于全球3%，預(yù)計到2025年將增至48.6 ZB，占全球數(shù)據(jù)圈的27.8%。在模型方面，當(dāng)前1萬億參數(shù)的單體模型需要1EFLOPS級算力（FP16）計算約50天，10萬億參數(shù)的單體模型需要10 EFLOPS級算力（FP16）計算約50天。因此在智算中心的規(guī)劃建設(shè)中，需要聚焦當(dāng)前算力應(yīng)用需求，同時面向未來數(shù)據(jù)量和大模型大參數(shù)量增長空間，適度超前，部署滿足AI訓(xùn)練、AI推理等大規(guī)模計算需求的強大AI算力機(jī)組，構(gòu)建算力集群，提供大規(guī)模彈性算力。

2．聚焦異構(gòu)加速技術(shù)，提升高性能人工智能計算能力自2012年以來，人工智能訓(xùn)練任務(wù)所需求的算力每3.43個月就會翻倍，大大突破了傳統(tǒng)以每18個月為周期實現(xiàn)芯片性能翻番的摩爾定律，這對人工智能計算架構(gòu)的性能提出了更高的要求。AI芯片是生產(chǎn)算力環(huán)節(jié)的關(guān)鍵組件，為AI訓(xùn)練和AI推理輸出強大、高效、易用的計算力。目前，AI芯片主要包括GPU、FPGA、ASIC、類腦芯片四大類，其中類腦芯片仍在探索階段，因此多元異構(gòu)芯片成為提升算力的關(guān)鍵手段。主流的人工智能計算架構(gòu)是以CPU+AI芯片為主體的異構(gòu)架構(gòu)，通過將CPU與多種計算單元（如GPU、FPGA、ASIC等）集成，充分融合了CPU等傳統(tǒng)的通用計算單元和高性能專用計算單元的優(yōu)點，可以同時兼顧AI模型的高效訓(xùn)練和精準(zhǔn)推理能力。異構(gòu)架構(gòu)具有高性能、高效率、低功耗等顯著優(yōu)點，使AI芯片在未來人工智能算法不斷迭代更新的情況下，依舊能保持較好的兼容性和可擴(kuò)展性，在一定程度上延長了AI芯片的生命周期。

3．兼顧軟硬一體協(xié)同，構(gòu)建智算中心多元融合型架構(gòu)人工智能計算場景和計算架構(gòu)的多元化要求智算中心從硬件、軟件、軟硬協(xié)同等層面開展優(yōu)化，提供彈性、可伸縮擴(kuò)展的算力聚合能力，依據(jù)不同類型智能應(yīng)用對算力的不同需求，提供更高效、更便捷的算力調(diào)度能力。采用融合架構(gòu)進(jìn)行整體設(shè)計是智算中心的發(fā)展方向。具體而言，在硬件層面，通過硬件重構(gòu)實現(xiàn)資源池化，結(jié)合新型超高速內(nèi)外部互連技術(shù)、池化融合、異構(gòu)存儲介質(zhì)等，推動多元異構(gòu)智能算力設(shè)施的高速互聯(lián)，形成高效池化的智算中心，實現(xiàn)多元計算資源高效協(xié)同；在軟件層面，通過軟件定義，將不同的資源池組成專業(yè)的服務(wù)器、存儲、網(wǎng)絡(luò)系統(tǒng)，實現(xiàn)重構(gòu)硬件資源池的高效化、智能化管理，使智算中心的業(yè)務(wù)資源調(diào)度更為靈活、運維管理能力更強。在安全方面，智算中心可以依托隱私安全計算等技術(shù)，提供完善的隱私和數(shù)據(jù)保護(hù)解決方案，實現(xiàn)計算、存儲、網(wǎng)絡(luò)等多層級、全方位的資源隔離與安全防護(hù)。

（二）以算法基建化為引領(lǐng)

建設(shè)適度超前的算力基礎(chǔ)設(shè)施，不僅體現(xiàn)在算力層面，也體現(xiàn)在算法層面，這是釋放算力環(huán)節(jié)的關(guān)鍵。人工智能算法正面臨著豐富化、專業(yè)化和巨量化的挑戰(zhàn)，智算中心通過提供預(yù)置行業(yè)算法、構(gòu)建預(yù)訓(xùn)練大模型、推進(jìn)算法模型持續(xù)升級、提供專業(yè)化數(shù)據(jù)和算法服務(wù)，讓更多的用戶享受普適普惠的智能計算服務(wù)。

1．面向千行百業(yè)發(fā)展需求，提供多類型預(yù)置行業(yè)算法AI落地面臨開發(fā)成本、技術(shù)門檻高的難題，算法模型平均構(gòu)建時間為3個月，同時算法還需要快速的迭代，再加上AI新算法、新理論層出不窮，行業(yè)用戶的智慧轉(zhuǎn)型存在著巨大的技術(shù)壁壘。智算中心應(yīng)圍繞政務(wù)服務(wù)、智慧城市、智能制造、自動駕駛、語言智能等重點領(lǐng)域，在AI平臺內(nèi)預(yù)置實例分割、目標(biāo)檢測、邊緣檢測、圖像分類、人臉識別、視頻感知、自動問答、機(jī)器翻譯、輿情分析、情感分析、語音識別、協(xié)同過濾、交通路線規(guī)劃等常用行業(yè)算法模型，并從硬、軟件對行業(yè)算法做性能優(yōu)化，從而幫助各行各業(yè)智慧應(yīng)用加速落地，推動行業(yè)智能化轉(zhuǎn)型加速。

2．面向模型即服務(wù)應(yīng)用需求，構(gòu)建大規(guī)模預(yù)訓(xùn)練AI模型在產(chǎn)業(yè)AI化和數(shù)實融合的背景下，當(dāng)前的行業(yè)做法是針對每一個場景都做一個模型，即“有1萬個場景就有1萬個模型”。然而隨著以BERT、GPT-3、DALL·E、源1.0等為代表的高泛化能力和高通用性的大模型的出現(xiàn)，一個模型可以覆蓋眾多場景?！邦A(yù)訓(xùn)練大模型+下游任務(wù)微調(diào)”的AI工程化模式已成為業(yè)內(nèi)共識，層數(shù)、隱向量長度、前饋網(wǎng)絡(luò)尺寸持續(xù)增長，參數(shù)規(guī)模迅速從億級增長到百萬億級。

在充足數(shù)據(jù)和算力的支持下，大模型可以充分學(xué)習(xí)文本、圖像等數(shù)據(jù)中的特征。智算中心應(yīng)通過部署大模型所需要的訓(xùn)練、推理和數(shù)據(jù)處理系統(tǒng)，構(gòu)建出不同功能、不同模態(tài)的大模型（如自然語言處理大模型、視覺大模型、多模態(tài)大模型等），從而更加快速地生產(chǎn)出專業(yè)的技能模型，并在更多專業(yè)場景中實現(xiàn)小型化、輕量化的落地運作。

3．面向可持續(xù)化發(fā)展需求，推進(jìn)AI模型不斷演進(jìn)升級從感知機(jī)到深度神經(jīng)網(wǎng)絡(luò)，從全連接網(wǎng)絡(luò)到模型剪枝、知識蒸餾、注意力機(jī)制，從有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)到強化學(xué)習(xí)、自監(jiān)督學(xué)習(xí)，人工智能理論算法模型在持續(xù)深化發(fā)展中。當(dāng)前，人工智能算法正從單模態(tài)、有監(jiān)督學(xué)習(xí)向多模態(tài)、自監(jiān)督學(xué)習(xí)演進(jìn)。自監(jiān)督學(xué)習(xí)無需標(biāo)注數(shù)據(jù)，可以直接從無標(biāo)簽數(shù)據(jù)中自行學(xué)習(xí)，極大降低了人工標(biāo)注成本。

多模態(tài)學(xué)習(xí)更貼近人類對多感知模態(tài)的認(rèn)知過程，通過學(xué)習(xí)多種模態(tài)的數(shù)據(jù)，可以突破自然語言處理和計算機(jī)視覺的界限，在圖文生成、看圖問答等視覺語言任務(wù)上具有更強表現(xiàn)。隨著人工智能相關(guān)技術(shù)和應(yīng)用需求的不斷升級，智算中心所提供的算法模型也應(yīng)持續(xù)迭代升級，與時俱進(jìn)，保持算法模型的先進(jìn)性。未來，人工智能算法將朝著多模態(tài)、交互式主動學(xué)習(xí)、規(guī)劃、實踐的方向發(fā)展，以期實現(xiàn)真正的認(rèn)知智能。

4．面向算法高效調(diào)用需求，提供專業(yè)化開發(fā)部署支撐智算中心除了提供深度學(xué)習(xí)、強化學(xué)習(xí)等常見 A I算法模型外，還應(yīng)提供專業(yè)化基礎(chǔ)支撐和開發(fā)部署服務(wù)能力，以支撐AI算法模型的便捷調(diào)用和部署。為了滿足算法模型對大規(guī)模高質(zhì)量海量數(shù)據(jù)集的需求，智算中心應(yīng)搭載海量數(shù)據(jù)清洗系統(tǒng)，提供全流程自動化數(shù)據(jù)處理系統(tǒng)，實現(xiàn)智能高效的數(shù)據(jù)處理和過濾。為了滿足AI算法模型高效訓(xùn)練和使用的需求，智算中心在基礎(chǔ)支撐層面應(yīng)部署分布式訓(xùn)練框架、高性能推理框架，在開發(fā)部署層面應(yīng)提供數(shù)據(jù)管理、模型開發(fā)、模型訓(xùn)練、模型管理等關(guān)鍵模塊，以模型API服務(wù)、領(lǐng)域模型、工具包、會話式開放框架、開發(fā)者社區(qū)等形式，形成強大的AI算法服務(wù)支撐能力。

（三）以服務(wù)智件化為依托

隨著人工智能應(yīng)用場景持續(xù)拓展和開發(fā)用戶不斷普及，對智能計算需求大幅提升、算法模型功能不斷強化的同時，人工智能算法開發(fā)和模型訓(xùn)練正在從專業(yè)化、高門檻向泛在化、易用型轉(zhuǎn)變，智算中心的發(fā)展將由傳統(tǒng)的硬件、軟件向“智件”升級拓展?！爸羌笔侵钢撬阒行奶峁┤斯ぶ悄芡茝V應(yīng)用的中間件產(chǎn)品和服務(wù)。

傳統(tǒng)用戶進(jìn)行人工智能應(yīng)用時，除了需要提供業(yè)務(wù)數(shù)據(jù)，還需提供算法模型并進(jìn)行代碼開發(fā)，“智件”的構(gòu)建可以改變這種服務(wù)模式，通過可視化操作界面，以及低代碼開發(fā)甚至無代碼開發(fā)的模式，為用戶提供功能豐富、使用便捷的人工智能算力調(diào)度、算法供給和個性化開發(fā)服務(wù)，實現(xiàn)“帶著數(shù)據(jù)來、拿著成果走”的效果。

1．提供多元算力調(diào)度服務(wù)，實現(xiàn)算力調(diào)度“智件化”算力是智算中心提供的核心產(chǎn)品和服務(wù)。面向不同用戶的不同算力需求，智算中心應(yīng)提供“智件化”算力服務(wù)，讓用戶無需關(guān)注底層算力芯片和技術(shù)細(xì)節(jié)，通過用戶交互界面，選擇業(yè)務(wù)場景類別、算法模型大小等參數(shù)，獲得不同算力需求下的計算時間預(yù)估、服務(wù)費用測算等針對性算力服務(wù)方案。

一方面，算力服務(wù)虛擬化，弱化底層算力芯片供給的技術(shù)差異性，為用戶提供標(biāo)準(zhǔn)化的算力供給服務(wù)。

通過抽象芯片架構(gòu)并融合算力特性將提供底層計算能力的GPU、FPGA、ASIC等AI芯片進(jìn)行統(tǒng)一管理和調(diào)度，以PFLOPS、EFLOPS作為計算能力單位向用戶提供算力服務(wù)，讓用戶可以更便捷地調(diào)度算力，進(jìn)行AI應(yīng)用部署。

另一方面，算力服務(wù)協(xié)同調(diào)度，要強化對外的算力調(diào)度與服務(wù)能力。在構(gòu)建全國一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系和“東數(shù)西算”工程的背景和要求下，智算中心可以作為算力基礎(chǔ)單元，通過云服務(wù)方式融入全國算力調(diào)度體系中，滿足更大范圍、更強算力調(diào)度需求。

2．提供簡便算法模型服務(wù)，實現(xiàn)算法供給“智件化”人工智能是一門極其復(fù)雜的學(xué)科，要求應(yīng)用開發(fā)者不僅要有扎實的理論功底，還要有高超的編程技術(shù)，門檻極高。算法模型是人工智能應(yīng)用的靈魂，也是智算中心提供服務(wù)的主要輸出物。從計算智能到感知智能，再到認(rèn)知智能，人工智能的應(yīng)用模型越來越復(fù)雜，從公共服務(wù)到社會治理再到產(chǎn)業(yè)發(fā)展，人工智能的應(yīng)用需求越來越廣泛，對人工智能模型和算法的要求也越來越高。

為了緩解人工智能模型訓(xùn)練成本高、技術(shù)門檻高的問題，智算中心應(yīng)加強算法供給服務(wù)模式的創(chuàng)新，開發(fā)可視化操作界面，用戶通過API、模塊化代碼即可獲得所需的人工智能應(yīng)用效果，減輕代碼開發(fā)壓力，使用戶無需關(guān)注算法和模型本身的復(fù)雜技術(shù)細(xì)節(jié)，只需聚焦相應(yīng)業(yè)務(wù)領(lǐng)域的業(yè)務(wù)邏輯和數(shù)據(jù)就能實現(xiàn)人工智能應(yīng)用。用戶可以基于“智件化”的算法模型進(jìn)行探索和創(chuàng)新，開發(fā)出適用于各種場景的新型智能應(yīng)用。

3．提供開放生態(tài)環(huán)境服務(wù)，實現(xiàn)供需對接“智件化”人工智能場景日趨豐富，應(yīng)用需求和技術(shù)供給個性化特征明顯，為滿足部分用戶和場景對于人工智能算法優(yōu)化、系統(tǒng)優(yōu)化服務(wù)的個性化需求，智算中心應(yīng)構(gòu)建開放合作生態(tài)，加大數(shù)據(jù)資源供給，聚焦先進(jìn)的技術(shù)并適配典型場景應(yīng)用。一方面，加大數(shù)據(jù)供給，數(shù)據(jù)是人工智能應(yīng)用的基礎(chǔ)，智算中心應(yīng)打造數(shù)據(jù)共享平臺，推動計算機(jī)視覺、自然語言處理、重點行業(yè)領(lǐng)域等高質(zhì)量公開數(shù)據(jù)集的匯聚，為用戶人工智能應(yīng)用提供增值性數(shù)據(jù)服務(wù)。另一方面，開放發(fā)展生態(tài)，圍繞滿足不同用戶個性化人工智能應(yīng)用需求，智算中心應(yīng)將其計算平臺、資源平臺和算法平臺對外開放，聚集行業(yè)內(nèi)領(lǐng)先企業(yè)的力量，及時響應(yīng)用戶個性化需求，提升智算中心技術(shù)能力的同時形成新的產(chǎn)業(yè)和生產(chǎn)力。

（四）以設(shè)施綠色化為支撐

能耗是衡量智算中心發(fā)展水平的重要維度之一。“碳達(dá)峰、碳中和”目標(biāo)背景下，國家和地方持續(xù)出臺政策，進(jìn)一步規(guī)范數(shù)據(jù)中心的能耗水平和平均電能利用效率（PUE）。為了進(jìn)一步降低智算中心能耗，設(shè)施綠色化是智算中心建設(shè)的必然選擇。設(shè)施綠色化主要包括設(shè)備節(jié)能化、能源供給綠色化等方面。

1．采用先進(jìn)節(jié)能技術(shù)，全面降低智算中心能耗制冷設(shè)備和IT設(shè)備是智算中心主要的能耗來源。液冷技術(shù)采用冷卻液和工作流體對發(fā)熱設(shè)備進(jìn)行冷卻，利用高比熱容的液體代替空氣，提升了制冷效率，降低制冷能耗。液冷技術(shù)是智算中心制冷的主要發(fā)展趨勢。數(shù)據(jù)中心采用全棧布局液冷，冷板式液冷、熱管式液冷、浸沒式液冷等先進(jìn)液冷技術(shù)，構(gòu)建包含一次側(cè)二次側(cè)液冷循環(huán)、CDU等的智算中心液冷整體解決方案，可以進(jìn)一步降低能耗、降低PUE，實現(xiàn)綠色化。液冷智算中心采用余熱回收技術(shù)，可以為智算中心自身以及鄰近區(qū)域供暖，進(jìn)一步提升能源利用效率。此外，智算中心采用高壓直流、集中供電等高效供配電系統(tǒng)、能效環(huán)境集成檢測等高效輔助系統(tǒng)、智能監(jiān)控運維系統(tǒng)等綠色管理系統(tǒng)可以進(jìn)一步降低能耗。

2．采用綠色清潔能源，從源頭上實現(xiàn)綠色低碳

一方面，智算中心的大部分業(yè)務(wù)負(fù)載，特別是企業(yè)負(fù)載，在時間上主要集中于白天工作時段，與光伏、風(fēng)電的主要發(fā)電時段匹配性較高，無需過多儲能與調(diào)峰，使得智算中心在運用光伏、風(fēng)電等綠色電力方面具有天然優(yōu)勢。采用綠色電力供給的智算中心綜合運用線性規(guī)劃、混合整數(shù)規(guī)劃、啟發(fā)式算法等多種能耗管理方法，可以在降低碳排放的同時也節(jié)約電價成本。智算中心采用優(yōu)化調(diào)度與需求響應(yīng)控制策略，還可作為需求側(cè)可調(diào)載荷參與電力需求側(cè)響應(yīng)，不僅提升智算中心自身能源利用效率，而且提升新型電力系統(tǒng)需求側(cè)資源優(yōu)化配置效率。

另一方面，智算中心所在的建筑物、園區(qū)空間大，可以充分利用，發(fā)展屋頂光伏、園區(qū)風(fēng)電等可再生能源發(fā)電設(shè)施，優(yōu)化能源綠色供給格局。應(yīng)用分布式光伏發(fā)電、分布式燃?xì)夤┠艿燃夹g(shù)可以提升智算中心園區(qū)綠色化水平。小型智算中心還可以利用模塊化氫燃料電池、太陽能板房等技術(shù)優(yōu)化能源供給格局。

應(yīng)用篇

在識別檢測、語音交互、智能客服等智能應(yīng)用在各行業(yè)領(lǐng)域得到了廣泛使用，以自動駕駛為代表的高算力需求場景從實驗環(huán)境逐步走向試點應(yīng)用階段，而以元宇宙、智慧科研（AI for Science）為代表的新興場景也逐漸走進(jìn)大眾視野，并帶來無限發(fā)展可能。

作為支撐人工智能應(yīng)用的關(guān)鍵基礎(chǔ)設(shè)施，智算中心匯聚數(shù)據(jù)、算力、算法等要素，通過生產(chǎn)算力、聚合算力、調(diào)度算力、釋放算力等關(guān)鍵環(huán)節(jié)，實現(xiàn)“以數(shù)據(jù)輸入，讓智能輸出”，助力AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化，讓智能計算真正惠及經(jīng)濟(jì)社會發(fā)展。

一、智算中心激發(fā)AI產(chǎn)業(yè)化創(chuàng)新活力

（一）自動駕駛

自動駕駛是汽車智能化和自動化的高級形態(tài)，作為AI技術(shù)備受關(guān)注的重要落腳點，被公認(rèn)是汽車出行產(chǎn)業(yè)的未來方向之一。自動駕駛場景的實現(xiàn)，需要通過感知融合、虛擬路測（模擬仿真）、高精地圖、車路協(xié)同等核心技術(shù)將數(shù)字世界與實體路況進(jìn)行深度融合，基于人工智能技術(shù)，讓車輛能夠像人類駕駛員一樣準(zhǔn)確地識別車道、行人、障礙物等駕駛環(huán)境中的關(guān)鍵信息，并及時對周圍運動單元的潛在軌跡做出預(yù)判。

自動駕駛落地需要超大AI算力支持自動駕駛需要通過對車身多個傳感器的數(shù)據(jù)進(jìn)行感知和融合，并在此基礎(chǔ)上對自動駕駛車輛的行為進(jìn)行決策和控制，其中涉及大量AI算法、機(jī)器視覺與傳感器數(shù)據(jù)整合分析、面向各類算力平臺及傳感器配置方案的適配能力等。

為了提升自動駕駛系統(tǒng)的感知和決策性能，當(dāng)前通行的做法是在數(shù)據(jù)中心端基于海量的道路采集數(shù)據(jù)來進(jìn)行感知模型訓(xùn)練和仿真測試。隨著AI技術(shù)的發(fā)展，通過AI算法對多傳感器的數(shù)據(jù)以及多模態(tài)的數(shù)據(jù)進(jìn)行融合感知，已經(jīng)成為了當(dāng)前主流的發(fā)展趨勢。另外自監(jiān)督大模型的技術(shù)也在逐步地引入到自動駕駛場景中。

這都使得自動駕駛感知模型的訓(xùn)練算力消耗遠(yuǎn)大于一般的計算機(jī)視覺感知模型。比如，Tesla構(gòu)建的L2級別的FSD自動駕駛?cè)诤细兄Ｐ偷挠?xùn)練使用了百萬量級的道路采集視頻片段，算力投入約為500PD。隨著自動駕駛級別從L2到L4的提升，對算力的需求將進(jìn)一步提高。

算力供給是自動駕駛系統(tǒng)得以大規(guī)模落地和進(jìn)一步商業(yè)化的前提條件。自動駕駛產(chǎn)業(yè)的集成化、規(guī)?；l(fā)展需要由智算中心提供超大算力、先進(jìn)AI算法等支撐。智算中心提供的普惠算力可以極大降低自動駕駛所需算力的成本，同時加速自動駕駛新技術(shù)與新產(chǎn)品的研發(fā)、測試和應(yīng)用。

（二）機(jī)器人

機(jī)器人是人工智能技術(shù)多領(lǐng)域應(yīng)用的重要載體，主要分為工業(yè)機(jī)器人、服務(wù)機(jī)器人和特種機(jī)器人。作為一種重要的智能硬件，隨著計算機(jī)視覺、機(jī)器學(xué)習(xí)、智能語音等多種智能算法技術(shù)的進(jìn)步，機(jī)器人產(chǎn)業(yè)也將實現(xiàn)飛速的發(fā)展。

《中國機(jī)器人產(chǎn)業(yè)發(fā)展報告（2022年）》數(shù)據(jù)顯示，2022年中國機(jī)器人市場規(guī)模約為174億美元，五年年均增長率達(dá)到22%，其中工業(yè)機(jī)器人和服務(wù)機(jī)器人市場規(guī)模均保持增長，二者呈現(xiàn)出齊頭并進(jìn)、快速發(fā)展的態(tài)勢。

“AI算法+AI算力”支撐機(jī)器人從量變到質(zhì)變機(jī)器人與新一代信息技術(shù)的融合逐漸深入，機(jī)器人的感知、計算、執(zhí)行能力都得到了大幅提升，處理實際問題的穩(wěn)定性和可靠性也進(jìn)一步提高，這背后離不開人工智能技術(shù)和強大算力的支撐。機(jī)器人需要和環(huán)境進(jìn)行交互感知以及決策控制，和環(huán)境的交互感知不僅涉及到視覺、聽覺等多個模態(tài)，也會涉及到不同模態(tài)的感知融合，這都需要AI算法作為底層支撐。為了實現(xiàn)相應(yīng)的感知和決策算法，一般會在數(shù)據(jù)中心端構(gòu)建真實世界數(shù)據(jù)采集→AI模型構(gòu)建→孿生世界的決策控制模型訓(xùn)練→真實世界驗證測試的閉環(huán)，來逐步地提升機(jī)器人在真實世界的感知和決策能力。

用于學(xué)習(xí)和訓(xùn)練的數(shù)據(jù)越多，算法迭代得越完善，機(jī)器人的決策準(zhǔn)確度將越高。智算中心的算力服務(wù)可以為機(jī)器人的大規(guī)模模型訓(xùn)練和預(yù)測提供強大算力支撐，智算中心的算法服務(wù)可以實現(xiàn)機(jī)器人智能化應(yīng)用算法模型的敏捷開發(fā)和快速訓(xùn)練上線，為機(jī)器人產(chǎn)業(yè)的高質(zhì)量發(fā)展提供全方位支撐。

（三）元宇宙

元宇宙是基于數(shù)字技術(shù)進(jìn)行創(chuàng)造和連接，與現(xiàn)實空間映射交互形成的虛擬空間，是整合多種新技術(shù)而產(chǎn)生的下一代互聯(lián)網(wǎng)應(yīng)用和數(shù)字形態(tài)的新型社會體系。元宇宙在5G、人工智能、物聯(lián)網(wǎng)、AR/VR、云計算、區(qū)塊鏈等技術(shù)及產(chǎn)品的支持下，為現(xiàn)實世界構(gòu)建數(shù)字化虛擬平行世界，為用戶提供沉浸式交互體驗，大幅提升各行業(yè)生產(chǎn)效率。

智算中心是支撐元宇宙實現(xiàn)的關(guān)鍵基礎(chǔ)設(shè)施元宇宙的沉浸式體驗離不開擴(kuò)展現(xiàn)實、人工智能、區(qū)塊鏈等元宇宙核心技術(shù)的支持，對系統(tǒng)的計算、存儲、帶寬、功耗等都提出了極高的要求，其所需消耗的算力資源也是巨量的。

元宇宙的協(xié)同創(chuàng)建、高精仿真、實時渲染、智能交互等環(huán)節(jié)都需要大量算力做支撐，想要真正邁入虛擬和現(xiàn)實融合的3D互聯(lián)網(wǎng)時代，元宇宙對算力的需求將呈指數(shù)級增長，這遠(yuǎn)遠(yuǎn)超過了通用CPU的發(fā)展速度。傳統(tǒng)以提升CPU時鐘頻率和內(nèi)核數(shù)量來提高計算性能的方式遇到了瓶頸，形成了巨大的算力缺口。元宇宙從本質(zhì)上看是對算力的重構(gòu)，這部分算力缺口需要由智算中心來彌補，從而不斷提升元宇宙場景的性能和能效。

1．虛擬數(shù)字人

虛擬數(shù)字人是可以感知、規(guī)劃、行動的虛擬形象，由計算機(jī)圖形學(xué)、圖形渲染、動作捕捉、深度學(xué)習(xí)、語音合成等技術(shù)生成，具備類人外貌、交互能力等高度擬人化特征，是元宇宙的重要組成部分。虛擬數(shù)字人正逐步“闖入”現(xiàn)實虛擬數(shù)字人的應(yīng)用領(lǐng)域非常廣泛，按照應(yīng)用場景或行業(yè)的不同，已經(jīng)出現(xiàn)了虛擬主播、虛擬偶像等娛樂型數(shù)字人，虛擬教師等教育型數(shù)字人，虛擬客服、虛擬導(dǎo)游等助手型數(shù)字人，替身演員、虛擬演員等影視數(shù)字人應(yīng)用。據(jù)《虛擬數(shù)字人深度產(chǎn)業(yè)報告》預(yù)測，2030年我國虛擬數(shù)字人整體市場規(guī)模將達(dá)到2,700億元。

智算中心助力虛擬數(shù)字人應(yīng)對AI算力和算法挑戰(zhàn)虛擬數(shù)字人相關(guān)的建模、驅(qū)動、渲染和感知交互均需要巨量的算力支撐。當(dāng)前，虛擬數(shù)字人的建模以基于3D建模軟件的手工建模+真人驅(qū)動為主。

隨著AIGC等AI技術(shù)的應(yīng)用，基于AI算法的自動建模將逐步替代手工建模，成為數(shù)字人建模的主要方式。與此同時，基于AI算法的數(shù)字人驅(qū)動也將逐步替代當(dāng)前以“中之人”驅(qū)動為主的真人驅(qū)動方式。與此同時，視覺感知、語音識別和語音合成以及自然語言處理等多種AI算法在數(shù)字人中的應(yīng)用，將推動數(shù)字人向“數(shù)智人”轉(zhuǎn)變，也是虛擬數(shù)字人應(yīng)用普及的關(guān)鍵。智算中心可以為虛擬數(shù)字人制作、感知交互提供強大的算力和算法支撐，加速虛擬數(shù)字人產(chǎn)業(yè)的商業(yè)化落地。

2．?dāng)?shù)字孿生

數(shù)字孿生是指充分利用物理模型、傳感器、運行歷史等數(shù)據(jù)，集成多學(xué)科、多尺度的仿真過程，以數(shù)字化方式創(chuàng)建物理實體的虛擬鏡像，通過模擬、驗證、預(yù)測和控制物理實體全生命周期行為，實現(xiàn)在物理空間的最優(yōu)決策。數(shù)字孿生是構(gòu)建元宇宙數(shù)字空間的基礎(chǔ)數(shù)字孿生在元宇宙的發(fā)展進(jìn)程中扮演著重要角色，是元宇宙耦合物理世界的基石。

元宇宙的目標(biāo)是構(gòu)建一個與現(xiàn)實物理世界高度貼合的甚至是超越現(xiàn)實世界的虛擬世界，因此需要通過海量數(shù)據(jù)模擬和強大算力來實現(xiàn)1:1的數(shù)字空間創(chuàng)造，這個過程中的核心關(guān)鍵就是數(shù)字孿生。數(shù)字孿生技術(shù)能夠以極致細(xì)節(jié)的方式將現(xiàn)實世界映射到虛擬世界中。因此，數(shù)字孿生技術(shù)的成熟度在一定程度上決定了元宇宙在虛實映射與虛實交互上的發(fā)展?jié)摿Α?/span>

強大算力是數(shù)字孿生高效穩(wěn)定運行的重要支撐數(shù)字孿生的應(yīng)用十分廣泛。例如，數(shù)字孿生城市可以在虛擬世界模擬仿真城市管理、產(chǎn)業(yè)發(fā)展、消防應(yīng)急、環(huán)境變化等情況，為現(xiàn)實中關(guān)鍵問題的決策提供技術(shù)支撐，提升城市規(guī)劃和城市治理的效率和精準(zhǔn)度。

在元宇宙中，大規(guī)模、高度復(fù)雜的數(shù)字孿生空間的構(gòu)建，以及現(xiàn)實世界和數(shù)字世界的實時交互，需要有強大且物理準(zhǔn)確的高精度仿真算力和實時高清3D渲染算力作為支撐。隨著AI技術(shù)的發(fā)展，基于AI算法的高精仿真逐步替代了傳統(tǒng)基于數(shù)值求解算法的仿真系統(tǒng)，成為了數(shù)字孿生系統(tǒng)的核心底層支撐技術(shù)。智算中心可以為大規(guī)模數(shù)字孿生提供專業(yè)化的算力和應(yīng)用支持，支撐數(shù)字孿生空間的實時創(chuàng)建、復(fù)雜模型的高效運行，以及逼真仿真環(huán)境的快速生成。

二、智算中心助力產(chǎn)業(yè)AI化走深向?qū)?/span>

（一）智慧醫(yī)療

國家統(tǒng)計局《2021年國民經(jīng)濟(jì)和社會發(fā)展統(tǒng)計公報》顯示，2021年全年總診療人次85.3億人次，基本醫(yī)療保險覆蓋13.6億人。然而，各個地區(qū)醫(yī)療服務(wù)水平參差不齊，醫(yī)療服務(wù)資源不均等現(xiàn)象普遍存在，基層患者尤其是偏遠(yuǎn)地區(qū)的患者難以獲得高質(zhì)量的醫(yī)療救治。

AI輔助診斷助力解決診療“三大難題”當(dāng)前，醫(yī)療診斷主要面臨三大挑戰(zhàn)：

一是數(shù)據(jù)量巨大。粗略估算診療人次所對應(yīng)的就醫(yī)環(huán)節(jié)及相應(yīng)的醫(yī)療數(shù)據(jù)質(zhì)量，加上血壓、心率、體重、心電圖等醫(yī)療監(jiān)測數(shù)據(jù)，規(guī)模早已突破TB級，并且以“秒”為單位持續(xù)更新疊加，需要強有力的算力支撐平臺。

二是數(shù)據(jù)結(jié)構(gòu)多元。不僅包含大量醫(yī)學(xué)術(shù)語、專業(yè)名稱，還包括文檔、影像、視頻等非結(jié)構(gòu)化數(shù)據(jù)，對AI服務(wù)器等新型智能計算硬件要求較高。

三是數(shù)據(jù)實時處理要求高。醫(yī)療服務(wù)中存在大量時間性強和決策周期短的應(yīng)用場景，如臨床中的診療和用藥建議、健康指標(biāo)預(yù)警等，對在線計算、實時處理的需求顯著，亟需構(gòu)建強大的算力平臺支撐基于醫(yī)療健康領(lǐng)域數(shù)據(jù)規(guī)模化知識圖譜。

醫(yī)療機(jī)構(gòu)通過引入AI輔助診療，可實現(xiàn)診斷、治療工作的智能化。從算力需求看，人工智能輔助診療應(yīng)用涉及海量圖形數(shù)據(jù)的處理，所需的算力要求較高。智算中心具備的強大算力可以支持大規(guī)模、高難度的模型訓(xùn)練，全方位支撐海量醫(yī)療影像數(shù)據(jù)的分析挖掘和精準(zhǔn)診斷，能夠有效縮短診斷時間，提高診療效率。

（二）文娛創(chuàng)作

近年來，AI在文娛創(chuàng)作方面有諸多突破，通過融合人工智能、認(rèn)知心理學(xué)、哲學(xué)和藝術(shù)等多個學(xué)科，可完成詩詞、繪畫、音樂、影視、小說等創(chuàng)作。

人工智能正在逐漸改變文娛創(chuàng)作的發(fā)展范式對藝術(shù)家來說，靈感極為可貴并難以捕捉，當(dāng)文娛創(chuàng)作遇上人工智能，整個行業(yè)迸發(fā)出了全新的生機(jī)和活力。AI技術(shù)將是未來數(shù)字化創(chuàng)作的重要生產(chǎn)工具。當(dāng)前出現(xiàn)的創(chuàng)作生態(tài)可分為專業(yè)生成內(nèi)容（Professionally Generated Content，簡稱PGC）、用戶生成內(nèi)容（User Generated Content，簡稱UGC）、AI輔助生產(chǎn)內(nèi)容和AIGC。

其中，PGC和UGC都是以人為主體的創(chuàng)作模式，PGC是由專業(yè)人士進(jìn)行內(nèi)容創(chuàng)作，成本較高且產(chǎn)能有限；UGC降低了生產(chǎn)成本，滿足了個性化需求，但存在不可控因素。從長期來看，數(shù)字內(nèi)容生成的需求會愈發(fā)強烈，但是人腦處理信息的能力有限，當(dāng)以人力為主的內(nèi)容生產(chǎn)潛力逐漸消耗殆盡，以AI為主的內(nèi)容生產(chǎn)模式將彌補數(shù)字世界內(nèi)容供需的缺口。Gartner數(shù)據(jù)顯示，到2023年將有20%的內(nèi)容由AI創(chuàng)作生成，預(yù)計到2025年生成式AI產(chǎn)生的數(shù)據(jù)將占所有數(shù)據(jù)的10%。

AIGC將成為數(shù)字內(nèi)容生產(chǎn)的長期發(fā)展方向AIGC是一種通過生成對抗網(wǎng)絡(luò)、深度學(xué)習(xí)、大型預(yù)訓(xùn)練模型等人工智能技術(shù)挖掘數(shù)據(jù)中的規(guī)律，并通過適當(dāng)?shù)姆夯芰ι上嚓P(guān)內(nèi)容的技術(shù)。深度學(xué)習(xí)技術(shù)（如深度學(xué)習(xí)模型CLIP等）的突破為AIGC商業(yè)落地提供了可能，而數(shù)字內(nèi)容、數(shù)字資產(chǎn)等的快速發(fā)展又進(jìn)一步加速了AIGC的應(yīng)用與優(yōu)化。

利用AIGC技術(shù)可以生成多種模態(tài)的數(shù)字作品，如AI寫作（文本）、AI繪畫（圖像）、AI作曲（音頻）、AI換臉（視頻）等。同時，AIGC技術(shù)也可以實現(xiàn)由文字生成圖像、文字生成視頻、圖像/視頻生成文字等跨模態(tài)創(chuàng)作，以及Game AI等各類綜合型場景創(chuàng)作。AIGC的出現(xiàn)使數(shù)字內(nèi)容創(chuàng)作的生產(chǎn)效率和互動性得到了進(jìn)一步提升。隨著人工智能技術(shù)的不斷升級以及算力、數(shù)據(jù)、算法等要素的持續(xù)迭代，未來AIGC技術(shù)將持續(xù)賦

能各類文化創(chuàng)意、生產(chǎn)生活，為數(shù)字內(nèi)容生產(chǎn)帶來巨大變革。AI大模型和開放平臺為文娛創(chuàng)作提供技術(shù)支撐隨著各類AI大模型及支持開發(fā)者創(chuàng)作的各類AI開源平臺的陸續(xù)上線，用戶可以獲取涵蓋開源模型API、高質(zhì)量中文數(shù)據(jù)集、模型訓(xùn)練代碼、推理代碼、應(yīng)用代碼、面向AI芯片的模型移植開發(fā)等內(nèi)容的多場景服務(wù)。

大模型開放平臺的出現(xiàn)極大地降低了文娛類AI應(yīng)用的開發(fā)門檻，即使是幾乎沒有任何編程經(jīng)驗的文娛創(chuàng)作者，通過在平臺上進(jìn)行簡單學(xué)習(xí)，也可以快速實現(xiàn)文娛類AI應(yīng)用的開發(fā)。AI大模型和AI開源平臺作為智算中心算法基建化的重要構(gòu)成，配合其強大的算力資源，將為創(chuàng)作者打造一片創(chuàng)作的樂土。

（三）智慧科研

AI技術(shù)成為繼計算機(jī)之后，科學(xué)家新的生產(chǎn)工具，并催生出了新的科研范式AI for Science?？茖W(xué)家們用AI技術(shù)去學(xué)習(xí)科學(xué)原理，根據(jù)實驗或者計算產(chǎn)生的數(shù)據(jù)對所求解的科學(xué)問題進(jìn)行建模，從而使復(fù)雜問題得到有效解決。近年來，AI也被證明能用來做規(guī)律發(fā)現(xiàn)，幫助人類從大量的復(fù)雜數(shù)據(jù)中，抽取一些人類觀察不到的高維信息和高價值規(guī)律，不僅在應(yīng)用科學(xué)領(lǐng)域，也能在自然科學(xué)領(lǐng)域發(fā)揮作用。AI for Science 不僅帶來了科研效率的顯著提升，還能降低科研成本，讓更多人都能參與到科學(xué)研究中來。

1．生命科學(xué)

隨著大數(shù)據(jù)和人工智能的發(fā)展、普及和成熟，越來越多的科學(xué)研究從假設(shè)推動的范式向數(shù)據(jù)驅(qū)動的范式轉(zhuǎn)變，利用大數(shù)據(jù)和計算機(jī)技術(shù)挖掘科學(xué)洞見。在生命科學(xué)領(lǐng)域，通過采用深度學(xué)習(xí)方法處理海量數(shù)據(jù)，已經(jīng)在蛋白質(zhì)結(jié)構(gòu)預(yù)測等領(lǐng)域?qū)崿F(xiàn)了落地應(yīng)用。

蛋白質(zhì)作為生命活動的主要承擔(dān)者，長期以來都是生命科學(xué)工作者研究的重點，其中確定蛋白質(zhì)的三維空間結(jié)構(gòu)尤為重要。受困于計算量龐大、計算準(zhǔn)確度有限，蛋白質(zhì)三維結(jié)構(gòu)預(yù)測領(lǐng)域近年來進(jìn)展較為緩慢。

采用傳統(tǒng)的冷凍電鏡三維重構(gòu)方法，實驗儀器昂貴，且圖像重構(gòu)需要耗費大量計算力，而采用傳統(tǒng)的分子動力學(xué)結(jié)構(gòu)預(yù)測計算方案，在平均10300的搜索空間枚舉蛋白質(zhì)的可能構(gòu)型，需要極高的算力和漫長的計算時間，因此在過去50年的時間，僅有17%的人類蛋白質(zhì)組得到結(jié)構(gòu)解析。

在智能算力的支持下，DeepMind開發(fā)了基于注意力機(jī)制深度神經(jīng)網(wǎng)絡(luò)的AlphaFold2模型，通過對當(dāng)前已經(jīng)測序的數(shù)十萬蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)和數(shù)百萬蛋白質(zhì)序列數(shù)據(jù)進(jìn)行學(xué)習(xí)，實現(xiàn)了端到端直接預(yù)測蛋白質(zhì)的三維結(jié)構(gòu)，并取得了突破性進(jìn)展，預(yù)測結(jié)果準(zhǔn)確率達(dá)到了92.4%。相較于使用費用高昂的實驗儀器，單個蛋白結(jié)構(gòu)的預(yù)測時間縮短到了分鐘級。AlphaFold2的開發(fā)是以巨量算力為支撐，具體來說，其訓(xùn)練數(shù)據(jù)準(zhǔn)備消耗了約2億核時的CPU算力，訓(xùn)練過程消耗了約300PD的AI算力。

2．大規(guī)模分子模擬

分子動力學(xué)模擬通過求解原子運動的經(jīng)典力學(xué)牛頓方程對相空間進(jìn)行采樣，可以研究體系在相空間的演化過程，還可以通過統(tǒng)計方法得到體系在非零溫度下的各種性質(zhì)，是當(dāng)前材料和生物化學(xué)領(lǐng)域最常用的計算研究方法之一。

近年來，借助神經(jīng)網(wǎng)絡(luò)從大量數(shù)據(jù)中獲得規(guī)律的優(yōu)勢，將第一性原理計算結(jié)果作為訓(xùn)練數(shù)據(jù)，利用神經(jīng)網(wǎng)絡(luò)訓(xùn)練構(gòu)建勢函數(shù)的方法引起了廣泛的關(guān)注。該系列方法從上世紀(jì)90年代開始，經(jīng)過二十多年的發(fā)展，在準(zhǔn)確性、可擴(kuò)展性等方面得到了提升，比較常用的方法有DeePMD、SchNet、GAP、MTP等。

2020年深度勢能（DP）團(tuán)隊因“結(jié)合分子建模、機(jī)器學(xué)習(xí)和高性能計算相關(guān)方法，將具有從頭算精度的分子動力學(xué)模擬的極限提升至1億個原子規(guī)?！保瑪孬@了當(dāng)年的戈登·貝爾獎（Gordon Bell Prize）。原子間機(jī)器學(xué)習(xí)勢函數(shù)已經(jīng)應(yīng)用于許多實際研究中，可以用于模擬復(fù)雜的、多元素的晶體、非晶、液晶、界面、缺陷和摻雜等實驗體系，計算精度接近從頭算，計算速度卻可以比從頭算快數(shù)百到上千倍。

3．?dāng)?shù)值計算

矩陣乘法是許多計算任務(wù)的核心，其中包括神經(jīng)網(wǎng)絡(luò)、3D圖形和數(shù)據(jù)壓縮等。因此，提高矩陣乘法效率將直接作用于許多應(yīng)用。幾個世紀(jì)以來，數(shù)學(xué)家認(rèn)為標(biāo)準(zhǔn)矩陣乘法算法是效率最高的算法，但在1969年，德國數(shù)學(xué)家Volken Strassen通過研究非常小的矩陣（大小為2x2）證明確實存在更好的算法。然而，更大矩陣相乘的高效算法仍屬于尚未攻克的難題。

DeepMind的最新研究探討了現(xiàn)代AI技術(shù)——強化學(xué)習(xí)如何推動新矩陣乘法算法的自動發(fā)現(xiàn)?；舅悸肥菍l(fā)現(xiàn)矩陣乘法高效算法的問題轉(zhuǎn)換為單人游戲，然后訓(xùn)練一個基于強化學(xué)習(xí)的智能體 AlphaTensor 來玩這個游戲，通過對 AlphaTensor進(jìn)行調(diào)整，專門用以發(fā)現(xiàn)在給定硬件（如 NVIDIA V100 GPU、Google TPU v2）上運行速度快的算法。實驗結(jié)果發(fā)現(xiàn)，這些算法在相同硬件上進(jìn)行大矩陣相乘的速度比常用算法快了10-20%，表明AlphaTensor在優(yōu)化任意目標(biāo)方面具備了不錯的靈活性。因此，強化學(xué)習(xí)成為加速新矩陣乘法算法自動發(fā)現(xiàn)的一種新思路。

從算力需求看，蛋白質(zhì)結(jié)構(gòu)分析、大規(guī)模分子模擬、數(shù)值計算相關(guān)應(yīng)用主要涉及海量數(shù)據(jù)并行計算和大規(guī)模模擬實驗，對算力和存力需求較高，屬于計算密集型和數(shù)據(jù)密集型任務(wù)。智算中心所具備的算力服務(wù)能力極度契合AI for Science相關(guān)場景的算力需求，將成為支撐科研高質(zhì)量、突破式發(fā)展的重要基礎(chǔ)設(shè)施。

建設(shè)篇

從建設(shè)用途來看，智算中心除充分考慮其普惠性、開放性和集約性外，核心是以高質(zhì)量、低成本、高性能的AI算力來支撐產(chǎn)業(yè)創(chuàng)新、城市發(fā)展中的各項智能服務(wù)。智算中心建設(shè)以總體規(guī)劃、政企協(xié)同、需求牽引為宗旨，聚焦先進(jìn)的技術(shù)和適配典型場景。同時，以智算中心建設(shè)和應(yīng)用帶動人工智能產(chǎn)業(yè)集群的匯聚，吸引數(shù)字化人才，激發(fā)人工智能產(chǎn)業(yè)的創(chuàng)新活力，推動人工智能產(chǎn)業(yè)和區(qū)域經(jīng)濟(jì)的可持續(xù)發(fā)展。

一、建設(shè)類型與策略

智算中心建設(shè)并非簡單做好基建即可，還需結(jié)合建設(shè)基礎(chǔ)、當(dāng)?shù)鼗騾^(qū)域產(chǎn)業(yè)特色，以差異化算力需求為導(dǎo)向，分類引導(dǎo)施策，優(yōu)化建設(shè)方式，改建并行，發(fā)展與數(shù)字經(jīng)濟(jì)相適應(yīng)的智算中心。

（一）建設(shè)原則

政府引導(dǎo)，需求牽引。以政府側(cè)和市場側(cè)實際需求為牽引，以高標(biāo)準(zhǔn)建設(shè)、可持續(xù)發(fā)展為路徑，改造存量與優(yōu)化增量協(xié)同推進(jìn)，引導(dǎo)龍頭企業(yè)建設(shè)高附加值、產(chǎn)業(yè)鏈帶動效應(yīng)明顯的重點項目。

開放多元、培育生態(tài)。以開放計算為核心，以多元算力融合為方向，推進(jìn)智算產(chǎn)業(yè)核心關(guān)鍵技術(shù)的研發(fā)標(biāo)準(zhǔn)化、產(chǎn)業(yè)化和應(yīng)用迭代。加強對智算中心關(guān)鍵軟硬件產(chǎn)品的研發(fā)支持和大規(guī)模應(yīng)用推廣，突破關(guān)鍵核心技術(shù)，提升智能算力全產(chǎn)業(yè)鏈自主創(chuàng)新能力。

普適普惠、創(chuàng)新發(fā)展。以融合架構(gòu)計算系統(tǒng)為平臺，以數(shù)據(jù)為資源，以強大的計算力驅(qū)動AI模型對數(shù)據(jù)進(jìn)行深度加工，使智能算力可以像水電一樣,成為社會基本公共服務(wù),面向城市各領(lǐng)域應(yīng)用提供高品質(zhì)智算服務(wù)。

集約高效、節(jié)能降碳。堅持集約化、規(guī)?；ㄔO(shè)方向，加快節(jié)能低碳技術(shù)研發(fā)應(yīng)用，提升可再生能源利用率，應(yīng)用節(jié)能新技術(shù)，減少碳排放，推進(jìn)智算中心綠色、高質(zhì)量發(fā)展。

（二）依據(jù)建設(shè)方式分類建設(shè)

1.新建智算中心

（1）建設(shè)條件

面向京津冀、長三角、粵港澳大灣區(qū)、成渝，以及貴州、內(nèi)蒙古、甘肅、寧夏等全國一體化算力網(wǎng)絡(luò)國家樞紐節(jié)點和數(shù)據(jù)中心集群，以及人工智能產(chǎn)業(yè)領(lǐng)域應(yīng)用場景多元和科教資源豐富的優(yōu)勢地區(qū)，建設(shè)智算中心，以智算中心為牽引推動人工智能領(lǐng)域創(chuàng)新要素集聚，打造人工智能產(chǎn)業(yè)生態(tài)圈。新建智算中心作為新型公共算力基礎(chǔ)設(shè)施和賦能平臺，應(yīng)支撐國家和區(qū)域內(nèi)重要需求、科研創(chuàng)新和戰(zhàn)略任務(wù)落地，為AI大模型訓(xùn)練、自動駕駛、生物工程、智能制造、數(shù)字孿生、空間地理等人工智能探索應(yīng)用提供強大的智能算力服務(wù)，通過智能算力服務(wù)賦能產(chǎn)業(yè)升級，帶動區(qū)域經(jīng)濟(jì)發(fā)展。

（2）建設(shè)方式與策略

加快梯次布局，打造一批城市級智算中心。對于產(chǎn)業(yè)智能化發(fā)展需求迫切、人工智能產(chǎn)業(yè)集聚的地區(qū)，可新建圍繞人工智能產(chǎn)業(yè)需求設(shè)計、為人工智能提供專門服務(wù)的智算中心，按照適度超前原則配置優(yōu)質(zhì)算力資源，提供兼具公有、專用、彈性計算的服務(wù)能力，滿足不同應(yīng)用場景和多類型用戶的需求，面向當(dāng)?shù)仄髽I(yè)、科研院所等提供科研創(chuàng)新、人才培養(yǎng)、應(yīng)用孵化、產(chǎn)業(yè)發(fā)展等服務(wù)，打造“易用”“好用”的智算中心。

強化普惠智能算力高質(zhì)量供給，降低算力使用門檻，推動智能算力服務(wù)與物聯(lián)網(wǎng)和區(qū)塊鏈等技術(shù)融合創(chuàng)新，打造具有地方特色服務(wù)本地輻射周邊的智算中心。加強場景賦能，按需建設(shè)專業(yè)型智算中心。開展面向性能、價格、效益等多方面的測算，形成應(yīng)用需求供給和可持續(xù)的長效動力機(jī)制，加快重點行業(yè)的智算中心建設(shè)，圍繞智能經(jīng)濟(jì)、智能社會、科研活動、國家重大活動和重大工程等領(lǐng)域的人工智能創(chuàng)新應(yīng)用場景，加強供需對接，打造特色場景智算中心，發(fā)揮倍增效應(yīng)，做大做強形成規(guī)?；瘧?yīng)用，帶動人工智能和相關(guān)產(chǎn)業(yè)發(fā)展。

2.已建數(shù)據(jù)中心升級

（1）建設(shè)條件

面向北京、上海、廣州以及東部經(jīng)濟(jì)發(fā)達(dá)、人口密度大，對數(shù)據(jù)要素的產(chǎn)生、存儲和處理需求高，但面臨地區(qū)能耗指標(biāo)緊張、電力成本高、大規(guī)模數(shù)據(jù)中心開發(fā)空間受限等問題的地區(qū)，對已建數(shù)據(jù)中心進(jìn)行智能化改造，推動傳統(tǒng)數(shù)據(jù)中心向綠色高效、智能集約轉(zhuǎn)型升級。改造升級后的智算中心應(yīng)優(yōu)先滿足國家及當(dāng)?shù)卣?wù)服務(wù)、重大項目及重點實驗室的熱數(shù)據(jù)處理和匯聚需求，保障城市基本運行和高效治理需求，保障金融、通信、互聯(lián)網(wǎng)等戰(zhàn)略性行業(yè)數(shù)據(jù)匯集和實時響應(yīng)計算需求，保障科技賦能和產(chǎn)業(yè)創(chuàng)新高性能算力需求。

（2）建設(shè)方式與策略

以“以舊換新、增減替代”為原則，對已建存量數(shù)據(jù)中心進(jìn)行改造升級，加強AI和傳統(tǒng)計算的融合。重點將一些冷數(shù)據(jù)、靜態(tài)備份數(shù)據(jù)為主的存儲類數(shù)據(jù)中心，替換為支撐數(shù)字經(jīng)濟(jì)、人工智能、區(qū)塊鏈、工業(yè)互聯(lián)網(wǎng)等前沿產(chǎn)業(yè)發(fā)展的智算中心。適度利用關(guān)閉及騰退的其他老舊落后的自用型數(shù)據(jù)中心、存儲型數(shù)據(jù)中心、容災(zāi)備份中心資源和空間，升級改造為支撐低時延業(yè)務(wù)應(yīng)用，服務(wù)智慧城市、車聯(lián)網(wǎng)等重點應(yīng)用場景落地。

加快傳統(tǒng)數(shù)據(jù)中心節(jié)能低碳技術(shù)研發(fā)推廣，提升資源能源利用效率。智算中心具備高功率密度屬性，在制冷方面具有更高的要求。目前大多數(shù)AI服務(wù)器采用的仍是常規(guī)風(fēng)冷模式，部分超過30kW的數(shù)據(jù)中心采用液冷模式。隨著AI服務(wù)器功率密度的提升和使用場景的增多，需要在推動已建老舊小散數(shù)據(jù)中心向規(guī)?；瘮?shù)據(jù)中心集群或智能化計算中心轉(zhuǎn)型升級基礎(chǔ)上，逐步推廣液冷技術(shù)的應(yīng)用，促進(jìn)全產(chǎn)業(yè)鏈綠色低碳有序發(fā)展，助力國民經(jīng)濟(jì)各行業(yè)整體實現(xiàn)“碳達(dá)峰、碳中和”的輻射帶動作用。

（三）依據(jù)功能定位分類建設(shè)

1．產(chǎn)業(yè)合作平臺

（1）建設(shè)條件

面向絕大多數(shù)無法承擔(dān)自建智算中心和獨立運營費用的企業(yè)，由政府主導(dǎo)，通過統(tǒng)一建設(shè)高性能、大規(guī)模的智算中心，并以租賃形式為有需求的企業(yè)提供算力支撐，省去企業(yè)投資建設(shè)和運營費用。通過平臺開放接口的方式，鼓勵行業(yè)領(lǐng)軍企業(yè)將開源的算法、開放的數(shù)據(jù)資源及運營服務(wù)等創(chuàng)新要素輸送給IT基礎(chǔ)相對薄弱的企業(yè)，進(jìn)一步降低人工智能使用門檻，助力各行業(yè)智慧化轉(zhuǎn)型升級。

（2）建設(shè)方式與策略

借助ICT基礎(chǔ)設(shè)施企業(yè)物理設(shè)施建設(shè)優(yōu)勢，通過承建智算中心，搭建產(chǎn)業(yè)合作平臺，集成最新的人工智能加速芯片和存儲介質(zhì)等，使其成為各新興計算單元進(jìn)行大規(guī)模融合的重要載體，從需求側(cè)刺激硬件重構(gòu)和軟件定義等融合架構(gòu)技術(shù)創(chuàng)新發(fā)展。通過推進(jìn)平臺、框架和算法的協(xié)同優(yōu)化，打通人工智能軟硬件產(chǎn)業(yè)鏈，打造人工智能算力技術(shù)和產(chǎn)業(yè)生態(tài)。依托人工智能行業(yè)領(lǐng)域企業(yè)的專精優(yōu)勢，通過成立合資公司等形式參與智算中心建設(shè)和運營，借助智算中心平臺擴(kuò)大自有生態(tài)優(yōu)勢。

2．產(chǎn)業(yè)園區(qū)

（1）建設(shè)條件

面向各地方政府以云計算、大數(shù)據(jù)、智慧城市、虛擬現(xiàn)實、人工智能、區(qū)塊鏈等技術(shù)應(yīng)用為核心發(fā)展方向的頂層規(guī)劃布局，圍繞利用新一代信息技術(shù)對農(nóng)業(yè)、工業(yè)、服務(wù)業(yè)進(jìn)行全方位、全角度、全鏈條的數(shù)字化改造升級需求，通過合力打造面向未來的智算中心、智算產(chǎn)業(yè)促進(jìn)中心等產(chǎn)業(yè)配套載體，構(gòu)建“產(chǎn)業(yè)+配套、平臺+生態(tài)、數(shù)字+賦能”數(shù)字產(chǎn)業(yè)生態(tài)，吸引相關(guān)技術(shù)企業(yè)落戶本地，逐步促進(jìn)產(chǎn)業(yè)集群規(guī)?；l(fā)展，立足本地，輻射帶動周邊，推動數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展。

（2）建設(shè)方式與策略

根據(jù)城市規(guī)模和產(chǎn)業(yè)發(fā)展定位的需求，以及經(jīng)濟(jì)社會發(fā)展等因素，由政府為主導(dǎo)，與企業(yè)開展合作，以智算中心項目為依托，建設(shè)配套產(chǎn)業(yè)園區(qū)和人才培養(yǎng)平臺等，分類給予針對性的優(yōu)惠政策，吸引人工智能及其相關(guān)領(lǐng)域企業(yè)和人才向智算產(chǎn)業(yè)園區(qū)聚集。針對重點行業(yè)的特色應(yīng)用開展試點示范，形成一批可推廣的典型應(yīng)用創(chuàng)新模式。引導(dǎo)有智算需求的企業(yè)積極接入智算中心，使用智算中心服務(wù)，加速企業(yè)集聚和數(shù)據(jù)共享。

政府根據(jù)智算中心運營的特點進(jìn)行規(guī)劃與開發(fā)，并在此基礎(chǔ)上為園區(qū)提供政策支持、稅收優(yōu)惠等，加快應(yīng)用落地，引領(lǐng)塑造產(chǎn)業(yè)生態(tài)。

二、建設(shè)運營模式

為保證智算中心所釋放的經(jīng)濟(jì)社會效益最大化，需要選擇合理的建設(shè)和運營模式，保證智算中心的公共屬性，實現(xiàn)長效運營，促進(jìn)有序布局。

（一）主流建設(shè)模式

在全國一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系構(gòu)建背景下，地方政府、產(chǎn)業(yè)園區(qū)、企業(yè)等紛紛將智算中心作為培育人工智能產(chǎn)業(yè)生態(tài)、提升數(shù)字經(jīng)濟(jì)能級的有力工具，常見的建設(shè)模式包括三種。

1．獨立投資建設(shè)模式

一是政府獨立投資建設(shè)。政府對建設(shè)項目進(jìn)行直接投資和管理，建設(shè)資金主要來自地方政府財政資金、專項債券發(fā)行等，建設(shè)完成后智算中心所有權(quán)歸政府所有。出于促進(jìn)產(chǎn)業(yè)發(fā)展、優(yōu)化產(chǎn)業(yè)服務(wù)的考慮，不同規(guī)模的產(chǎn)業(yè)園區(qū)日益成為智算中心的投資主體，由園區(qū)管委會出資建設(shè)智算中心。

二是企業(yè)獨立投資建設(shè)。主要由企業(yè)聯(lián)盟、少數(shù)企業(yè)聯(lián)合、單獨企業(yè)等形式進(jìn)行投資，旨在服務(wù)于特定產(chǎn)業(yè)發(fā)展和特定場景應(yīng)用。部分負(fù)責(zé)投資的企業(yè)可以同時作為智算中心的建設(shè)方，部分負(fù)責(zé)投資的企業(yè)需要聯(lián)合專業(yè)化建設(shè)企業(yè)進(jìn)行施工。該模式雖然由企業(yè)出資，但是考慮到智算中心的高投入、對于地方經(jīng)濟(jì)發(fā)展的高影響等因素，應(yīng)緊密配合國家“東數(shù)西算”工程、全國一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系等建設(shè)指引。

三是高?；蚩蒲袡C(jī)構(gòu)獨立投資建設(shè)。主要由高校、科研院所、國家實驗室等進(jìn)行投資，建設(shè)一般以智能計算平臺為主，服務(wù)場景相對單一，建設(shè)成本比智算中心小。平臺可以向師生、研究人員提供免費的算力支撐，服務(wù)于科研教育場景，高校和各類科研機(jī)構(gòu)的科研資源疊加智能算力，為基礎(chǔ)研究、前沿科學(xué)技術(shù)研究提供支持。

2．由第三方出資的建設(shè)模式智算中心建設(shè)的第三方一般為國有控股企業(yè)。該模式下，既實現(xiàn)了政府對項目的建設(shè)全過程把控和需求的充分對接，還能有效利用相關(guān)國有控股公司已有的科技、人力資本、平臺資源、市場等優(yōu)勢。智算中心建成后歸第三方公司所有，可以由政府承諾用其他項目進(jìn)行補貼或者置換。具體細(xì)分為兩類。一種是由地方政府成立新的國有控股公司，專門負(fù)責(zé)智算中心的建設(shè)投資，另一種由地方政府委托或者授權(quán)已有的國有控股公司負(fù)責(zé)出資。

3．基于特殊項目公司的建設(shè)運營（SPV）模式

政府與企業(yè)共同出資成立智算中心建設(shè)運營項目公司，雙方在合作框架協(xié)議下按比例出資建設(shè)智算中心。政府既可以直接投資參與項目建設(shè)，也可以通過國有控股公司、下屬事業(yè)單位等參與項目建設(shè)。項目公司需要由政府授權(quán)，按照公司化方式獨立運作，負(fù)責(zé)設(shè)計、融資、建造和運營等，向政府、企業(yè)提供服務(wù)或產(chǎn)品并收取費用。該模式優(yōu)勢在于能夠節(jié)約政府部門的項目建設(shè)成本，實現(xiàn)建設(shè)資金籌集，同時啟用了專業(yè)化建設(shè)團(tuán)隊，項目管理方式靈活多樣，在項目設(shè)計、建設(shè)和運營中效率較高。

（二）主流運營服務(wù)模式

智算中心出現(xiàn)時間尚短，其運營模式極具探索性，可按照運營方、服務(wù)類型、服務(wù)內(nèi)容三方面分析。

1．運營方選擇

運營主體指具體負(fù)責(zé)智算中心投入建設(shè)使用后的運營服務(wù)機(jī)構(gòu)。與投資主體相比，智算中心運營主體類型應(yīng)更加多元，運營模式也更為靈活，各類主體通過積極探索差異化個性化運營服務(wù)模式保障智算中心高效穩(wěn)定運行。

一種方式為“投-運”一體化，即由項目投資方出資成立實體運營公司，負(fù)責(zé)管理算力服務(wù)和生態(tài)服務(wù)。團(tuán)隊成員一般包括運營公司自身管理職能部門，算力服務(wù)營銷人員、技術(shù)支持工程師等算力建設(shè)方人員等組成。

一種方式是“投-建”合作模式，即由投資方和承建方共同成立新公司，專職負(fù)責(zé)算力的運營和對外服務(wù)等。該模式下，可以形成投資方和建設(shè)方的運營聯(lián)合，實現(xiàn)運營風(fēng)險共擔(dān)，特別是考慮到智算中心后期維護(hù)存在一定的技術(shù)門檻，在此種方式下，可以保證運營的專業(yè)性和高產(chǎn)出。

另一種方式是“建-運”一體化，以承建方主要負(fù)責(zé)運營。具體由承建方成立運營公司，專職負(fù)責(zé)算力運營和對外服務(wù)?？紤]到這種模式下由承建方單獨承擔(dān)運營風(fēng)險，可以由政府給予運營費用補貼，為了約束運營公司經(jīng)營行為，可由政府對運營公司進(jìn)行算力利用率等指標(biāo)的考核。運營收入收益可以由運營方和政府部門共享。

2．運營服務(wù)類型

隨著人工智能產(chǎn)業(yè)不斷壯大，應(yīng)用場景的持續(xù)創(chuàng)新，智算中心逐漸走向市場化，服務(wù)對象日益多元。一是綜合型。以地方政府建設(shè)為主，服務(wù)于產(chǎn)業(yè)發(fā)展、科學(xué)研究、公共服務(wù)等多元場景。該類型一般由地方政府主導(dǎo)建設(shè)，有效發(fā)揮了智算中心的公共屬性。

二是服務(wù)于產(chǎn)業(yè)發(fā)展。多由產(chǎn)業(yè)園區(qū)或龍頭企業(yè)、企業(yè)聯(lián)盟主導(dǎo)建設(shè)，主要服務(wù)于園區(qū)及企業(yè)的發(fā)展，為人工智能產(chǎn)業(yè)向更深更廣行業(yè)應(yīng)用發(fā)展提供算力保障。

三是服務(wù)于科學(xué)研究。該類型多由高校、科研院所、國家實驗室等承擔(dān)建設(shè)，以投資較低的智能計算平臺為主，主要是為高校師生、科研人員的科研工作提供算力、算法等支撐。

3．運營服務(wù)內(nèi)容

提供數(shù)據(jù)服務(wù)。

智算中心作為專門服務(wù)于人工智能的數(shù)據(jù)中心，可以為服務(wù)購買方提供多元化的數(shù)據(jù)服務(wù)，例如數(shù)據(jù)存儲、數(shù)據(jù)清洗、數(shù)據(jù)分析、數(shù)據(jù)查詢、數(shù)據(jù)可視化等。該服務(wù)屬于智算中心的基礎(chǔ)性服務(wù)。提供算力服務(wù)。服務(wù)購買方無需關(guān)注底層算力芯片和技術(shù)細(xì)節(jié)，只需要把計算過程看作“黑箱”，通過選擇業(yè)務(wù)場景、算法模型等，獲取服務(wù)方案。政府部門、企業(yè)、研究機(jī)構(gòu)可以依托智算中心提供的強大算力，驅(qū)動AI模型進(jìn)行數(shù)據(jù)深度加工，實現(xiàn)AI應(yīng)用創(chuàng)新。提供算法服務(wù)。人工智能以算法作為靈魂，算法同樣是

智算中心的主要服務(wù)產(chǎn)品。

隨著技術(shù)的持續(xù)精進(jìn)和場景的持續(xù)拓展，人工智能的算法日趨復(fù)雜，面臨模型訓(xùn)練成本和技術(shù)門檻“雙高”的問題。在算法服務(wù)模式下，有利于購買服務(wù)方專注于自身領(lǐng)域的業(yè)務(wù)邏輯和數(shù)據(jù)，依托智算中心提供的語音、圖像、自然語言處理、決策等領(lǐng)域的算法能力，創(chuàng)新智慧應(yīng)用。

提供生態(tài)服務(wù)。

通過智算中心對外提供算力、數(shù)據(jù)和算法服務(wù)，實現(xiàn)了不同主體的線上匯聚，有利于打造開放、共享的生態(tài)，實現(xiàn)多方融合性、深度化合作探索。同時圍繞購買服務(wù)方的共性需求，智算中心的運營主體和技術(shù)團(tuán)隊可以發(fā)掘研判行業(yè)動態(tài)和用戶需求，提升智算中心的共性支撐能力，引領(lǐng)探索新的業(yè)務(wù)場景，構(gòu)筑新的產(chǎn)業(yè)和生產(chǎn)力。