一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

國內(nèi)超大型智能算力中心建設(shè)白皮書 2024

 非著名問天 2024-04-06
智算中心建設(shè)通過領(lǐng)先的體系架構(gòu)設(shè)計,以算力基建化為主體、以算法基建化為引領(lǐng)、以服務(wù)智件化為依托,以設(shè)施綠色化為支撐,從基建、硬件、軟件、算法、服務(wù)等全環(huán)節(jié)開展關(guān)鍵技術(shù)落地與應(yīng)用。
一、體系架構(gòu)
(一)總體架構(gòu)
圖片
圖8 智算中心總體架構(gòu)
智能算力中心建設(shè)白皮書,重點圍繞基礎(chǔ)、支撐、功能和目標(biāo)四大部分,創(chuàng)新性地提出了智算中心總體架構(gòu)。
其中,基礎(chǔ)部分是支撐智算中心建設(shè)與應(yīng)用的先進(jìn)人工智能理論和計算架構(gòu);支撐部分圍繞智算中心算力生產(chǎn)、聚合、調(diào)度、釋放的作業(yè)邏輯展開;功能部分提供算力生產(chǎn)供應(yīng)、數(shù)據(jù)開放共享、智能生態(tài)建設(shè)和產(chǎn)業(yè)創(chuàng)新聚集四大平臺,以及數(shù)據(jù)、算力和算法三大服務(wù);整體目標(biāo)是促進(jìn)AI產(chǎn)業(yè)化、產(chǎn)業(yè)AI化及政府治理智能化。
(二)技術(shù)演進(jìn)
智算中心的發(fā)展基于最新人工智能理論和領(lǐng)先的人工智能計算架構(gòu),算力技術(shù)與算法模型是其中的關(guān)鍵核心技術(shù),算力技術(shù)以AI芯片、AI服務(wù)器、AI集群為載體,而當(dāng)前的算法模型發(fā)展趨勢以AI大模型為代表。
在此基礎(chǔ)上,通過智算中心操作系統(tǒng)作為智算中心的“神經(jīng)中樞”對算力資源池進(jìn)行高效管理和智能調(diào)度,使智算中心更好地對外提供算力、數(shù)據(jù)和算法等服務(wù),支撐各類智慧應(yīng)用場景落地。而軟件生態(tài)則是智算中心“好用、用好”的關(guān)鍵支撐。
1.AI芯片
基于AI芯片的加速計算是當(dāng)前AI計算的主流模式。AI芯片通過和AI算法的協(xié)同設(shè)計來滿足AI計算對算力的超高需求。當(dāng)前主流的AI加速計算主要是采用CPU系統(tǒng)搭載GPU、FPGA、ASIC等異構(gòu)加速芯片。
AI計算加速芯片發(fā)端于GPU芯片,GPU芯片中原本為圖形計算設(shè)計的大量算術(shù)邏輯單元(ALU)可對以張量計算為主的深度學(xué)習(xí)計算提供很好的加速效果。隨著GPU芯片在AI計算加速中的應(yīng)用逐步深入,GPU芯片本身也根據(jù)AI的計算特點,進(jìn)行了針對性的創(chuàng)新設(shè)計,如張量計算單元、TF32/BF16數(shù)值精度、Transformer引擎(Transformer Engine)等。
近年來,國產(chǎn)AI加速芯片廠商持續(xù)發(fā)力,在該領(lǐng)域取得了快速進(jìn)展,相關(guān)產(chǎn)品陸續(xù)發(fā)布,覆蓋了AI推理和AI訓(xùn)練需求,其中既有基于通用GPU架構(gòu)的芯片,也有基于ASIC架構(gòu)的芯片,另外也出現(xiàn)了類腦架構(gòu)芯片,總體上呈現(xiàn)出多元化的發(fā)展趨勢。但是,當(dāng)前國產(chǎn)AI芯片在產(chǎn)品性能和軟件生態(tài)等方面與國際領(lǐng)先水平還存在差距,亟待進(jìn)一步完善加強??傮w而言,國產(chǎn)AI芯片正在努力從“可用”走向“好用”。
2.AI服務(wù)器
AI服務(wù)器是智算中心的算力機(jī)組。當(dāng)前AI服務(wù)器主要采用CPU+AI加速芯片的異構(gòu)架構(gòu),通過集成多顆AI加速芯片實現(xiàn)超高計算性能。
為滿足各領(lǐng)域場景和復(fù)雜的AI模型的計算需求,AI服務(wù)器對計算芯片間互聯(lián)、擴(kuò)展性有極高要求。AI服務(wù)器內(nèi)基于特定協(xié)議進(jìn)行多加速器間高速互聯(lián)通信已成為高端AI訓(xùn)練服務(wù)器的標(biāo)準(zhǔn)架構(gòu)。
目前業(yè)界以NVLink和OAM兩種高速互聯(lián)架構(gòu)為主,其中NVLink是NVIDIA開發(fā)并推出的一種私有通信協(xié)議,其采用點對點結(jié)構(gòu)、串列傳輸,可以達(dá)到數(shù)百GB/s的P2P互聯(lián)帶寬,極大地提升了模型并行訓(xùn)練的效率和性能。
OAM是國際開放計算組織OCP定義的一種開放的、用于跨AI加速器間的高速通信互聯(lián)協(xié)議,卡間互聯(lián)聚合帶寬可高達(dá)896GB/s。

浪潮信息基于開放OAM架構(gòu)研發(fā)的AI服務(wù)器NF5498,率先完成與國際和國內(nèi)多家AI芯片產(chǎn)品的開發(fā)適配,并已在多個智算中心實現(xiàn)大規(guī)模落地部署。
3.AI集群
大模型參數(shù)量和訓(xùn)練數(shù)據(jù)復(fù)雜性快速增長,對智算系統(tǒng)提出大規(guī)模算力擴(kuò)展需求。通過充分考慮大模型分布式訓(xùn)練對于計算、網(wǎng)絡(luò)和存儲的需求特點,可以設(shè)計構(gòu)建高性能可擴(kuò)展、高速互聯(lián)、存算平衡的AI集群來滿足尖端的AI計算需求。
AI集群采用模塊化方法構(gòu)建,可以實現(xiàn)大規(guī)模的算力擴(kuò)展。AI集群的基本算力單元是AI服務(wù)器。數(shù)十臺AI服務(wù)器可以組成單個POD計算模組,POD內(nèi)部通過多塊支持RDMA技術(shù)的高速網(wǎng)卡連接。在此基礎(chǔ)上以POD計算模組為單位實現(xiàn)橫向擴(kuò)展,規(guī)??啥噙_(dá)數(shù)千節(jié)點以上,從而實現(xiàn)更高性能的AI集群。
AI集群的構(gòu)建主要采用低延遲、高帶寬的網(wǎng)絡(luò)互連。為了滿足大模型訓(xùn)練常用的數(shù)據(jù)并行、模型并行、流水線并行等混合并行策略的通信需求,需要為芯片間和節(jié)點間提供低延遲、高帶寬的互聯(lián)。另外,還要針對大模型的并行訓(xùn)練算法通信模式做出相應(yīng)的組網(wǎng)拓?fù)渖系膬?yōu)化,比如對于深度學(xué)習(xí)常用的全局梯度歸約通信操作,可以使用全局環(huán)狀網(wǎng)絡(luò)設(shè)計,配置多塊高速網(wǎng)卡,實現(xiàn)跨AI服務(wù)器節(jié)點的AI芯片間RDMA互聯(lián),消除混合并行算法的計算瓶頸。
AI集群的構(gòu)建需要配置面向AI優(yōu)化的高速存儲。通過配置高性能、高擴(kuò)展、多層級的智能存儲,為各種數(shù)據(jù)訪問需求提供優(yōu)化性能。智能存儲具備隨需擴(kuò)展功能,實現(xiàn)高IOPS處理能力,支持RDMA技術(shù),同時實現(xiàn)高聚合帶寬。
4.AI大模型
超大規(guī)模智能模型,簡稱大模型,是近年興起的一種新的人工智能計算范式。和傳統(tǒng)AI模型相比,大模型的訓(xùn)練使用了更多的數(shù)據(jù),具有更好的泛化性,可以應(yīng)用到更廣泛的下游任務(wù)中。按照應(yīng)用場景劃分,AI大模型主要包括語言大模型、視覺大模型和多模態(tài)大模型等。
自然語言處理是首個應(yīng)用大模型的領(lǐng)域,BERT是大模型的早期代表。隨著大模型在自然語言的理解和生成領(lǐng)域成功應(yīng)用,推動了語言大模型向更大的模型參數(shù)規(guī)模和更大訓(xùn)練數(shù)據(jù)規(guī)模的方向發(fā)展。當(dāng)前,語言大模型的單體模型參數(shù)已經(jīng)達(dá)到千億級別,訓(xùn)練數(shù)據(jù)集規(guī)模也達(dá)到了TB級別,訓(xùn)練所需計算資源超過1000PetaFlop/s-day(PD)。業(yè)界典型的自然語言大模型有GPT-4、源、悟道和文心等。自然語言大模型已經(jīng)廣泛應(yīng)用于個人知識管理、輿情檢測、商業(yè)報告生成、金融反欺詐、智能客服、虛擬數(shù)字人等場景,同時也出現(xiàn)了一系列的創(chuàng)新應(yīng)用場景,如劇本殺、反網(wǎng)絡(luò)詐騙、公文寫作等。
在語言大模型大獲成功之后,相關(guān)技術(shù)和方法也被引入計算機(jī)視覺領(lǐng)域,通過構(gòu)建更大的預(yù)訓(xùn)練模型,使其可以適用于目標(biāo)檢測、語義分割、異常檢測等廣泛的視覺任務(wù)。
在算法架構(gòu)上,視覺大模型采用以Transformer架構(gòu)為主體的神經(jīng)網(wǎng)絡(luò)架構(gòu)和自監(jiān)督的訓(xùn)練方法以及十億級的無標(biāo)注圖片數(shù)據(jù)進(jìn)行訓(xùn)練。當(dāng)前業(yè)界已經(jīng)出現(xiàn)了越來越多的通用視覺大模型和面向特定領(lǐng)域的視覺大模型。視覺大模型也已廣泛應(yīng)用于自動駕駛、智能安防、醫(yī)學(xué)影像等領(lǐng)域。
隨著大模型技術(shù)在語言、視覺等多個領(lǐng)域的應(yīng)用,融合多個模態(tài)的多模態(tài)大模型也逐漸成為了業(yè)界關(guān)注的重點。基于多模態(tài)大模型的以文生圖,文生視頻技術(shù)也迅速發(fā)展,代表性模型有DALLE-2、Stable Diffusion 3 和Sora等。由于多模態(tài)大模型的快速發(fā)展,AI內(nèi)容生成(AI Generated Content,AIGC)已成為下一個AI發(fā)展的重點領(lǐng)域。
5.智算OS
智算OS,即智算中心操作系統(tǒng),是以智算服務(wù)為對象,對智算中心基礎(chǔ)設(shè)施資源池進(jìn)行高效管理和智能調(diào)度的產(chǎn)品方案,可以使智算中心更好地對外提供算力、數(shù)據(jù)、算法、智件等服務(wù),有效降低算力使用門檻,提升資源調(diào)度效率,支撐各類智慧應(yīng)用場景落地,是智算中心的“中樞神經(jīng)”。

智算OS主要由三層架構(gòu)構(gòu)成,分別為基礎(chǔ)設(shè)施層、平臺服務(wù)層、業(yè)務(wù)系統(tǒng)層。基礎(chǔ)設(shè)施層主要實現(xiàn)將異構(gòu)算力、數(shù)據(jù)存儲、框架模型等轉(zhuǎn)化為有效的算力與服務(wù)資源,算力資源池能夠聚合并進(jìn)行標(biāo)準(zhǔn)化和細(xì)粒度切分,以滿足上層不同類型智能應(yīng)用對算力的多元化需求,并通過異構(gòu)資源管理和調(diào)度技術(shù),提升可同時支撐的智算業(yè)務(wù)規(guī)模。
平臺服務(wù)層主要提供AI訓(xùn)練與推理服務(wù)、數(shù)據(jù)治理服務(wù)、運營運維服務(wù)等,并通過智算OS實現(xiàn)自動化、智能化,有效擺脫人力束縛,促進(jìn)算力高效釋放并轉(zhuǎn)化為生產(chǎn)力。業(yè)務(wù)系統(tǒng)層是面向用戶端的統(tǒng)一服務(wù)入口,向下整合各層級核心功能,為用戶提供多元化、高質(zhì)量的智算服務(wù),滿足生產(chǎn)中不同階段、不同場景的智算需求。
智算OS以智算中心為載體,通過建設(shè)多元、開放的智算平臺,融合國際、國內(nèi)先進(jìn)人工智能技術(shù),形成標(biāo)準(zhǔn)化、模塊化的模型、中間件及應(yīng)用軟件,以開放接口、模型庫、算法包等方式向用戶提供如行業(yè)大模型、自動駕駛、元宇宙、智慧科研等人工智能服務(wù),促進(jìn)人工智能技術(shù)成果的開放與共享,構(gòu)建開放的智算生態(tài)。
6.軟件生態(tài)
基于業(yè)界主流、開源、開放的軟件生態(tài)建設(shè)智算中心,是智算中心能夠滿足前沿AI計算需求、提升AI創(chuàng)新和生產(chǎn)效率、豐富行業(yè)AI應(yīng)用、促進(jìn)AI產(chǎn)業(yè)快速發(fā)展的主要前提。深度學(xué)習(xí)的加速計算始于GPU,構(gòu)建于GPU之上的CUDA軟件棧為深度學(xué)習(xí)的算法開發(fā)提供了極大的便利。CUDA軟件棧為深度學(xué)習(xí)的應(yīng)用開發(fā)和計算加速提供了豐富的底層支撐,如張量和卷積計算加速、芯片互聯(lián)通信加速、數(shù)據(jù)預(yù)處理加速、模型低精度推理加速等。在此基礎(chǔ)上,學(xué)術(shù)界和工業(yè)界已經(jīng)構(gòu)建龐大的開源、開放、共享的AI軟件生態(tài),有力促進(jìn)和加速全球AI技術(shù)與應(yīng)用的蓬勃發(fā)展。
深度學(xué)習(xí)框架是當(dāng)前主要的人工智能算法開發(fā)工具。其中TensorFlow和PyTorch的使用較為廣泛。TensorFlow因其豐富的模型開發(fā)和應(yīng)用部署組件而在工業(yè)界廣泛應(yīng)用,PyTorch則由于其易用性和靈活性在前沿算法開發(fā)和學(xué)術(shù)創(chuàng)新研究領(lǐng)域取得了領(lǐng)先地位。國內(nèi)的AI科技公司也在開發(fā)和推廣深度學(xué)習(xí)框架。其中百度開發(fā)的飛槳提供了兼具靈活和效率的開發(fā)機(jī)制,并聯(lián)合開源社區(qū)打造了一系列覆蓋主流產(chǎn)業(yè)應(yīng)用需求的工業(yè)級模型,目前在國內(nèi)已得到較多的采用。
在深度學(xué)習(xí)框架之上,為了適應(yīng)計算機(jī)視覺任務(wù)、自然語言大模型等特定場景的應(yīng)用開發(fā)需求,業(yè)界構(gòu)建了一系列的開源開發(fā)庫,比如面向目標(biāo)檢測任務(wù)的mmdetection、面向大模型訓(xùn)練任務(wù)的Megatron-LM、DeepSpeed,以及面向自監(jiān)督學(xué)習(xí)的VISSL等。
這些軟件庫進(jìn)一步簡化了模型訓(xùn)練和應(yīng)用開發(fā)的難度,已成為當(dāng)前人工智能計算的重要軟件底座。業(yè)界前沿的知名AI算法,如ChatGPT、DALLE-2、StableDiffusion等都是在這樣的架構(gòu)下實現(xiàn)的。隨著國產(chǎn)AI計算產(chǎn)業(yè)的快速發(fā)展,各廠商也高度重視并投入軟件生態(tài)建設(shè),力求實現(xiàn)好用、易用的軟件開發(fā)和應(yīng)用生態(tài)。但總的來說,當(dāng)前國產(chǎn)AI計算軟件生態(tài)起步較晚、基礎(chǔ)薄弱,還要持續(xù)不斷加大投入,在各個層面加強建設(shè)完善。
(三)建設(shè)架構(gòu)
圖片
圖9 智算中心建設(shè)架構(gòu)
在智算中心總體架構(gòu)的基礎(chǔ)上,聚焦智算中心建設(shè)與應(yīng)用中涉及的關(guān)鍵技術(shù),進(jìn)一步提出智算中心建設(shè)架構(gòu)。智算中心建設(shè)架構(gòu)由四大關(guān)鍵環(huán)節(jié)組成,分別是算力基建化、算法基建化、服務(wù)智件化、設(shè)施綠色化,“四化”相互支撐、相互協(xié)調(diào),共同構(gòu)建起智算中心高效運行體系
同時,在總體架構(gòu)三項服務(wù)、三項目標(biāo)的基礎(chǔ)上,進(jìn)一步拓展豐富智算中心的功能和目標(biāo),實現(xiàn)對外提供數(shù)據(jù)服務(wù)、算力服務(wù)、算法服務(wù)、生態(tài)服務(wù)四大服務(wù),支撐達(dá)成AI產(chǎn)業(yè)化、產(chǎn)業(yè)AI化、治理智能化、產(chǎn)業(yè)集群化四大目標(biāo)。
二、技術(shù)路線
智算中心建設(shè)的關(guān)鍵技術(shù)涉及與其建設(shè)和應(yīng)用相關(guān)的各類基建、硬件、軟件,體現(xiàn)在智算中心算力基建化、算法基建化、服務(wù)智件化、設(shè)施綠色化過程中。
(一)以算力基建化為主體
以智算中心為代表的算力基礎(chǔ)設(shè)施能夠有效促進(jìn)AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化,是支撐數(shù)字經(jīng)濟(jì)發(fā)展的重要基礎(chǔ)底座。為了讓AI真正地賦能到千行百業(yè),并推動產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型發(fā)展,智算中心要具備對外提供高性價比、普惠、安全算力資源的能力,使AI算力像水、電一樣成為城市的公共基礎(chǔ)資源,供政府、企業(yè)、公眾自主取用。算力基建化供給成為支撐產(chǎn)業(yè)轉(zhuǎn)型升級以及創(chuàng)新發(fā)展的剛性需求和必然選擇。
1.面向潛在算力需求,適度超前規(guī)?;渴鹚懔Y源數(shù)據(jù)量的爆炸式增長以及萬億參數(shù)大模型的出現(xiàn),使智能算力需求呈現(xiàn)高速增長態(tài)勢,并為算力基礎(chǔ)設(shè)施帶來巨大挑戰(zhàn)。在數(shù)據(jù)量方面,IDC發(fā)布的《數(shù)據(jù)時代2025》預(yù)測,到2025年,全球數(shù)據(jù)量將達(dá)到175 ZB,而中國數(shù)據(jù)量的平均增速快于全球3%,預(yù)計到2025年將增至48.6 ZB,占全球數(shù)據(jù)圈的27.8%。在模型方面,當(dāng)前1萬億參數(shù)的單體模型需要1EFLOPS級算力(FP16)計算約50天,10萬億參數(shù)的單體模型需要10 EFLOPS級算力(FP16)計算約50天。因此在智算中心的規(guī)劃建設(shè)中,需要聚焦當(dāng)前算力應(yīng)用需求,同時面向未來數(shù)據(jù)量和大模型大參數(shù)量增長空間,適度超前,部署滿足AI訓(xùn)練、AI推理等大規(guī)模計算需求的強大AI算力機(jī)組,構(gòu)建算力集群,提供大規(guī)模彈性算力。
2.聚焦異構(gòu)加速技術(shù),提升高性能人工智能計算能力自2012年以來,人工智能訓(xùn)練任務(wù)所需求的算力每3.43個月就會翻倍,大大突破了傳統(tǒng)以每18個月為周期實現(xiàn)芯片性能翻番的摩爾定律,這對人工智能計算架構(gòu)的性能提出了更高的要求。AI芯片是生產(chǎn)算力環(huán)節(jié)的關(guān)鍵組件,為AI訓(xùn)練和AI推理輸出強大、高效、易用的計算力。目前,AI芯片主要包括GPU、FPGA、ASIC、類腦芯片四大類,其中類腦芯片仍在探索階段,因此多元異構(gòu)芯片成為提升算力的關(guān)鍵手段。主流的人工智能計算架構(gòu)是以CPU+AI芯片為主體的異構(gòu)架構(gòu),通過將CPU與多種計算單元(如GPU、FPGA、ASIC等)集成,充分融合了CPU等傳統(tǒng)的通用計算單元和高性能專用計算單元的優(yōu)點,可以同時兼顧AI模型的高效訓(xùn)練和精準(zhǔn)推理能力。異構(gòu)架構(gòu)具有高性能、高效率、低功耗等顯著優(yōu)點,使AI芯片在未來人工智能算法不斷迭代更新的情況下,依舊能保持較好的兼容性和可擴(kuò)展性,在一定程度上延長了AI芯片的生命周期。
3.兼顧軟硬一體協(xié)同,構(gòu)建智算中心多元融合型架構(gòu)人工智能計算場景和計算架構(gòu)的多元化要求智算中心從硬件、軟件、軟硬協(xié)同等層面開展優(yōu)化,提供彈性、可伸縮擴(kuò)展的算力聚合能力,依據(jù)不同類型智能應(yīng)用對算力的不同需求,提供更高效、更便捷的算力調(diào)度能力。采用融合架構(gòu)進(jìn)行整體設(shè)計是智算中心的發(fā)展方向。具體而言,在硬件層面,通過硬件重構(gòu)實現(xiàn)資源池化,結(jié)合新型超高速內(nèi)外部互連技術(shù)、池化融合、異構(gòu)存儲介質(zhì)等,推動多元異構(gòu)智能算力設(shè)施的高速互聯(lián),形成高效池化的智算中心,實現(xiàn)多元計算資源高效協(xié)同;在軟件層面,通過軟件定義,將不同的資源池組成專業(yè)的服務(wù)器、存儲、網(wǎng)絡(luò)系統(tǒng),實現(xiàn)重構(gòu)硬件資源池的高效化、智能化管理,使智算中心的業(yè)務(wù)資源調(diào)度更為靈活、運維管理能力更強。在安全方面,智算中心可以依托隱私安全計算等技術(shù),提供完善的隱私和數(shù)據(jù)保護(hù)解決方案,實現(xiàn)計算、存儲、網(wǎng)絡(luò)等多層級、全方位的資源隔離與安全防護(hù)。
(二)以算法基建化為引領(lǐng)
建設(shè)適度超前的算力基礎(chǔ)設(shè)施,不僅體現(xiàn)在算力層面,也體現(xiàn)在算法層面,這是釋放算力環(huán)節(jié)的關(guān)鍵。人工智能算法正面臨著豐富化、專業(yè)化和巨量化的挑戰(zhàn),智算中心通過提供預(yù)置行業(yè)算法、構(gòu)建預(yù)訓(xùn)練大模型、推進(jìn)算法模型持續(xù)升級、提供專業(yè)化數(shù)據(jù)和算法服務(wù),讓更多的用戶享受普適普惠的智能計算服務(wù)。
1.面向千行百業(yè)發(fā)展需求,提供多類型預(yù)置行業(yè)算法AI落地面臨開發(fā)成本、技術(shù)門檻高的難題,算法模型平均構(gòu)建時間為3個月,同時算法還需要快速的迭代,再加上AI新算法、新理論層出不窮,行業(yè)用戶的智慧轉(zhuǎn)型存在著巨大的技術(shù)壁壘。智算中心應(yīng)圍繞政務(wù)服務(wù)、智慧城市、智能制造、自動駕駛、語言智能等重點領(lǐng)域,在AI平臺內(nèi)預(yù)置實例分割、目標(biāo)檢測、邊緣檢測、圖像分類、人臉識別、視頻感知、自動問答、機(jī)器翻譯、輿情分析、情感分析、語音識別、協(xié)同過濾、交通路線規(guī)劃等常用行業(yè)算法模型,并從硬、軟件對行業(yè)算法做性能優(yōu)化,從而幫助各行各業(yè)智慧應(yīng)用加速落地,推動行業(yè)智能化轉(zhuǎn)型加速。
2.面向模型即服務(wù)應(yīng)用需求,構(gòu)建大規(guī)模預(yù)訓(xùn)練AI模型在產(chǎn)業(yè)AI化和數(shù)實融合的背景下,當(dāng)前的行業(yè)做法是針對每一個場景都做一個模型,即“有1萬個場景就有1萬個模型”。然而隨著以BERT、GPT-3、DALL·E、源1.0等為代表的高泛化能力和高通用性的大模型的出現(xiàn),一個模型可以覆蓋眾多場景?!邦A(yù)訓(xùn)練大模型+下游任務(wù)微調(diào)”的AI工程化模式已成為業(yè)內(nèi)共識,層數(shù)、隱向量長度、前饋網(wǎng)絡(luò)尺寸持續(xù)增長,參數(shù)規(guī)模迅速從億級增長到百萬億級。
在充足數(shù)據(jù)和算力的支持下,大模型可以充分學(xué)習(xí)文本、圖像等數(shù)據(jù)中的特征。智算中心應(yīng)通過部署大模型所需要的訓(xùn)練、推理和數(shù)據(jù)處理系統(tǒng),構(gòu)建出不同功能、不同模態(tài)的大模型(如自然語言處理大模型、視覺大模型、多模態(tài)大模型等),從而更加快速地生產(chǎn)出專業(yè)的技能模型,并在更多專業(yè)場景中實現(xiàn)小型化、輕量化的落地運作。
3.面向可持續(xù)化發(fā)展需求,推進(jìn)AI模型不斷演進(jìn)升級從感知機(jī)到深度神經(jīng)網(wǎng)絡(luò),從全連接網(wǎng)絡(luò)到模型剪枝、知識蒸餾、注意力機(jī)制,從有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)到強化學(xué)習(xí)、自監(jiān)督學(xué)習(xí),人工智能理論算法模型在持續(xù)深化發(fā)展中。當(dāng)前,人工智能算法正從單模態(tài)、有監(jiān)督學(xué)習(xí)向多模態(tài)、自監(jiān)督學(xué)習(xí)演進(jìn)。自監(jiān)督學(xué)習(xí)無需標(biāo)注數(shù)據(jù),可以直接從無標(biāo)簽數(shù)據(jù)中自行學(xué)習(xí),極大降低了人工標(biāo)注成本。
多模態(tài)學(xué)習(xí)更貼近人類對多感知模態(tài)的認(rèn)知過程,通過學(xué)習(xí)多種模態(tài)的數(shù)據(jù),可以突破自然語言處理和計算機(jī)視覺的界限,在圖文生成、看圖問答等視覺語言任務(wù)上具有更強表現(xiàn)。隨著人工智能相關(guān)技術(shù)和應(yīng)用需求的不斷升級,智算中心所提供的算法模型也應(yīng)持續(xù)迭代升級,與時俱進(jìn),保持算法模型的先進(jìn)性。未來,人工智能算法將朝著多模態(tài)、交互式主動學(xué)習(xí)、規(guī)劃、實踐的方向發(fā)展,以期實現(xiàn)真正的認(rèn)知智能。
4.面向算法高效調(diào)用需求,提供專業(yè)化開發(fā)部署支撐智算中心除了提供深度學(xué)習(xí)、強化學(xué)習(xí)等常見 A I算法模型外,還應(yīng)提供專業(yè)化基礎(chǔ)支撐和開發(fā)部署服務(wù)能力,以支撐AI算法模型的便捷調(diào)用和部署。為了滿足算法模型對大規(guī)模高質(zhì)量海量數(shù)據(jù)集的需求,智算中心應(yīng)搭載海量數(shù)據(jù)清洗系統(tǒng),提供全流程自動化數(shù)據(jù)處理系統(tǒng),實現(xiàn)智能高效的數(shù)據(jù)處理和過濾。為了滿足AI算法模型高效訓(xùn)練和使用的需求,智算中心在基礎(chǔ)支撐層面應(yīng)部署分布式訓(xùn)練框架、高性能推理框架,在開發(fā)部署層面應(yīng)提供數(shù)據(jù)管理、模型開發(fā)、模型訓(xùn)練、模型管理等關(guān)鍵模塊,以模型API服務(wù)、領(lǐng)域模型、工具包、會話式開放框架、開發(fā)者社區(qū)等形式,形成強大的AI算法服務(wù)支撐能力。
(三)以服務(wù)智件化為依托
隨著人工智能應(yīng)用場景持續(xù)拓展和開發(fā)用戶不斷普及,對智能計算需求大幅提升、算法模型功能不斷強化的同時,人工智能算法開發(fā)和模型訓(xùn)練正在從專業(yè)化、高門檻向泛在化、易用型轉(zhuǎn)變,智算中心的發(fā)展將由傳統(tǒng)的硬件、軟件向“智件”升級拓展?!爸羌笔侵钢撬阒行奶峁┤斯ぶ悄芡茝V應(yīng)用的中間件產(chǎn)品和服務(wù)。
傳統(tǒng)用戶進(jìn)行人工智能應(yīng)用時,除了需要提供業(yè)務(wù)數(shù)據(jù),還需提供算法模型并進(jìn)行代碼開發(fā),“智件”的構(gòu)建可以改變這種服務(wù)模式,通過可視化操作界面,以及低代碼開發(fā)甚至無代碼開發(fā)的模式,為用戶提供功能豐富、使用便捷的人工智能算力調(diào)度、算法供給和個性化開發(fā)服務(wù),實現(xiàn)“帶著數(shù)據(jù)來、拿著成果走”的效果。
1.提供多元算力調(diào)度服務(wù),實現(xiàn)算力調(diào)度“智件化”算力是智算中心提供的核心產(chǎn)品和服務(wù)。面向不同用戶的不同算力需求,智算中心應(yīng)提供“智件化”算力服務(wù),讓用戶無需關(guān)注底層算力芯片和技術(shù)細(xì)節(jié),通過用戶交互界面,選擇業(yè)務(wù)場景類別、算法模型大小等參數(shù),獲得不同算力需求下的計算時間預(yù)估、服務(wù)費用測算等針對性算力服務(wù)方案。
一方面,算力服務(wù)虛擬化,弱化底層算力芯片供給的技術(shù)差異性,為用戶提供標(biāo)準(zhǔn)化的算力供給服務(wù)。
通過抽象芯片架構(gòu)并融合算力特性將提供底層計算能力的GPU、FPGA、ASIC等AI芯片進(jìn)行統(tǒng)一管理和調(diào)度,以PFLOPS、EFLOPS作為計算能力單位向用戶提供算力服務(wù),讓用戶可以更便捷地調(diào)度算力,進(jìn)行AI應(yīng)用部署。
另一方面,算力服務(wù)協(xié)同調(diào)度,要強化對外的算力調(diào)度與服務(wù)能力。在構(gòu)建全國一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系和“東數(shù)西算”工程的背景和要求下,智算中心可以作為算力基礎(chǔ)單元,通過云服務(wù)方式融入全國算力調(diào)度體系中,滿足更大范圍、更強算力調(diào)度需求。
2.提供簡便算法模型服務(wù),實現(xiàn)算法供給“智件化”人工智能是一門極其復(fù)雜的學(xué)科,要求應(yīng)用開發(fā)者不僅要有扎實的理論功底,還要有高超的編程技術(shù),門檻極高。算法模型是人工智能應(yīng)用的靈魂,也是智算中心提供服務(wù)的主要輸出物。從計算智能到感知智能,再到認(rèn)知智能,人工智能的應(yīng)用模型越來越復(fù)雜,從公共服務(wù)到社會治理再到產(chǎn)業(yè)發(fā)展,人工智能的應(yīng)用需求越來越廣泛,對人工智能模型和算法的要求也越來越高。
為了緩解人工智能模型訓(xùn)練成本高、技術(shù)門檻高的問題,智算中心應(yīng)加強算法供給服務(wù)模式的創(chuàng)新,開發(fā)可視化操作界面,用戶通過API、模塊化代碼即可獲得所需的人工智能應(yīng)用效果,減輕代碼開發(fā)壓力,使用戶無需關(guān)注算法和模型本身的復(fù)雜技術(shù)細(xì)節(jié),只需聚焦相應(yīng)業(yè)務(wù)領(lǐng)域的業(yè)務(wù)邏輯和數(shù)據(jù)就能實現(xiàn)人工智能應(yīng)用。用戶可以基于“智件化”的算法模型進(jìn)行探索和創(chuàng)新,開發(fā)出適用于各種場景的新型智能應(yīng)用。
3.提供開放生態(tài)環(huán)境服務(wù),實現(xiàn)供需對接“智件化”人工智能場景日趨豐富,應(yīng)用需求和技術(shù)供給個性化特征明顯,為滿足部分用戶和場景對于人工智能算法優(yōu)化、系統(tǒng)優(yōu)化服務(wù)的個性化需求,智算中心應(yīng)構(gòu)建開放合作生態(tài),加大數(shù)據(jù)資源供給,聚焦先進(jìn)的技術(shù)并適配典型場景應(yīng)用。一方面,加大數(shù)據(jù)供給,數(shù)據(jù)是人工智能應(yīng)用的基礎(chǔ),智算中心應(yīng)打造數(shù)據(jù)共享平臺,推動計算機(jī)視覺、自然語言處理、重點行業(yè)領(lǐng)域等高質(zhì)量公開數(shù)據(jù)集的匯聚,為用戶人工智能應(yīng)用提供增值性數(shù)據(jù)服務(wù)。另一方面,開放發(fā)展生態(tài),圍繞滿足不同用戶個性化人工智能應(yīng)用需求,智算中心應(yīng)將其計算平臺、資源平臺和算法平臺對外開放,聚集行業(yè)內(nèi)領(lǐng)先企業(yè)的力量,及時響應(yīng)用戶個性化需求,提升智算中心技術(shù)能力的同時形成新的產(chǎn)業(yè)和生產(chǎn)力。
(四)以設(shè)施綠色化為支撐
能耗是衡量智算中心發(fā)展水平的重要維度之一。“碳達(dá)峰、碳中和”目標(biāo)背景下,國家和地方持續(xù)出臺政策,進(jìn)一步規(guī)范數(shù)據(jù)中心的能耗水平和平均電能利用效率(PUE)。為了進(jìn)一步降低智算中心能耗,設(shè)施綠色化是智算中心建設(shè)的必然選擇。設(shè)施綠色化主要包括設(shè)備節(jié)能化、能源供給綠色化等方面。
1.采用先進(jìn)節(jié)能技術(shù),全面降低智算中心能耗制冷設(shè)備和IT設(shè)備是智算中心主要的能耗來源。液冷技術(shù)采用冷卻液和工作流體對發(fā)熱設(shè)備進(jìn)行冷卻,利用高比熱容的液體代替空氣,提升了制冷效率,降低制冷能耗。液冷技術(shù)是智算中心制冷的主要發(fā)展趨勢。數(shù)據(jù)中心采用全棧布局液冷,冷板式液冷、熱管式液冷、浸沒式液冷等先進(jìn)液冷技術(shù),構(gòu)建包含一次側(cè)二次側(cè)液冷循環(huán)、CDU等的智算中心液冷整體解決方案,可以進(jìn)一步降低能耗、降低PUE,實現(xiàn)綠色化。液冷智算中心采用余熱回收技術(shù),可以為智算中心自身以及鄰近區(qū)域供暖,進(jìn)一步提升能源利用效率。此外,智算中心采用高壓直流、集中供電等高效供配電系統(tǒng)、能效環(huán)境集成檢測等高效輔助系統(tǒng)、智能監(jiān)控運維系統(tǒng)等綠色管理系統(tǒng)可以進(jìn)一步降低能耗。
2.采用綠色清潔能源,從源頭上實現(xiàn)綠色低碳
一方面,智算中心的大部分業(yè)務(wù)負(fù)載,特別是企業(yè)負(fù)載,在時間上主要集中于白天工作時段,與光伏、風(fēng)電的主要發(fā)電時段匹配性較高,無需過多儲能與調(diào)峰,使得智算中心在運用光伏、風(fēng)電等綠色電力方面具有天然優(yōu)勢。采用綠色電力供給的智算中心綜合運用線性規(guī)劃、混合整數(shù)規(guī)劃、啟發(fā)式算法等多種能耗管理方法,可以在降低碳排放的同時也節(jié)約電價成本。智算中心采用優(yōu)化調(diào)度與需求響應(yīng)控制策略,還可作為需求側(cè)可調(diào)載荷參與電力需求側(cè)響應(yīng),不僅提升智算中心自身能源利用效率,而且提升新型電力系統(tǒng)需求側(cè)資源優(yōu)化配置效率。
另一方面,智算中心所在的建筑物、園區(qū)空間大,可以充分利用,發(fā)展屋頂光伏、園區(qū)風(fēng)電等可再生能源發(fā)電設(shè)施,優(yōu)化能源綠色供給格局。應(yīng)用分布式光伏發(fā)電、分布式燃?xì)夤┠艿燃夹g(shù)可以提升智算中心園區(qū)綠色化水平。小型智算中心還可以利用模塊化氫燃料電池、太陽能板房等技術(shù)優(yōu)化能源供給格局。
應(yīng)用篇
在識別檢測、語音交互、智能客服等智能應(yīng)用在各行業(yè)領(lǐng)域得到了廣泛使用,以自動駕駛為代表的高算力需求場景從實驗環(huán)境逐步走向試點應(yīng)用階段,而以元宇宙、智慧科研(AI for Science)為代表的新興場景也逐漸走進(jìn)大眾視野,并帶來無限發(fā)展可能。
作為支撐人工智能應(yīng)用的關(guān)鍵基礎(chǔ)設(shè)施,智算中心匯聚數(shù)據(jù)、算力、算法等要素,通過生產(chǎn)算力、聚合算力、調(diào)度算力、釋放算力等關(guān)鍵環(huán)節(jié),實現(xiàn)“以數(shù)據(jù)輸入,讓智能輸出”,助力AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化,讓智能計算真正惠及經(jīng)濟(jì)社會發(fā)展。
一、智算中心激發(fā)AI產(chǎn)業(yè)化創(chuàng)新活力
(一)自動駕駛
自動駕駛是汽車智能化和自動化的高級形態(tài),作為AI技術(shù)備受關(guān)注的重要落腳點,被公認(rèn)是汽車出行產(chǎn)業(yè)的未來方向之一。自動駕駛場景的實現(xiàn),需要通過感知融合、虛擬路測(模擬仿真)、高精地圖、車路協(xié)同等核心技術(shù)將數(shù)字世界與實體路況進(jìn)行深度融合,基于人工智能技術(shù),讓車輛能夠像人類駕駛員一樣準(zhǔn)確地識別車道、行人、障礙物等駕駛環(huán)境中的關(guān)鍵信息,并及時對周圍運動單元的潛在軌跡做出預(yù)判。
自動駕駛落地需要超大AI算力支持自動駕駛需要通過對車身多個傳感器的數(shù)據(jù)進(jìn)行感知和融合,并在此基礎(chǔ)上對自動駕駛車輛的行為進(jìn)行決策和控制,其中涉及大量AI算法、機(jī)器視覺與傳感器數(shù)據(jù)整合分析、面向各類算力平臺及傳感器配置方案的適配能力等。
為了提升自動駕駛系統(tǒng)的感知和決策性能,當(dāng)前通行的做法是在數(shù)據(jù)中心端基于海量的道路采集數(shù)據(jù)來進(jìn)行感知模型訓(xùn)練和仿真測試。隨著AI技術(shù)的發(fā)展,通過AI算法對多傳感器的數(shù)據(jù)以及多模態(tài)的數(shù)據(jù)進(jìn)行融合感知,已經(jīng)成為了當(dāng)前主流的發(fā)展趨勢。另外自監(jiān)督大模型的技術(shù)也在逐步地引入到自動駕駛場景中。
這都使得自動駕駛感知模型的訓(xùn)練算力消耗遠(yuǎn)大于一般的計算機(jī)視覺感知模型。比如,Tesla構(gòu)建的L2級別的FSD自動駕駛?cè)诤细兄P偷挠?xùn)練使用了百萬量級的道路采集視頻片段,算力投入約為500PD。隨著自動駕駛級別從L2到L4的提升,對算力的需求將進(jìn)一步提高。
算力供給是自動駕駛系統(tǒng)得以大規(guī)模落地和進(jìn)一步商業(yè)化的前提條件。自動駕駛產(chǎn)業(yè)的集成化、規(guī)?;l(fā)展需要由智算中心提供超大算力、先進(jìn)AI算法等支撐。智算中心提供的普惠算力可以極大降低自動駕駛所需算力的成本,同時加速自動駕駛新技術(shù)與新產(chǎn)品的研發(fā)、測試和應(yīng)用。
(二)機(jī)器人
機(jī)器人是人工智能技術(shù)多領(lǐng)域應(yīng)用的重要載體,主要分為工業(yè)機(jī)器人、服務(wù)機(jī)器人和特種機(jī)器人。作為一種重要的智能硬件,隨著計算機(jī)視覺、機(jī)器學(xué)習(xí)、智能語音等多種智能算法技術(shù)的進(jìn)步,機(jī)器人產(chǎn)業(yè)也將實現(xiàn)飛速的發(fā)展。
《中國機(jī)器人產(chǎn)業(yè)發(fā)展報告(2022年)》數(shù)據(jù)顯示,2022年中國機(jī)器人市場規(guī)模約為174億美元,五年年均增長率達(dá)到22%,其中工業(yè)機(jī)器人和服務(wù)機(jī)器人市場規(guī)模均保持增長,二者呈現(xiàn)出齊頭并進(jìn)、快速發(fā)展的態(tài)勢。
“AI算法+AI算力”支撐機(jī)器人從量變到質(zhì)變機(jī)器人與新一代信息技術(shù)的融合逐漸深入,機(jī)器人的感知、計算、執(zhí)行能力都得到了大幅提升,處理實際問題的穩(wěn)定性和可靠性也進(jìn)一步提高,這背后離不開人工智能技術(shù)和強大算力的支撐。機(jī)器人需要和環(huán)境進(jìn)行交互感知以及決策控制,和環(huán)境的交互感知不僅涉及到視覺、聽覺等多個模態(tài),也會涉及到不同模態(tài)的感知融合,這都需要AI算法作為底層支撐。為了實現(xiàn)相應(yīng)的感知和決策算法,一般會在數(shù)據(jù)中心端構(gòu)建真實世界數(shù)據(jù)采集→AI模型構(gòu)建→孿生世界的決策控制模型訓(xùn)練→真實世界驗證測試的閉環(huán),來逐步地提升機(jī)器人在真實世界的感知和決策能力。
用于學(xué)習(xí)和訓(xùn)練的數(shù)據(jù)越多,算法迭代得越完善,機(jī)器人的決策準(zhǔn)確度將越高。智算中心的算力服務(wù)可以為機(jī)器人的大規(guī)模模型訓(xùn)練和預(yù)測提供強大算力支撐,智算中心的算法服務(wù)可以實現(xiàn)機(jī)器人智能化應(yīng)用算法模型的敏捷開發(fā)和快速訓(xùn)練上線,為機(jī)器人產(chǎn)業(yè)的高質(zhì)量發(fā)展提供全方位支撐。
(三)元宇宙
元宇宙是基于數(shù)字技術(shù)進(jìn)行創(chuàng)造和連接,與現(xiàn)實空間映射交互形成的虛擬空間,是整合多種新技術(shù)而產(chǎn)生的下一代互聯(lián)網(wǎng)應(yīng)用和數(shù)字形態(tài)的新型社會體系。元宇宙在5G、人工智能、物聯(lián)網(wǎng)、AR/VR、云計算、區(qū)塊鏈等技術(shù)及產(chǎn)品的支持下,為現(xiàn)實世界構(gòu)建數(shù)字化虛擬平行世界,為用戶提供沉浸式交互體驗,大幅提升各行業(yè)生產(chǎn)效率。
智算中心是支撐元宇宙實現(xiàn)的關(guān)鍵基礎(chǔ)設(shè)施元宇宙的沉浸式體驗離不開擴(kuò)展現(xiàn)實、人工智能、區(qū)塊鏈等元宇宙核心技術(shù)的支持,對系統(tǒng)的計算、存儲、帶寬、功耗等都提出了極高的要求,其所需消耗的算力資源也是巨量的。
元宇宙的協(xié)同創(chuàng)建、高精仿真、實時渲染、智能交互等環(huán)節(jié)都需要大量算力做支撐,想要真正邁入虛擬和現(xiàn)實融合的3D互聯(lián)網(wǎng)時代,元宇宙對算力的需求將呈指數(shù)級增長,這遠(yuǎn)遠(yuǎn)超過了通用CPU的發(fā)展速度。傳統(tǒng)以提升CPU時鐘頻率和內(nèi)核數(shù)量來提高計算性能的方式遇到了瓶頸,形成了巨大的算力缺口。元宇宙從本質(zhì)上看是對算力的重構(gòu),這部分算力缺口需要由智算中心來彌補,從而不斷提升元宇宙場景的性能和能效。
1.虛擬數(shù)字人
虛擬數(shù)字人是可以感知、規(guī)劃、行動的虛擬形象,由計算機(jī)圖形學(xué)、圖形渲染、動作捕捉、深度學(xué)習(xí)、語音合成等技術(shù)生成,具備類人外貌、交互能力等高度擬人化特征,是元宇宙的重要組成部分。虛擬數(shù)字人正逐步“闖入”現(xiàn)實虛擬數(shù)字人的應(yīng)用領(lǐng)域非常廣泛,按照應(yīng)用場景或行業(yè)的不同,已經(jīng)出現(xiàn)了虛擬主播、虛擬偶像等娛樂型數(shù)字人,虛擬教師等教育型數(shù)字人,虛擬客服、虛擬導(dǎo)游等助手型數(shù)字人,替身演員、虛擬演員等影視數(shù)字人應(yīng)用。據(jù)《虛擬數(shù)字人深度產(chǎn)業(yè)報告》預(yù)測,2030年我國虛擬數(shù)字人整體市場規(guī)模將達(dá)到2,700億元。
智算中心助力虛擬數(shù)字人應(yīng)對AI算力和算法挑戰(zhàn)虛擬數(shù)字人相關(guān)的建模、驅(qū)動、渲染和感知交互均需要巨量的算力支撐。當(dāng)前,虛擬數(shù)字人的建模以基于3D建模軟件的手工建模+真人驅(qū)動為主。
隨著AIGC等AI技術(shù)的應(yīng)用,基于AI算法的自動建模將逐步替代手工建模,成為數(shù)字人建模的主要方式。與此同時,基于AI算法的數(shù)字人驅(qū)動也將逐步替代當(dāng)前以“中之人”驅(qū)動為主的真人驅(qū)動方式。與此同時,視覺感知、語音識別和語音合成以及自然語言處理等多種AI算法在數(shù)字人中的應(yīng)用,將推動數(shù)字人向“數(shù)智人”轉(zhuǎn)變,也是虛擬數(shù)字人應(yīng)用普及的關(guān)鍵。智算中心可以為虛擬數(shù)字人制作、感知交互提供強大的算力和算法支撐,加速虛擬數(shù)字人產(chǎn)業(yè)的商業(yè)化落地。
2.?dāng)?shù)字孿生
數(shù)字孿生是指充分利用物理模型、傳感器、運行歷史等數(shù)據(jù),集成多學(xué)科、多尺度的仿真過程,以數(shù)字化方式創(chuàng)建物理實體的虛擬鏡像,通過模擬、驗證、預(yù)測和控制物理實體全生命周期行為,實現(xiàn)在物理空間的最優(yōu)決策。數(shù)字孿生是構(gòu)建元宇宙數(shù)字空間的基礎(chǔ)數(shù)字孿生在元宇宙的發(fā)展進(jìn)程中扮演著重要角色,是元宇宙耦合物理世界的基石。
元宇宙的目標(biāo)是構(gòu)建一個與現(xiàn)實物理世界高度貼合的甚至是超越現(xiàn)實世界的虛擬世界,因此需要通過海量數(shù)據(jù)模擬和強大算力來實現(xiàn)1:1的數(shù)字空間創(chuàng)造,這個過程中的核心關(guān)鍵就是數(shù)字孿生。數(shù)字孿生技術(shù)能夠以極致細(xì)節(jié)的方式將現(xiàn)實世界映射到虛擬世界中。因此,數(shù)字孿生技術(shù)的成熟度在一定程度上決定了元宇宙在虛實映射與虛實交互上的發(fā)展?jié)摿Α?/span>
強大算力是數(shù)字孿生高效穩(wěn)定運行的重要支撐數(shù)字孿生的應(yīng)用十分廣泛。例如,數(shù)字孿生城市可以在虛擬世界模擬仿真城市管理、產(chǎn)業(yè)發(fā)展、消防應(yīng)急、環(huán)境變化等情況,為現(xiàn)實中關(guān)鍵問題的決策提供技術(shù)支撐,提升城市規(guī)劃和城市治理的效率和精準(zhǔn)度。
在元宇宙中,大規(guī)模、高度復(fù)雜的數(shù)字孿生空間的構(gòu)建,以及現(xiàn)實世界和數(shù)字世界的實時交互,需要有強大且物理準(zhǔn)確的高精度仿真算力和實時高清3D渲染算力作為支撐。隨著AI技術(shù)的發(fā)展,基于AI算法的高精仿真逐步替代了傳統(tǒng)基于數(shù)值求解算法的仿真系統(tǒng),成為了數(shù)字孿生系統(tǒng)的核心底層支撐技術(shù)。智算中心可以為大規(guī)模數(shù)字孿生提供專業(yè)化的算力和應(yīng)用支持,支撐數(shù)字孿生空間的實時創(chuàng)建、復(fù)雜模型的高效運行,以及逼真仿真環(huán)境的快速生成。
二、智算中心助力產(chǎn)業(yè)AI化走深向?qū)?/span>
(一)智慧醫(yī)療
國家統(tǒng)計局《2021年國民經(jīng)濟(jì)和社會發(fā)展統(tǒng)計公報》顯示,2021年全年總診療人次85.3億人次,基本醫(yī)療保險覆蓋13.6億人。然而,各個地區(qū)醫(yī)療服務(wù)水平參差不齊,醫(yī)療服務(wù)資源不均等現(xiàn)象普遍存在,基層患者尤其是偏遠(yuǎn)地區(qū)的患者難以獲得高質(zhì)量的醫(yī)療救治。
AI輔助診斷助力解決診療“三大難題”當(dāng)前,醫(yī)療診斷主要面臨三大挑戰(zhàn):
一是數(shù)據(jù)量巨大。粗略估算診療人次所對應(yīng)的就醫(yī)環(huán)節(jié)及相應(yīng)的醫(yī)療數(shù)據(jù)質(zhì)量,加上血壓、心率、體重、心電圖等醫(yī)療監(jiān)測數(shù)據(jù),規(guī)模早已突破TB級,并且以“秒”為單位持續(xù)更新疊加,需要強有力的算力支撐平臺。
二是數(shù)據(jù)結(jié)構(gòu)多元。不僅包含大量醫(yī)學(xué)術(shù)語、專業(yè)名稱,還包括文檔、影像、視頻等非結(jié)構(gòu)化數(shù)據(jù),對AI服務(wù)器等新型智能計算硬件要求較高。
三是數(shù)據(jù)實時處理要求高。醫(yī)療服務(wù)中存在大量時間性強和決策周期短的應(yīng)用場景,如臨床中的診療和用藥建議、健康指標(biāo)預(yù)警等,對在線計算、實時處理的需求顯著,亟需構(gòu)建強大的算力平臺支撐基于醫(yī)療健康領(lǐng)域數(shù)據(jù)規(guī)模化知識圖譜。
醫(yī)療機(jī)構(gòu)通過引入AI輔助診療,可實現(xiàn)診斷、治療工作的智能化。從算力需求看,人工智能輔助診療應(yīng)用涉及海量圖形數(shù)據(jù)的處理,所需的算力要求較高。智算中心具備的強大算力可以支持大規(guī)模、高難度的模型訓(xùn)練,全方位支撐海量醫(yī)療影像數(shù)據(jù)的分析挖掘和精準(zhǔn)診斷,能夠有效縮短診斷時間,提高診療效率。
(二)文娛創(chuàng)作
近年來,AI在文娛創(chuàng)作方面有諸多突破,通過融合人工智能、認(rèn)知心理學(xué)、哲學(xué)和藝術(shù)等多個學(xué)科,可完成詩詞、繪畫、音樂、影視、小說等創(chuàng)作。
人工智能正在逐漸改變文娛創(chuàng)作的發(fā)展范式對藝術(shù)家來說,靈感極為可貴并難以捕捉,當(dāng)文娛創(chuàng)作遇上人工智能,整個行業(yè)迸發(fā)出了全新的生機(jī)和活力。AI技術(shù)將是未來數(shù)字化創(chuàng)作的重要生產(chǎn)工具。當(dāng)前出現(xiàn)的創(chuàng)作生態(tài)可分為專業(yè)生成內(nèi)容(Professionally Generated Content,簡稱PGC)、用戶生成內(nèi)容(User Generated Content,簡稱UGC)、AI輔助生產(chǎn)內(nèi)容和AIGC。

其中,PGC和UGC都是以人為主體的創(chuàng)作模式,PGC是由專業(yè)人士進(jìn)行內(nèi)容創(chuàng)作,成本較高且產(chǎn)能有限;UGC降低了生產(chǎn)成本,滿足了個性化需求,但存在不可控因素。從長期來看,數(shù)字內(nèi)容生成的需求會愈發(fā)強烈,但是人腦處理信息的能力有限,當(dāng)以人力為主的內(nèi)容生產(chǎn)潛力逐漸消耗殆盡,以AI為主的內(nèi)容生產(chǎn)模式將彌補數(shù)字世界內(nèi)容供需的缺口。Gartner數(shù)據(jù)顯示,到2023年將有20%的內(nèi)容由AI創(chuàng)作生成,預(yù)計到2025年生成式AI產(chǎn)生的數(shù)據(jù)將占所有數(shù)據(jù)的10%。
AIGC將成為數(shù)字內(nèi)容生產(chǎn)的長期發(fā)展方向AIGC是一種通過生成對抗網(wǎng)絡(luò)、深度學(xué)習(xí)、大型預(yù)訓(xùn)練模型等人工智能技術(shù)挖掘數(shù)據(jù)中的規(guī)律,并通過適當(dāng)?shù)姆夯芰ι上嚓P(guān)內(nèi)容的技術(shù)。深度學(xué)習(xí)技術(shù)(如深度學(xué)習(xí)模型CLIP等)的突破為AIGC商業(yè)落地提供了可能,而數(shù)字內(nèi)容、數(shù)字資產(chǎn)等的快速發(fā)展又進(jìn)一步加速了AIGC的應(yīng)用與優(yōu)化。
利用AIGC技術(shù)可以生成多種模態(tài)的數(shù)字作品,如AI寫作(文本)、AI繪畫(圖像)、AI作曲(音頻)、AI換臉(視頻)等。同時,AIGC技術(shù)也可以實現(xiàn)由文字生成圖像、文字生成視頻、圖像/視頻生成文字等跨模態(tài)創(chuàng)作,以及Game AI等各類綜合型場景創(chuàng)作。AIGC的出現(xiàn)使數(shù)字內(nèi)容創(chuàng)作的生產(chǎn)效率和互動性得到了進(jìn)一步提升。隨著人工智能技術(shù)的不斷升級以及算力、數(shù)據(jù)、算法等要素的持續(xù)迭代,未來AIGC技術(shù)將持續(xù)賦
能各類文化創(chuàng)意、生產(chǎn)生活,為數(shù)字內(nèi)容生產(chǎn)帶來巨大變革。AI大模型和開放平臺為文娛創(chuàng)作提供技術(shù)支撐隨著各類AI大模型及支持開發(fā)者創(chuàng)作的各類AI開源平臺的陸續(xù)上線,用戶可以獲取涵蓋開源模型API、高質(zhì)量中文數(shù)據(jù)集、模型訓(xùn)練代碼、推理代碼、應(yīng)用代碼、面向AI芯片的模型移植開發(fā)等內(nèi)容的多場景服務(wù)。
大模型開放平臺的出現(xiàn)極大地降低了文娛類AI應(yīng)用的開發(fā)門檻,即使是幾乎沒有任何編程經(jīng)驗的文娛創(chuàng)作者,通過在平臺上進(jìn)行簡單學(xué)習(xí),也可以快速實現(xiàn)文娛類AI應(yīng)用的開發(fā)。AI大模型和AI開源平臺作為智算中心算法基建化的重要構(gòu)成,配合其強大的算力資源,將為創(chuàng)作者打造一片創(chuàng)作的樂土。
(三)智慧科研
AI技術(shù)成為繼計算機(jī)之后,科學(xué)家新的生產(chǎn)工具,并催生出了新的科研范式AI for Science??茖W(xué)家們用AI技術(shù)去學(xué)習(xí)科學(xué)原理,根據(jù)實驗或者計算產(chǎn)生的數(shù)據(jù)對所求解的科學(xué)問題進(jìn)行建模,從而使復(fù)雜問題得到有效解決。近年來,AI也被證明能用來做規(guī)律發(fā)現(xiàn),幫助人類從大量的復(fù)雜數(shù)據(jù)中,抽取一些人類觀察不到的高維信息和高價值規(guī)律,不僅在應(yīng)用科學(xué)領(lǐng)域,也能在自然科學(xué)領(lǐng)域發(fā)揮作用。AI for Science 不僅帶來了科研效率的顯著提升,還能降低科研成本,讓更多人都能參與到科學(xué)研究中來。
1.生命科學(xué)
隨著大數(shù)據(jù)和人工智能的發(fā)展、普及和成熟,越來越多的科學(xué)研究從假設(shè)推動的范式向數(shù)據(jù)驅(qū)動的范式轉(zhuǎn)變,利用大數(shù)據(jù)和計算機(jī)技術(shù)挖掘科學(xué)洞見。在生命科學(xué)領(lǐng)域,通過采用深度學(xué)習(xí)方法處理海量數(shù)據(jù),已經(jīng)在蛋白質(zhì)結(jié)構(gòu)預(yù)測等領(lǐng)域?qū)崿F(xiàn)了落地應(yīng)用。
蛋白質(zhì)作為生命活動的主要承擔(dān)者,長期以來都是生命科學(xué)工作者研究的重點,其中確定蛋白質(zhì)的三維空間結(jié)構(gòu)尤為重要。受困于計算量龐大、計算準(zhǔn)確度有限,蛋白質(zhì)三維結(jié)構(gòu)預(yù)測領(lǐng)域近年來進(jìn)展較為緩慢。
采用傳統(tǒng)的冷凍電鏡三維重構(gòu)方法,實驗儀器昂貴,且圖像重構(gòu)需要耗費大量計算力,而采用傳統(tǒng)的分子動力學(xué)結(jié)構(gòu)預(yù)測計算方案,在平均10300的搜索空間枚舉蛋白質(zhì)的可能構(gòu)型,需要極高的算力和漫長的計算時間,因此在過去50年的時間,僅有17%的人類蛋白質(zhì)組得到結(jié)構(gòu)解析。
在智能算力的支持下,DeepMind開發(fā)了基于注意力機(jī)制深度神經(jīng)網(wǎng)絡(luò)的AlphaFold2模型,通過對當(dāng)前已經(jīng)測序的數(shù)十萬蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)和數(shù)百萬蛋白質(zhì)序列數(shù)據(jù)進(jìn)行學(xué)習(xí),實現(xiàn)了端到端直接預(yù)測蛋白質(zhì)的三維結(jié)構(gòu),并取得了突破性進(jìn)展,預(yù)測結(jié)果準(zhǔn)確率達(dá)到了92.4%。相較于使用費用高昂的實驗儀器,單個蛋白結(jié)構(gòu)的預(yù)測時間縮短到了分鐘級。AlphaFold2的開發(fā)是以巨量算力為支撐,具體來說,其訓(xùn)練數(shù)據(jù)準(zhǔn)備消耗了約2億核時的CPU算力,訓(xùn)練過程消耗了約300PD的AI算力。
2.大規(guī)模分子模擬
分子動力學(xué)模擬通過求解原子運動的經(jīng)典力學(xué)牛頓方程對相空間進(jìn)行采樣,可以研究體系在相空間的演化過程,還可以通過統(tǒng)計方法得到體系在非零溫度下的各種性質(zhì),是當(dāng)前材料和生物化學(xué)領(lǐng)域最常用的計算研究方法之一。
近年來,借助神經(jīng)網(wǎng)絡(luò)從大量數(shù)據(jù)中獲得規(guī)律的優(yōu)勢,將第一性原理計算結(jié)果作為訓(xùn)練數(shù)據(jù),利用神經(jīng)網(wǎng)絡(luò)訓(xùn)練構(gòu)建勢函數(shù)的方法引起了廣泛的關(guān)注。該系列方法從上世紀(jì)90年代開始,經(jīng)過二十多年的發(fā)展,在準(zhǔn)確性、可擴(kuò)展性等方面得到了提升,比較常用的方法有DeePMD、SchNet、GAP、MTP等。
2020年深度勢能(DP)團(tuán)隊因“結(jié)合分子建模、機(jī)器學(xué)習(xí)和高性能計算相關(guān)方法,將具有從頭算精度的分子動力學(xué)模擬的極限提升至1億個原子規(guī)?!保瑪孬@了當(dāng)年的戈登·貝爾獎(Gordon Bell Prize)。原子間機(jī)器學(xué)習(xí)勢函數(shù)已經(jīng)應(yīng)用于許多實際研究中,可以用于模擬復(fù)雜的、多元素的晶體、非晶、液晶、界面、缺陷和摻雜等實驗體系,計算精度接近從頭算,計算速度卻可以比從頭算快數(shù)百到上千倍。
3.?dāng)?shù)值計算
矩陣乘法是許多計算任務(wù)的核心,其中包括神經(jīng)網(wǎng)絡(luò)、3D圖形和數(shù)據(jù)壓縮等。因此,提高矩陣乘法效率將直接作用于許多應(yīng)用。幾個世紀(jì)以來,數(shù)學(xué)家認(rèn)為標(biāo)準(zhǔn)矩陣乘法算法是效率最高的算法,但在1969年,德國數(shù)學(xué)家Volken Strassen通過研究非常小的矩陣(大小為2x2)證明確實存在更好的算法。然而,更大矩陣相乘的高效算法仍屬于尚未攻克的難題。
DeepMind的最新研究探討了現(xiàn)代AI技術(shù)——強化學(xué)習(xí)如何推動新矩陣乘法算法的自動發(fā)現(xiàn)?;舅悸肥菍l(fā)現(xiàn)矩陣乘法高效算法的問題轉(zhuǎn)換為單人游戲,然后訓(xùn)練一個基于強化學(xué)習(xí)的智能體 AlphaTensor 來玩這個游戲,通過對 AlphaTensor進(jìn)行調(diào)整,專門用以發(fā)現(xiàn)在給定硬件(如 NVIDIA V100 GPU、Google TPU v2)上運行速度快的算法。實驗結(jié)果發(fā)現(xiàn),這些算法在相同硬件上進(jìn)行大矩陣相乘的速度比常用算法快了10-20%,表明AlphaTensor在優(yōu)化任意目標(biāo)方面具備了不錯的靈活性。因此,強化學(xué)習(xí)成為加速新矩陣乘法算法自動發(fā)現(xiàn)的一種新思路。
從算力需求看,蛋白質(zhì)結(jié)構(gòu)分析、大規(guī)模分子模擬、數(shù)值計算相關(guān)應(yīng)用主要涉及海量數(shù)據(jù)并行計算和大規(guī)模模擬實驗,對算力和存力需求較高,屬于計算密集型和數(shù)據(jù)密集型任務(wù)。智算中心所具備的算力服務(wù)能力極度契合AI for Science相關(guān)場景的算力需求,將成為支撐科研高質(zhì)量、突破式發(fā)展的重要基礎(chǔ)設(shè)施。



建設(shè)篇
從建設(shè)用途來看,智算中心除充分考慮其普惠性、開放性和集約性外,核心是以高質(zhì)量、低成本、高性能的AI算力來支撐產(chǎn)業(yè)創(chuàng)新、城市發(fā)展中的各項智能服務(wù)。智算中心建設(shè)以總體規(guī)劃、政企協(xié)同、需求牽引為宗旨,聚焦先進(jìn)的技術(shù)和適配典型場景。同時,以智算中心建設(shè)和應(yīng)用帶動人工智能產(chǎn)業(yè)集群的匯聚,吸引數(shù)字化人才,激發(fā)人工智能產(chǎn)業(yè)的創(chuàng)新活力,推動人工智能產(chǎn)業(yè)和區(qū)域經(jīng)濟(jì)的可持續(xù)發(fā)展。
一、建設(shè)類型與策略
智算中心建設(shè)并非簡單做好基建即可,還需結(jié)合建設(shè)基礎(chǔ)、當(dāng)?shù)鼗騾^(qū)域產(chǎn)業(yè)特色,以差異化算力需求為導(dǎo)向,分類引導(dǎo)施策,優(yōu)化建設(shè)方式,改建并行,發(fā)展與數(shù)字經(jīng)濟(jì)相適應(yīng)的智算中心。
(一)建設(shè)原則
政府引導(dǎo),需求牽引。以政府側(cè)和市場側(cè)實際需求為牽引,以高標(biāo)準(zhǔn)建設(shè)、可持續(xù)發(fā)展為路徑,改造存量與優(yōu)化增量協(xié)同推進(jìn),引導(dǎo)龍頭企業(yè)建設(shè)高附加值、產(chǎn)業(yè)鏈帶動效應(yīng)明顯的重點項目。
開放多元、培育生態(tài)。以開放計算為核心,以多元算力融合為方向,推進(jìn)智算產(chǎn)業(yè)核心關(guān)鍵技術(shù)的研發(fā)標(biāo)準(zhǔn)化、產(chǎn)業(yè)化和應(yīng)用迭代。加強對智算中心關(guān)鍵軟硬件產(chǎn)品的研發(fā)支持和大規(guī)模應(yīng)用推廣,突破關(guān)鍵核心技術(shù),提升智能算力全產(chǎn)業(yè)鏈自主創(chuàng)新能力。
普適普惠、創(chuàng)新發(fā)展。以融合架構(gòu)計算系統(tǒng)為平臺,以數(shù)據(jù)為資源,以強大的計算力驅(qū)動AI模型對數(shù)據(jù)進(jìn)行深度加工,使智能算力可以像水電一樣,成為社會基本公共服務(wù),面向城市各領(lǐng)域應(yīng)用提供高品質(zhì)智算服務(wù)。
集約高效、節(jié)能降碳。堅持集約化、規(guī)?;ㄔO(shè)方向,加快節(jié)能低碳技術(shù)研發(fā)應(yīng)用,提升可再生能源利用率,應(yīng)用節(jié)能新技術(shù),減少碳排放,推進(jìn)智算中心綠色、高質(zhì)量發(fā)展。
(二)依據(jù)建設(shè)方式分類建設(shè)
1.新建智算中心
(1)建設(shè)條件
面向京津冀、長三角、粵港澳大灣區(qū)、成渝,以及貴州、內(nèi)蒙古、甘肅、寧夏等全國一體化算力網(wǎng)絡(luò)國家樞紐節(jié)點和數(shù)據(jù)中心集群,以及人工智能產(chǎn)業(yè)領(lǐng)域應(yīng)用場景多元和科教資源豐富的優(yōu)勢地區(qū),建設(shè)智算中心,以智算中心為牽引推動人工智能領(lǐng)域創(chuàng)新要素集聚,打造人工智能產(chǎn)業(yè)生態(tài)圈。新建智算中心作為新型公共算力基礎(chǔ)設(shè)施和賦能平臺,應(yīng)支撐國家和區(qū)域內(nèi)重要需求、科研創(chuàng)新和戰(zhàn)略任務(wù)落地,為AI大模型訓(xùn)練、自動駕駛、生物工程、智能制造、數(shù)字孿生、空間地理等人工智能探索應(yīng)用提供強大的智能算力服務(wù),通過智能算力服務(wù)賦能產(chǎn)業(yè)升級,帶動區(qū)域經(jīng)濟(jì)發(fā)展。
(2)建設(shè)方式與策略
加快梯次布局,打造一批城市級智算中心。對于產(chǎn)業(yè)智能化發(fā)展需求迫切、人工智能產(chǎn)業(yè)集聚的地區(qū),可新建圍繞人工智能產(chǎn)業(yè)需求設(shè)計、為人工智能提供專門服務(wù)的智算中心,按照適度超前原則配置優(yōu)質(zhì)算力資源,提供兼具公有、專用、彈性計算的服務(wù)能力,滿足不同應(yīng)用場景和多類型用戶的需求,面向當(dāng)?shù)仄髽I(yè)、科研院所等提供科研創(chuàng)新、人才培養(yǎng)、應(yīng)用孵化、產(chǎn)業(yè)發(fā)展等服務(wù),打造“易用”“好用”的智算中心。
強化普惠智能算力高質(zhì)量供給,降低算力使用門檻,推動智能算力服務(wù)與物聯(lián)網(wǎng)和區(qū)塊鏈等技術(shù)融合創(chuàng)新,打造具有地方特色服務(wù)本地輻射周邊的智算中心。加強場景賦能,按需建設(shè)專業(yè)型智算中心。開展面向性能、價格、效益等多方面的測算,形成應(yīng)用需求供給和可持續(xù)的長效動力機(jī)制,加快重點行業(yè)的智算中心建設(shè),圍繞智能經(jīng)濟(jì)、智能社會、科研活動、國家重大活動和重大工程等領(lǐng)域的人工智能創(chuàng)新應(yīng)用場景,加強供需對接,打造特色場景智算中心,發(fā)揮倍增效應(yīng),做大做強形成規(guī)?;瘧?yīng)用,帶動人工智能和相關(guān)產(chǎn)業(yè)發(fā)展。
2.已建數(shù)據(jù)中心升級
(1)建設(shè)條件
面向北京、上海、廣州以及東部經(jīng)濟(jì)發(fā)達(dá)、人口密度大,對數(shù)據(jù)要素的產(chǎn)生、存儲和處理需求高,但面臨地區(qū)能耗指標(biāo)緊張、電力成本高、大規(guī)模數(shù)據(jù)中心開發(fā)空間受限等問題的地區(qū),對已建數(shù)據(jù)中心進(jìn)行智能化改造,推動傳統(tǒng)數(shù)據(jù)中心向綠色高效、智能集約轉(zhuǎn)型升級。改造升級后的智算中心應(yīng)優(yōu)先滿足國家及當(dāng)?shù)卣?wù)服務(wù)、重大項目及重點實驗室的熱數(shù)據(jù)處理和匯聚需求,保障城市基本運行和高效治理需求,保障金融、通信、互聯(lián)網(wǎng)等戰(zhàn)略性行業(yè)數(shù)據(jù)匯集和實時響應(yīng)計算需求,保障科技賦能和產(chǎn)業(yè)創(chuàng)新高性能算力需求。
(2)建設(shè)方式與策略
以“以舊換新、增減替代”為原則,對已建存量數(shù)據(jù)中心進(jìn)行改造升級,加強AI和傳統(tǒng)計算的融合。重點將一些冷數(shù)據(jù)、靜態(tài)備份數(shù)據(jù)為主的存儲類數(shù)據(jù)中心,替換為支撐數(shù)字經(jīng)濟(jì)、人工智能、區(qū)塊鏈、工業(yè)互聯(lián)網(wǎng)等前沿產(chǎn)業(yè)發(fā)展的智算中心。適度利用關(guān)閉及騰退的其他老舊落后的自用型數(shù)據(jù)中心、存儲型數(shù)據(jù)中心、容災(zāi)備份中心資源和空間,升級改造為支撐低時延業(yè)務(wù)應(yīng)用,服務(wù)智慧城市、車聯(lián)網(wǎng)等重點應(yīng)用場景落地。
加快傳統(tǒng)數(shù)據(jù)中心節(jié)能低碳技術(shù)研發(fā)推廣,提升資源能源利用效率。智算中心具備高功率密度屬性,在制冷方面具有更高的要求。目前大多數(shù)AI服務(wù)器采用的仍是常規(guī)風(fēng)冷模式,部分超過30kW的數(shù)據(jù)中心采用液冷模式。隨著AI服務(wù)器功率密度的提升和使用場景的增多,需要在推動已建老舊小散數(shù)據(jù)中心向規(guī)?;瘮?shù)據(jù)中心集群或智能化計算中心轉(zhuǎn)型升級基礎(chǔ)上,逐步推廣液冷技術(shù)的應(yīng)用,促進(jìn)全產(chǎn)業(yè)鏈綠色低碳有序發(fā)展,助力國民經(jīng)濟(jì)各行業(yè)整體實現(xiàn)“碳達(dá)峰、碳中和”的輻射帶動作用。
(三)依據(jù)功能定位分類建設(shè)
1.產(chǎn)業(yè)合作平臺
(1)建設(shè)條件
面向絕大多數(shù)無法承擔(dān)自建智算中心和獨立運營費用的企業(yè),由政府主導(dǎo),通過統(tǒng)一建設(shè)高性能、大規(guī)模的智算中心,并以租賃形式為有需求的企業(yè)提供算力支撐,省去企業(yè)投資建設(shè)和運營費用。通過平臺開放接口的方式,鼓勵行業(yè)領(lǐng)軍企業(yè)將開源的算法、開放的數(shù)據(jù)資源及運營服務(wù)等創(chuàng)新要素輸送給IT基礎(chǔ)相對薄弱的企業(yè),進(jìn)一步降低人工智能使用門檻,助力各行業(yè)智慧化轉(zhuǎn)型升級。
(2)建設(shè)方式與策略
借助ICT基礎(chǔ)設(shè)施企業(yè)物理設(shè)施建設(shè)優(yōu)勢,通過承建智算中心,搭建產(chǎn)業(yè)合作平臺,集成最新的人工智能加速芯片和存儲介質(zhì)等,使其成為各新興計算單元進(jìn)行大規(guī)模融合的重要載體,從需求側(cè)刺激硬件重構(gòu)和軟件定義等融合架構(gòu)技術(shù)創(chuàng)新發(fā)展。通過推進(jìn)平臺、框架和算法的協(xié)同優(yōu)化,打通人工智能軟硬件產(chǎn)業(yè)鏈,打造人工智能算力技術(shù)和產(chǎn)業(yè)生態(tài)。依托人工智能行業(yè)領(lǐng)域企業(yè)的專精優(yōu)勢,通過成立合資公司等形式參與智算中心建設(shè)和運營,借助智算中心平臺擴(kuò)大自有生態(tài)優(yōu)勢。
2.產(chǎn)業(yè)園區(qū)
(1)建設(shè)條件
面向各地方政府以云計算、大數(shù)據(jù)、智慧城市、虛擬現(xiàn)實、人工智能、區(qū)塊鏈等技術(shù)應(yīng)用為核心發(fā)展方向的頂層規(guī)劃布局,圍繞利用新一代信息技術(shù)對農(nóng)業(yè)、工業(yè)、服務(wù)業(yè)進(jìn)行全方位、全角度、全鏈條的數(shù)字化改造升級需求,通過合力打造面向未來的智算中心、智算產(chǎn)業(yè)促進(jìn)中心等產(chǎn)業(yè)配套載體,構(gòu)建“產(chǎn)業(yè)+配套、平臺+生態(tài)、數(shù)字+賦能”數(shù)字產(chǎn)業(yè)生態(tài),吸引相關(guān)技術(shù)企業(yè)落戶本地,逐步促進(jìn)產(chǎn)業(yè)集群規(guī)?;l(fā)展,立足本地,輻射帶動周邊,推動數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展。
(2)建設(shè)方式與策略
根據(jù)城市規(guī)模和產(chǎn)業(yè)發(fā)展定位的需求,以及經(jīng)濟(jì)社會發(fā)展等因素,由政府為主導(dǎo),與企業(yè)開展合作,以智算中心項目為依托,建設(shè)配套產(chǎn)業(yè)園區(qū)和人才培養(yǎng)平臺等,分類給予針對性的優(yōu)惠政策,吸引人工智能及其相關(guān)領(lǐng)域企業(yè)和人才向智算產(chǎn)業(yè)園區(qū)聚集。針對重點行業(yè)的特色應(yīng)用開展試點示范,形成一批可推廣的典型應(yīng)用創(chuàng)新模式。引導(dǎo)有智算需求的企業(yè)積極接入智算中心,使用智算中心服務(wù),加速企業(yè)集聚和數(shù)據(jù)共享。
政府根據(jù)智算中心運營的特點進(jìn)行規(guī)劃與開發(fā),并在此基礎(chǔ)上為園區(qū)提供政策支持、稅收優(yōu)惠等,加快應(yīng)用落地,引領(lǐng)塑造產(chǎn)業(yè)生態(tài)。
二、建設(shè)運營模式
為保證智算中心所釋放的經(jīng)濟(jì)社會效益最大化,需要選擇合理的建設(shè)和運營模式,保證智算中心的公共屬性,實現(xiàn)長效運營,促進(jìn)有序布局。
(一)主流建設(shè)模式
在全國一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系構(gòu)建背景下,地方政府、產(chǎn)業(yè)園區(qū)、企業(yè)等紛紛將智算中心作為培育人工智能產(chǎn)業(yè)生態(tài)、提升數(shù)字經(jīng)濟(jì)能級的有力工具,常見的建設(shè)模式包括三種。
1.獨立投資建設(shè)模式
一是政府獨立投資建設(shè)。政府對建設(shè)項目進(jìn)行直接投資和管理,建設(shè)資金主要來自地方政府財政資金、專項債券發(fā)行等,建設(shè)完成后智算中心所有權(quán)歸政府所有。出于促進(jìn)產(chǎn)業(yè)發(fā)展、優(yōu)化產(chǎn)業(yè)服務(wù)的考慮,不同規(guī)模的產(chǎn)業(yè)園區(qū)日益成為智算中心的投資主體,由園區(qū)管委會出資建設(shè)智算中心。
二是企業(yè)獨立投資建設(shè)。主要由企業(yè)聯(lián)盟、少數(shù)企業(yè)聯(lián)合、單獨企業(yè)等形式進(jìn)行投資,旨在服務(wù)于特定產(chǎn)業(yè)發(fā)展和特定場景應(yīng)用。部分負(fù)責(zé)投資的企業(yè)可以同時作為智算中心的建設(shè)方,部分負(fù)責(zé)投資的企業(yè)需要聯(lián)合專業(yè)化建設(shè)企業(yè)進(jìn)行施工。該模式雖然由企業(yè)出資,但是考慮到智算中心的高投入、對于地方經(jīng)濟(jì)發(fā)展的高影響等因素,應(yīng)緊密配合國家“東數(shù)西算”工程、全國一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系等建設(shè)指引。
三是高?;蚩蒲袡C(jī)構(gòu)獨立投資建設(shè)。主要由高校、科研院所、國家實驗室等進(jìn)行投資,建設(shè)一般以智能計算平臺為主,服務(wù)場景相對單一,建設(shè)成本比智算中心小。平臺可以向師生、研究人員提供免費的算力支撐,服務(wù)于科研教育場景,高校和各類科研機(jī)構(gòu)的科研資源疊加智能算力,為基礎(chǔ)研究、前沿科學(xué)技術(shù)研究提供支持。
2.由第三方出資的建設(shè)模式智算中心建設(shè)的第三方一般為國有控股企業(yè)。該模式下,既實現(xiàn)了政府對項目的建設(shè)全過程把控和需求的充分對接,還能有效利用相關(guān)國有控股公司已有的科技、人力資本、平臺資源、市場等優(yōu)勢。智算中心建成后歸第三方公司所有,可以由政府承諾用其他項目進(jìn)行補貼或者置換。具體細(xì)分為兩類。一種是由地方政府成立新的國有控股公司,專門負(fù)責(zé)智算中心的建設(shè)投資,另一種由地方政府委托或者授權(quán)已有的國有控股公司負(fù)責(zé)出資。
3.基于特殊項目公司的建設(shè)運營(SPV)模式
政府與企業(yè)共同出資成立智算中心建設(shè)運營項目公司,雙方在合作框架協(xié)議下按比例出資建設(shè)智算中心。政府既可以直接投資參與項目建設(shè),也可以通過國有控股公司、下屬事業(yè)單位等參與項目建設(shè)。項目公司需要由政府授權(quán),按照公司化方式獨立運作,負(fù)責(zé)設(shè)計、融資、建造和運營等,向政府、企業(yè)提供服務(wù)或產(chǎn)品并收取費用。該模式優(yōu)勢在于能夠節(jié)約政府部門的項目建設(shè)成本,實現(xiàn)建設(shè)資金籌集,同時啟用了專業(yè)化建設(shè)團(tuán)隊,項目管理方式靈活多樣,在項目設(shè)計、建設(shè)和運營中效率較高。
(二)主流運營服務(wù)模式
智算中心出現(xiàn)時間尚短,其運營模式極具探索性,可按照運營方、服務(wù)類型、服務(wù)內(nèi)容三方面分析。
1.運營方選擇
運營主體指具體負(fù)責(zé)智算中心投入建設(shè)使用后的運營服務(wù)機(jī)構(gòu)。與投資主體相比,智算中心運營主體類型應(yīng)更加多元,運營模式也更為靈活,各類主體通過積極探索差異化個性化運營服務(wù)模式保障智算中心高效穩(wěn)定運行。
一種方式為“投-運”一體化,即由項目投資方出資成立實體運營公司,負(fù)責(zé)管理算力服務(wù)和生態(tài)服務(wù)。團(tuán)隊成員一般包括運營公司自身管理職能部門,算力服務(wù)營銷人員、技術(shù)支持工程師等算力建設(shè)方人員等組成。
一種方式是“投-建”合作模式,即由投資方和承建方共同成立新公司,專職負(fù)責(zé)算力的運營和對外服務(wù)等。該模式下,可以形成投資方和建設(shè)方的運營聯(lián)合,實現(xiàn)運營風(fēng)險共擔(dān),特別是考慮到智算中心后期維護(hù)存在一定的技術(shù)門檻,在此種方式下,可以保證運營的專業(yè)性和高產(chǎn)出。
另一種方式是“建-運”一體化,以承建方主要負(fù)責(zé)運營。具體由承建方成立運營公司,專職負(fù)責(zé)算力運營和對外服務(wù)??紤]到這種模式下由承建方單獨承擔(dān)運營風(fēng)險,可以由政府給予運營費用補貼,為了約束運營公司經(jīng)營行為,可由政府對運營公司進(jìn)行算力利用率等指標(biāo)的考核。運營收入收益可以由運營方和政府部門共享。
2.運營服務(wù)類型
隨著人工智能產(chǎn)業(yè)不斷壯大,應(yīng)用場景的持續(xù)創(chuàng)新,智算中心逐漸走向市場化,服務(wù)對象日益多元。一是綜合型。以地方政府建設(shè)為主,服務(wù)于產(chǎn)業(yè)發(fā)展、科學(xué)研究、公共服務(wù)等多元場景。該類型一般由地方政府主導(dǎo)建設(shè),有效發(fā)揮了智算中心的公共屬性。
二是服務(wù)于產(chǎn)業(yè)發(fā)展。多由產(chǎn)業(yè)園區(qū)或龍頭企業(yè)、企業(yè)聯(lián)盟主導(dǎo)建設(shè),主要服務(wù)于園區(qū)及企業(yè)的發(fā)展,為人工智能產(chǎn)業(yè)向更深更廣行業(yè)應(yīng)用發(fā)展提供算力保障。
三是服務(wù)于科學(xué)研究。該類型多由高校、科研院所、國家實驗室等承擔(dān)建設(shè),以投資較低的智能計算平臺為主,主要是為高校師生、科研人員的科研工作提供算力、算法等支撐。
3.運營服務(wù)內(nèi)容
提供數(shù)據(jù)服務(wù)。
智算中心作為專門服務(wù)于人工智能的數(shù)據(jù)中心,可以為服務(wù)購買方提供多元化的數(shù)據(jù)服務(wù),例如數(shù)據(jù)存儲、數(shù)據(jù)清洗、數(shù)據(jù)分析、數(shù)據(jù)查詢、數(shù)據(jù)可視化等。該服務(wù)屬于智算中心的基礎(chǔ)性服務(wù)。提供算力服務(wù)。服務(wù)購買方無需關(guān)注底層算力芯片和技術(shù)細(xì)節(jié),只需要把計算過程看作“黑箱”,通過選擇業(yè)務(wù)場景、算法模型等,獲取服務(wù)方案。政府部門、企業(yè)、研究機(jī)構(gòu)可以依托智算中心提供的強大算力,驅(qū)動AI模型進(jìn)行數(shù)據(jù)深度加工,實現(xiàn)AI應(yīng)用創(chuàng)新。提供算法服務(wù)。人工智能以算法作為靈魂,算法同樣是
智算中心的主要服務(wù)產(chǎn)品。
隨著技術(shù)的持續(xù)精進(jìn)和場景的持續(xù)拓展,人工智能的算法日趨復(fù)雜,面臨模型訓(xùn)練成本和技術(shù)門檻“雙高”的問題。在算法服務(wù)模式下,有利于購買服務(wù)方專注于自身領(lǐng)域的業(yè)務(wù)邏輯和數(shù)據(jù),依托智算中心提供的語音、圖像、自然語言處理、決策等領(lǐng)域的算法能力,創(chuàng)新智慧應(yīng)用。
提供生態(tài)服務(wù)。
通過智算中心對外提供算力、數(shù)據(jù)和算法服務(wù),實現(xiàn)了不同主體的線上匯聚,有利于打造開放、共享的生態(tài),實現(xiàn)多方融合性、深度化合作探索。同時圍繞購買服務(wù)方的共性需求,智算中心的運營主體和技術(shù)團(tuán)隊可以發(fā)掘研判行業(yè)動態(tài)和用戶需求,提升智算中心的共性支撐能力,引領(lǐng)探索新的業(yè)務(wù)場景,構(gòu)筑新的產(chǎn)業(yè)和生產(chǎn)力。

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多

    好吊日成人免费视频公开| 国产精品不卡免费视频| 熟女体下毛荫荫黑森林自拍| 国产午夜精品美女露脸视频| 色丁香之五月婷婷开心| 丰满人妻熟妇乱又乱精品古代| 一区中文字幕人妻少妇| 中文字幕禁断介一区二区| 亚洲一区二区三区日韩91| 老司机精品福利视频在线播放 | 欧美日韩国产另类一区二区| 欧美综合色婷婷欧美激情| 国产成人精品综合久久久看| 在线欧美精品二区三区| 东京热加勒比一区二区| 午夜视频在线观看日韩| 国产农村妇女成人精品| 不卡在线播放一区二区三区| 噜噜中文字幕一区二区| 欧美午夜国产在线观看| 欧美日韩综合免费视频| 国产熟女一区二区不卡| 亚洲精品黄色片中文字幕| 中文字幕精品一区二区年下载| 国产亚洲中文日韩欧美综合网| 午夜福利网午夜福利网| 欧美黑人在线精品极品| 日韩中文无线码在线视频| 久久国产成人精品国产成人亚洲| 一区二区三区人妻在线| 特黄大片性高水多欧美一级| 欧洲亚洲精品自拍偷拍| 亚洲欧美国产精品一区二区| 免费观看一级欧美大片| 在线播放欧美精品一区| 欧美色婷婷综合狠狠爱| 欧美日韩国产另类一区二区| 天堂网中文字幕在线视频| 日本深夜福利在线播放| 久久精品伊人一区二区| 色综合久久超碰色婷婷|