4月20日,一年一度的NAVIGATE領(lǐng)航者峰會在云上開啟,本屆峰會以“智·變”為主題。6天33個專題120+場演講,紫光集團及旗下新華三集團攜客戶、合作伙伴完整呈現(xiàn)了一個正在“智·變”的世界。各種智能化技術(shù)的應用,讓我們看到了智慧的更多可能性。英特爾將助力新華三在科技創(chuàng)新的路上,持續(xù)為百行百業(yè)提供優(yōu)質(zhì)的解決方案,共論“智·變”之道,共啟“智·變”之旅。 本文來講講新華三網(wǎng)絡(luò)的“智·變”。 網(wǎng)絡(luò)亟需智能化 數(shù)據(jù)中心網(wǎng)絡(luò)近些年最大的變革莫過于軟件定義網(wǎng)絡(luò)(Software?Defined?Network,SDN)的誕生,其通過使控制面與數(shù)據(jù)面分離,讓網(wǎng)絡(luò)具備了更高的敏捷性、可擴展性和可編程能力,在大幅提升網(wǎng)絡(luò)自動化水平的同時,有效降低了用戶在網(wǎng)絡(luò)部署和運維方面的壓力。 正因為此,短短幾年,SDN就獲得了廣泛的應用,成為企業(yè)級用戶部署和配置網(wǎng)絡(luò)服務(wù)的重要選擇。 不過,好景不長。隨著用戶業(yè)務(wù)與網(wǎng)絡(luò)服務(wù)綁定的更為緊密,企業(yè)級網(wǎng)絡(luò)應用規(guī)模的不斷擴展,特別是在大規(guī)模云數(shù)據(jù)中心這種復雜度高、調(diào)整頻繁的應用場景中,即便擁有自動化輔助手段,用戶的運維和成本壓力依舊很難真正緩解。 以企業(yè)園區(qū)為例,網(wǎng)絡(luò)服務(wù)不僅要滿足日常辦公應用,還需為生產(chǎn)制造、移動辦公、視頻會議等不同應用、不同質(zhì)量要求的場景提供支撐,這意味著網(wǎng)絡(luò)要像服務(wù)器、存儲一樣隨時滿足業(yè)務(wù)需求的突然變化,峰值要增加資源,谷底要減少。顯然,僅自動化是不夠的,網(wǎng)絡(luò)需要更智能化。 為了滿足用戶的實際需求,新華三于2019年推出了更具智能化屬性的先知網(wǎng)絡(luò)架構(gòu)(Seer Network Architecture,以下簡稱SNA),并以此為基礎(chǔ)開發(fā)數(shù)據(jù)中心網(wǎng)絡(luò)產(chǎn)品解決方案。短短一年間,該技術(shù)已在眾多用戶部署應用,反響熱烈。以山東大學為例,通過部署SNA方案,問題定位從小時級提至分鐘級,網(wǎng)絡(luò)維護工作量減少了80%。 今年,新華三對SNA再次進行了升級,嵌入了智能分析器和智能控制技術(shù),也就是說網(wǎng)絡(luò)智能化程度再獲提升。 SNA的原理是什么? 簡單來說,SNA的核心在于能夠通過“感知-分析-決策”模式,將豐富的網(wǎng)絡(luò)運維數(shù)據(jù)通過人工智能(Artificial Intelligence, AI)的訓練和推理過程,轉(zhuǎn)化為更優(yōu)的網(wǎng)絡(luò)策略,進而幫助最終用戶有效提升網(wǎng)絡(luò)智能分析和業(yè)務(wù)編排能力,降低成本。 具體來說,SNA架構(gòu)如圖一所示,其由先知服務(wù)中心、先知分析器(SeerAnalyzer)以及網(wǎng)絡(luò)控制器(SeerEngine)三大模塊組成。 其中,先知服務(wù)中心作為網(wǎng)絡(luò)智能管理、控制和編排的核心,不僅可根據(jù)用戶的業(yè)務(wù)需求實現(xiàn)智能編排、業(yè)務(wù)協(xié)同和資源調(diào)度,更能匯總各個網(wǎng)絡(luò)設(shè)備的數(shù)據(jù),在其內(nèi)部AI平臺中進行建模、評估、訓練和調(diào)優(yōu),并形成一系列智能網(wǎng)絡(luò)模型供調(diào)用。 圖一、SNA整體架構(gòu) 如果把先知服務(wù)中心比作SNA的“大腦”,那么先知分析器和網(wǎng)絡(luò)控制器就是SNA的“手和眼”。通過Telemetry等毫秒級采集技術(shù),先知分析器可從網(wǎng)絡(luò)基礎(chǔ)架構(gòu)中感知和采集各類數(shù)據(jù),并經(jīng)清洗、抽取、轉(zhuǎn)換等處理過程,上傳到先知服務(wù)中心中。 經(jīng)過先知服務(wù)中心訓練和調(diào)優(yōu)的模型,在云端或先知分析器中進行AI推理后,可形成有效的自動化網(wǎng)絡(luò)部署和調(diào)優(yōu)策略。而網(wǎng)絡(luò)控制器則會根據(jù)這些策略,以可編程的方式對網(wǎng)絡(luò)基礎(chǔ)架構(gòu)實施管理,包括實現(xiàn)業(yè)務(wù)的自動化部署,網(wǎng)絡(luò)資源的最優(yōu)路徑調(diào)度,以及網(wǎng)絡(luò)故障的預測告警和快速排除等。 大腦、手、眼協(xié)同配合,讓網(wǎng)絡(luò)變得更智能。目前,SNA已經(jīng)能為用戶提供20余種智能網(wǎng)絡(luò)算法以及100多種網(wǎng)絡(luò)狀態(tài)洞察方法。 智慧背后的強力支撐 講到這里,必須提到為SNA提供強大算力支持及多種訓練模型優(yōu)化方案的英特爾。眾所周知,由交換機、路由器、無線AP等各類基礎(chǔ)設(shè)備構(gòu)成的網(wǎng)絡(luò)中,各種事務(wù)日志、易損件狀態(tài)、異常告警等信息是巨量的,如果不能有效的處理,這些數(shù)據(jù)基本等同于沒用,而處理這些數(shù)據(jù)需要強大的算力。 正如新華三AI研究院院長敖襄橋所說,“SNA通過AI技術(shù)實時感知網(wǎng)絡(luò)狀態(tài),基于網(wǎng)絡(luò)數(shù)據(jù)分析實現(xiàn)自動化部署和風險預測,從而讓網(wǎng)絡(luò)能更智能、更高效地為最終用戶業(yè)務(wù)提供支撐。通過引入第二代英特爾至強可擴展處理器以及面向英特爾架構(gòu)優(yōu)化的TensorFlow,SNA的AI訓練能力獲得了大幅提升,讓企業(yè)網(wǎng)絡(luò)在應對復雜業(yè)務(wù)場景時更加游刃有余?!?/p> 究竟提升有多么明顯?新華三聯(lián)合英特爾進行了一系列面向?qū)嶋H應用場景的測試。下面就以DNS隧道檢測模型為例,展示一下提升后的效果。 作為網(wǎng)絡(luò)應用中重要的基礎(chǔ)協(xié)議之一,惡意程序經(jīng)常會利用域名系統(tǒng)(Domain NameSystem,DNS)請求時形成的DNS隧道來對網(wǎng)絡(luò)實施攻擊,例如將數(shù)據(jù)封裝在DNS請求數(shù)據(jù)包中,從而繞開內(nèi)外網(wǎng)隔離等防御措施,造成企業(yè)內(nèi)網(wǎng)的關(guān)鍵信息被透傳。 由于這類惡意攻擊隱藏到了DNS隧道中,因此,如圖二所示,常規(guī)的網(wǎng)絡(luò)安全檢測方法,例如特征碼檢測、流量監(jiān)測、威脅標志(Indicators Of Compromise,IOC)檢測等都難以對其發(fā)揮作用。針對此,新華三以海量DNS請求報文為基礎(chǔ),在SNA Service Center中構(gòu)建基于長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)的DNS隧道檢測模型,來幫助用戶提升網(wǎng)絡(luò)安全等級。 圖二、 基于LSTM的DNS隧道檢測模型 作為遞歸神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)的重要衍生模型,LSTM可以通過3個特別的“門”結(jié)構(gòu)設(shè)計,來大幅提升模型的記憶時長,因此特別適用于DNS請求這類典型的時序性數(shù)據(jù)。其可以圍繞一段時間內(nèi)的黑白名單數(shù)據(jù)集中正常和惡意請求的不同特征,例如主機名、DNS名稱、特定字符等,來預測新的請求中可能面臨的安全風險。 顯而易見,更長的時序特征提取、更復雜的門結(jié)構(gòu),意味著模型在訓練和推理中需要更多的計算量。為此,新華三引入第二代英特爾至強可擴展處理器和面向英特爾架構(gòu)優(yōu)化的TensorFlow。 圖三、DNS隧道檢測模型訓練性能歸一化對比 對比測試中,兩組測試的硬件配置相同,但基準組搭配的是原生TensorFlow,對比組搭配的則是面向英特爾架構(gòu)優(yōu)化的TensorFlow。驗證測試的黑白名單數(shù)據(jù)集包含了20000條黑名單樣本和30000條白名單樣本,并以10000條數(shù)據(jù)作為測試集。測試結(jié)果如圖三所示,同一硬件平臺,經(jīng)過優(yōu)化后,訓練性能可提升到基準值的3.2倍。 不止于網(wǎng)絡(luò),一切智能化 其實,不僅僅是網(wǎng)絡(luò),伴隨智能化浪潮來襲,更多企業(yè)級ICT設(shè)備都在朝智能化方向發(fā)展,特別是部署在大型云數(shù)據(jù)中心內(nèi),在運維和管理上同樣需要AI助力的設(shè)備。 以服務(wù)器為例,早在多年前其運維就開始導入可感知其運行狀態(tài)(包括使用率、耗電量、散熱情況以及故障反饋)的遙測技術(shù),以及與之相匹配的“監(jiān)控-學習-行動-決定“管理機制,而隨著AI的一系列應用優(yōu)勢,包括可利用數(shù)據(jù)訓練更好用和實用的管理和策略模型,并在無需或較少人工介入的情況下及時且并發(fā)響應不同事件,有的放矢地實施策略等能力在這些設(shè)備管理和運維過程中越來越凸顯其重要性,將AI方法引入這些ICT設(shè)備的管理和運維也成為大勢所趨。 實際上,繼SNA后,新華三已經(jīng)開始攜手英特爾開展服務(wù)器管理方面的智能化探索。 在實際的比對測試中,相同硬件配置下,利用第二代英特爾至強可擴展處理器與面向英特爾架構(gòu)優(yōu)化的TensorFlow組合,模型的推理性能可提升至基準值的2.71倍;而在進一步導入并行多實例優(yōu)化后,模型的推理性能還能在不影響延時的情況下,進一步提升到基準值的10.98倍。 圖四、服務(wù)器利用率模型的推理性能歸一化對比測試結(jié)果 總結(jié)全文,測試數(shù)據(jù)已經(jīng)說明了一切,第二代英特爾至強可擴展處理器與面向英特爾架構(gòu)優(yōu)化TensorFlow的組合帶來的提升非常明顯。因此,我們有理由相信未來更多ICT設(shè)備會采用這樣的技術(shù)來提升智能化水平,而新華三和英特爾雙方也必然會在更多方面展開合作。智·變,在加速。 |
|