前言 臺風蘇迪羅于8月8日登陸我國沿海,臺灣、福建、江西、浙江、安徽、江蘇等地均受到影響。 “臺風到哪里了”,這兩天又成了一個全民話題。 浙江省水利廳研發(fā)的臺風路徑實時發(fā)布系統(tǒng),可以讓任何一個人都能通過網(wǎng)絡(luò)及時了解臺風信息。 臺風的季節(jié)性反應(yīng)在IT系統(tǒng)上,是訪問量波峰和波谷的巨大差異。 隨著關(guān)注度的提升,這種差異被不斷拉大。臺風來的時候需要緊急擴容,臺風走了機器就閑置了。冗長的采購擴容流程和機器的復(fù)用問題難以解決。 2012年,浙江省水利廳選擇將系統(tǒng)遷移到阿里云上,借助云計算的彈性應(yīng)對巨大的峰谷差異。 臺風帶來的苦惱
先看一下網(wǎng)站近些年的業(yè)務(wù)量變化情況(由于缺少2012年及之前的數(shù)據(jù)故只能用現(xiàn)在的數(shù)據(jù)來讓大家有個直觀的感受): 2012年“海葵”期間峰值PV達到350W,UV達到120W 2015年“燦鴻”期間峰值PV達到1434W,UV達到508W 這些業(yè)務(wù)高峰基本上都是每年的7月至10月間產(chǎn)生的,其余時間網(wǎng)站訪問量只有幾千。對,沒錯,就是幾千。 從數(shù)據(jù)來看,三年時間網(wǎng)站的關(guān)注度有了近5倍的增長。 與之對應(yīng)的服務(wù)器數(shù)量,也是隨著季節(jié)變化而變化。 比如平常只需要2臺服務(wù)器即可,但是臺風來了就需要增加到12臺,那么10臺物理機采購就需要近30W塊,但是臺風過后這10臺物理機又沒有任何負載了,怎么安置他們又是個問題。 未來,這一問題可能還會進一步加劇。
由于浙江省水利廳內(nèi)部IT平臺較多,人員較少,沒有辦法安排專門的運維工程師和DBA來支持臺風網(wǎng)站,平時都是由開發(fā)人員來兼職。 需要每個月基于網(wǎng)站的訪問情況和歷史數(shù)據(jù),對平臺服務(wù)器數(shù)量進行評估、調(diào)整,人力和工作量較大。 如果產(chǎn)品可以承擔大部分的運維工作,做到自動化處理服務(wù)器的增刪,數(shù)據(jù)庫的備份等工作,那么將大大的節(jié)省了成本,并且能將更多的精力集中在臺風平臺的優(yōu)化、業(yè)務(wù)邏輯優(yōu)化上。
普通的IDC和自建機房最怕的就是大流量DDoS攻擊,這種攻擊會導(dǎo)致機房出口線路擁塞,影響該機房所有用戶和業(yè)務(wù)。 綜上所述,顯然這種傳統(tǒng)的處理方式反應(yīng)速度太慢。對于臺風路徑實時發(fā)布系統(tǒng)這種災(zāi)害預(yù)警網(wǎng)站,如果長時間無法打開,容易影響到臺風期間大家的日常生活安排。 畢竟現(xiàn)在通過手機就可以第一時間獲取最新的臺風位置等信息,非常便捷。 云計算如何應(yīng)對臺風
之前傳統(tǒng)的方式會經(jīng)常遇到“平常時刻好用不要用,關(guān)鍵時刻想用不能用”的尷尬局面。 于是浙江省水利廳在2012年做出創(chuàng)新,將臺風網(wǎng)站遷入阿里云,當時主要考慮到平穩(wěn)上云,所以并未對網(wǎng)站架構(gòu)等做大量調(diào)整。當初僅使用了阿里云的云服務(wù)器(ECS)、負載均衡(SLB)和開放存儲服務(wù)(OSS)產(chǎn)品。 上云之后,浙江省水利廳確實體會到了按量購買、快速調(diào)整的便利性,再無之前的顧慮。 當時的網(wǎng)站架構(gòu)簡單的描述如下: 經(jīng)過這樣的改造后,當年網(wǎng)站僅用5臺云服務(wù)器就成功的支撐了峰值350W的訪問量。
臺風網(wǎng)站下一步需要對外提供移動端的支持,一旦移動端開放了,那么訪問量將會劇增,畢竟移動端的便利性是PC端無法比擬的。 同時臺風網(wǎng)站初次改版上云后發(fā)現(xiàn)使用開放存儲服務(wù)(OSS)來做臺風路徑數(shù)據(jù)、云圖數(shù)據(jù)的中轉(zhuǎn)還是會有延時的問題。 于是,浙江省水利廳又再次對網(wǎng)站架構(gòu)及產(chǎn)品使用上做了如下調(diào)整: 云服務(wù)器(ECS)里的網(wǎng)站環(huán)境部署及網(wǎng)站代碼調(diào)整優(yōu)化,與數(shù)據(jù)盤解耦,軟件及數(shù)據(jù)全部放置到系統(tǒng)盤。 使用該系統(tǒng)盤制作自定義鏡像,后面擴容機器即可使用自定義鏡像快速擴容無需重新配置環(huán)境和拷貝網(wǎng)站數(shù)據(jù)。 啟用彈性伸縮服務(wù)(ESS),對同一角色的服務(wù)器性能評估并在SLB中自動完成擴容、縮容,解放人力、提升效率。 將臺風路徑數(shù)據(jù)從開放存儲服務(wù)(OSS)里遷移到云數(shù)據(jù)庫(RDS)中??梢员WC各WEB服務(wù)器獲取到的臺風路徑數(shù)據(jù)的實時性和一致性。 由于臺風路徑數(shù)據(jù)同步周期為1個小時及以上,所以網(wǎng)站前端機沒有必要每次訪問都調(diào)用數(shù)據(jù)庫。在網(wǎng)站前端機中配置緩存,節(jié)省數(shù)據(jù)庫的資源,提升網(wǎng)站訪問體驗。 經(jīng)過這樣改造后,今年“燦鴻”期間,峰值PV達到1434W,UV超過500萬,其中有1000W的訪問量來至于移動端。
臺風期間使用高防IP功能 高防IP是將大量攻擊用戶的流量引入到高防平臺,由平臺進行分析過濾,將正常的請求轉(zhuǎn)發(fā)給真實的業(yè)務(wù)服務(wù)器。 阿里云安全品牌云盾的DDoS高防IP是東半球最大的高防中心,防御DDoS、CC攻擊。用戶無需部署,支持一鍵彈性升級防御量。 網(wǎng)站架構(gòu)持續(xù)優(yōu)化 “燦鴻”期間的峰值PV里有70%的流量是來自于移動端,且網(wǎng)站的訪問量增長劇烈。 需要結(jié)合阿里云更多的產(chǎn)品,對自身架構(gòu)上做些改造以應(yīng)對未來的高速發(fā)展。 備注
|
|