2月9日(星期二) 【今日物語(yǔ)】 真正的物聯(lián)網(wǎng)是數(shù)據(jù)智能驅(qū)動(dòng)的物聯(lián)網(wǎng), 將激發(fā)新的經(jīng)濟(jì)活力,我們稱之為洞察經(jīng)濟(jì)。通過(guò)云計(jì)算、社交和分析等三大引擎的推動(dòng),大數(shù)據(jù)的能量將日益迸發(fā)出來(lái),使物聯(lián)網(wǎng)成為打造全新用戶體驗(yàn)的核心驅(qū)動(dòng)力。 ——IBM大中華區(qū)首席執(zhí)行總裁 錢(qián)大群 【2015年十大云故障盤(pán)點(diǎn)】
雖然云服務(wù)提供商最擔(dān)心的是長(zhǎng)時(shí)間停電,但是Verizon通信公司震驚了客戶,他們計(jì)劃讓自己的云在整個(gè)周末長(zhǎng)達(dá)40個(gè)小時(shí)的時(shí)間內(nèi)離線,以實(shí)時(shí)全面地進(jìn)行系統(tǒng)維護(hù)。 然而諷刺的是,Verizon升級(jí)自己云基礎(chǔ)設(shè)施的一個(gè)原因是防止未來(lái)的停機(jī)。 很多客戶都對(duì)自己的提供商故意削減他們的云服務(wù)感到氣惱,但也有人安慰說(shuō),Verizon花費(fèi)這40個(gè)小時(shí)無(wú)縫升級(jí)了可能未來(lái)讓他們?cè)趯?shí)時(shí)系統(tǒng)上不中斷運(yùn)行的情況下就進(jìn)行升級(jí)、甚至是不需要重啟服務(wù)器的能力。
就在午夜前,多個(gè)谷歌IaaS數(shù)據(jù)中心宕機(jī),經(jīng)過(guò)大約一小時(shí)的停機(jī),最受影響的客戶服務(wù)在第二天凌晨一點(diǎn)恢復(fù)。 一些連接問(wèn)題持續(xù)了近三個(gè)小時(shí),其中大約40分鐘的時(shí)間內(nèi),本該由谷歌虛擬機(jī)傳送的數(shù)據(jù)消失在了風(fēng)中。 谷歌認(rèn)為這個(gè)問(wèn)題是“不可接受”的,并向受影響的用戶道歉。 大約三個(gè)星期后類(lèi)似事件再次發(fā)生,谷歌的IaaS同樣出現(xiàn)問(wèn)題,導(dǎo)致一些用戶失去了長(zhǎng)達(dá)45分鐘的服務(wù)響應(yīng)。 庫(kù)評(píng):行走在冬夜的冷風(fēng)中,一直被打臉的是谷歌。
在將近12個(gè)小時(shí)內(nèi),全球數(shù)百萬(wàn)人無(wú)法購(gòu)買(mǎi)數(shù)字音樂(lè)、書(shū)籍或者是應(yīng)用。所幸的是,他們大多數(shù)沒(méi)有受到影響。 蘋(píng)果在向用戶致歉中將一個(gè)內(nèi)部DNS錯(cuò)誤歸結(jié)為使iTunes和App Store服務(wù)中斷的原因。一些iCloud電子郵件帳戶也受到了短暫的影響。 庫(kù)評(píng):大多數(shù)人沒(méi)有收到影響的原因是除去應(yīng)用之外,購(gòu)買(mǎi)數(shù)字音樂(lè)和書(shū)籍實(shí)在沒(méi)什么人碰。
微軟的兩項(xiàng)Azure公有云服務(wù)在美國(guó)中部的客戶中中斷了2個(gè)多小時(shí),微軟將其歸結(jié)為“網(wǎng)絡(luò)基礎(chǔ)設(shè)施問(wèn)題”。 根據(jù)微軟在Azure狀態(tài)網(wǎng)頁(yè)上的報(bào)告,這次癱瘓事件發(fā)生在CDT時(shí)間下午1點(diǎn)剛過(guò),影響到微軟Azure虛擬機(jī)(基礎(chǔ)設(shè)施即服務(wù))和Azure云服務(wù)(平臺(tái)即服務(wù))產(chǎn)品的客戶。 微軟將該問(wèn)題描述為“部分服務(wù)中斷”,并表示該服務(wù)已經(jīng)在CT時(shí)間3:19完全恢復(fù)可用。
在第二次故障發(fā)生之前,微軟公有云甚至都沒(méi)有撐過(guò)24小時(shí),就中斷了虛擬機(jī)、網(wǎng)站和其他云服務(wù),這次影響到美國(guó)東海岸更密集的客戶群。 微軟在Azure狀態(tài)頁(yè)面上報(bào)告,這次故障從EDT時(shí)間下午1:30開(kāi)始。作為全球第二大公有云提供商,微軟向客戶通知稱這次服務(wù)中斷是源自于存儲(chǔ)系統(tǒng)發(fā)生的故障。
包括電子郵件在內(nèi)的11項(xiàng)蘋(píng)果服務(wù)遭遇了11個(gè)小時(shí)的中斷。其中一些完全癱瘓,其他的則運(yùn)行非常非常緩慢。 中斷的服務(wù)包括iCloud Drive、Photos、Documents、Find My iPhone、Back to My Mac、iCloud Backup、iCloud Keychain、iCloud Mail、iMovie Theater以及iWork for iCloud Beta。 根據(jù)蘋(píng)果的系統(tǒng)狀態(tài)頁(yè)面,全球5億的iCloud用戶中有40%受到了影響。 庫(kù)評(píng):還記得2014年的蘋(píng)果泄露明星艷照事件嗎。
在比利時(shí)的一個(gè)周四早上,谷歌靠近St. Ghislain的一座超高能效數(shù)據(jù)中心遭遇4次閃電襲擊。 這次雷暴導(dǎo)致一系列技術(shù)故障,最終造成一些I/O錯(cuò)誤。 據(jù)谷歌稱,只有很小一部分保存著Google Compute Engine實(shí)例的磁盤(pán)上出現(xiàn)了數(shù)據(jù)丟失。 雖然谷歌表示所有數(shù)據(jù)最終都找回并恢復(fù),但數(shù)據(jù)中心理應(yīng)讓服務(wù)器和客戶數(shù)據(jù)能夠應(yīng)對(duì)像這次閃電造成的高壓脈沖。 在這種情況下,要責(zé)怪的只能是這個(gè)超高能效架構(gòu)遭受的史詩(shī)般的雷暴了。
對(duì)于亞馬遜而言,9月20日是個(gè)糟糕的一天。美國(guó)東海岸亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)出了故障,5小時(shí)后才恢復(fù)。 一位AWS發(fā)言人在對(duì)此事作出正式回應(yīng)時(shí)表示,“2015年9月20日太平洋夏令時(shí)間凌晨02時(shí)13分到早上7點(diǎn)10分,美國(guó)東部地區(qū)的亞馬遜DynamoDB服務(wù)的讀寫(xiě)操作出現(xiàn)錯(cuò)誤率非常大的情況,影響了該地區(qū)的其他AWS服務(wù),并造成一些AWS客戶也受到錯(cuò)誤率增大的影響?!?/p> 庫(kù)評(píng):網(wǎng)友表示,AWS還好不是在周一(9月21日)上午掛掉的,否則網(wǎng)友們少不了吐糟。AWS是周日(9月20日)掛的,周日凌晨太平洋夏令時(shí)間3點(diǎn)(北京時(shí)間周日下午6點(diǎn))掛了,幾乎沒(méi)有人注意到。
谷歌的網(wǎng)絡(luò)引擎試圖激活一個(gè)指向歐洲運(yùn)營(yíng)商的鏈接,但是對(duì)方網(wǎng)絡(luò)處于處理路由一個(gè)令人驚訝的高流量,但事實(shí)并非如此。 這條線路快速飽和,連接網(wǎng)絡(luò)丟掉了大多數(shù)從受影響的西歐數(shù)據(jù)中心路由到東歐和中東的數(shù)據(jù)包。 Google Compute Engine無(wú)法與這些地區(qū)進(jìn)行通信長(zhǎng)達(dá)70分鐘,從PST時(shí)間上午11:55到下午1:05。 據(jù)谷歌稱,在該故障發(fā)生期間,該季度的流量減少了13%。
微軟云計(jì)算服務(wù)Azure在歐洲多個(gè)國(guó)家發(fā)生了停擺故障,這導(dǎo)致許多用戶無(wú)法使用辦公軟件。 微軟正在向云計(jì)算,尤其是傳統(tǒng)軟件的云服務(wù)化轉(zhuǎn)型,這意味著一旦發(fā)生網(wǎng)絡(luò)服務(wù)故障,用戶將無(wú)法訪問(wèn)存放在云中的文檔。之前,微軟的云計(jì)算平臺(tái)在歐洲多個(gè)國(guó)家發(fā)生了大面積故障,其中Office365的用戶也不幸中招。 微軟隨后表示,是Active Directory配置錯(cuò)誤導(dǎo)致了這次癱瘓。 |
|