前言: 企業(yè)要更換辦公地址的時候,最頭疼的問題就是搬遷數(shù)據(jù)中心,數(shù)據(jù)中心的搬遷可不是搬家那么簡單,是否能順利搬遷,將成為保障企業(yè)業(yè)務連續(xù)性的關鍵要素,IDC數(shù)據(jù)中心的選擇過程將圍繞最適合環(huán)境的變量展開,如何定義需求、選擇合適的IDC提供商及協(xié)商實際遷移到新空間的細節(jié)等因素,都需要進行嚴格地評估,下面看看從預置的數(shù)據(jù)中心遷移到IDC數(shù)據(jù)中心注意事項。 數(shù)據(jù)中心遷移常見的問題 (1)領導不明確 在規(guī)劃階段最常見的錯誤是未能建立明確的領導。這意味著在遷移過程中的各個階段中要確定誰負責明確的溝通,帶領團隊。在一個單一的部門,默認情況下會采用代表他們最佳利益的領導方式。該項目負責人必須公平公正,他需要理解并準確地反映了每個團隊的目標和成功的標準。這個人還必須有要求很好的執(zhí)行權力和溝通技巧,以保持每個人致力于實現(xiàn)同一目標。
(2)缺乏一個完整的基礎設施評估 在探索過程中最常見的錯誤是缺乏一個完整的基礎設施評估。特別是對于每個機架和每個設備的文檔和其相關聯(lián)的應用程序。這一評估應該注意所有的東西,包括物理和虛擬設備,網絡設備,網絡拓撲等,不要因為沒有這些設備而走捷徑,遷移太多的信息遷移。
提示:包括評估業(yè)務和技術的相互依存關系。例如,應用程序,網絡和數(shù)據(jù)庫服務器等相關的應用程序必須作為一個包進行遷移。 (3)低估遷移時間 在實際的遷移過程中,一個常見的錯誤是沒有設定現(xiàn)實的時間預期。生產遷移本質上比測試遷移要慢,因為它們需要更多的照顧和關注細節(jié)。
提示:使用測試遷移來評估實際遷移時間。你會驚奇地發(fā)現(xiàn)一些應用程序需要多長時間。不要期待遷移過程會為此等待。 (4)進行設置,(實際上)卻遺忘 在新的基礎設施管理過程中最常見的錯誤是擁有“設置(實際上)卻遺忘”的心態(tài)。每個人都很興奮,恨不得立即著手遷移。這時要確保技術和業(yè)務穩(wěn)步進行,而不要遺漏任何細節(jié)。 提示:在完成遷移后,在48小時內至少花費一些時間進行主動監(jiān)測和支持。
(5)認為大功告成 在規(guī)模階段最常見的錯誤,就是認為現(xiàn)在大功告成,而失去了動力,這些話可能會在遷移的過程中,超出了企業(yè)設置年度計劃,維持季度審查,并制定特設的基礎設施需求的計劃?!?/p> 企業(yè)剛剛投入了大量的時間、精力和金錢,投入到一個艱難的過程中?,F(xiàn)在不要因為遷移已經結束,就失去動力或不再關注細節(jié)。這不是為數(shù)據(jù)中心遷移的唯一模式,而這些肯定不是唯一的錯誤的人做。這并不是數(shù)據(jù)中心遷移的唯一模式,當然這些錯誤并不是人們所犯的全部錯誤,還會有其他的錯誤發(fā)生。這里最重要的是在不斷更新流程中,企業(yè)的技術、操作要求,以及經驗都在發(fā)生變化。 預置的數(shù)據(jù)中心遷移到IDC數(shù)據(jù)中心,幾個關鍵注意事項: (1)位置(物理位置和IT人員的位置) 就像在房地產市場選房一樣,選址永遠都是最重要的。就IDC提供商而言,選址意味著該地區(qū)能夠提供的資源,位置對數(shù)據(jù)中心資產的安全性及良好的可用性有很大的影響。應該考慮到當?shù)貧夂?(洪水、極端溫度波動、風暴頻率及強度)、地震歷史和關鍵基礎設施(如線路、道路及機場)的可用性。對于必須更嚴格遵守法規(guī)(如金融行業(yè))的行業(yè),可能會禁止在國際甚至國家邊界地區(qū)為客戶提供存儲數(shù)據(jù)的業(yè)務。 同樣的原則也適用于支持員工。無論是否保留自己的員工,還是讓IDC提供商提供人員維護,都需要了解IDC對人員安排。雖然一些IDC租戶仍然可以保留現(xiàn)場的IT人員,其他租戶則完全將其作為合同的一部分進行外包,在進行下一步計劃前,根據(jù)自身情況制定一個檢測程序的計分卡,目的在于盡可能減少潛在供應商,這對于租賃IDC空間的客戶而言是個中肯的建議。 (2)冷卻系統(tǒng)運行情況 獲得固定電力來源之后,IDC空間中冷卻系統(tǒng)是必不可少的。在優(yōu)化冷卻成本和效率方面,電源使用效率(PUE)是至關重要的。PUE可以顯示與機架交付電力有關的支出費用是多少。理想情況下,租戶只需將功耗(計量的)乘以PUE系數(shù),以表明冷卻所需的額外功率。尋找使用混合冷卻技術(例如,利用自然冷卻)IDC,保障制冷系統(tǒng)的冗余。 (3)擁有DCIM軟件 盡管DCIM 軟件已成為管理數(shù)據(jù)中心的標準,但并不是所有的IDC提供商都能提供完整的技術支持。因為數(shù)據(jù)中心歷來有很多專用設備,這些設備具有很多復雜的技術,而管理這些技術可能會出現(xiàn)問題。通常情況下,設備都有管理軟件,但是個別軟件系統(tǒng)可能無法兼容或集成。這將導致數(shù)據(jù)中心內的混亂情況。所以要確保IDC提供商要具有DCIM軟件。了解數(shù)據(jù)中心所有的系統(tǒng)是否互聯(lián)?所有的傳感器都連接到軟件并由這些軟件監(jiān)控嗎?它們能夠動態(tài)地生成儀表板及報告并快速移動到場地、機柜及機架級嗎?他們具有端到端的資產管理能力嗎?他們已經集成到其它 ITSM系統(tǒng)(IT服務管理系統(tǒng))并使您可以利用最需要的功能嗎? (4)物理安全狀況 如果沒有嚴密的金融資產安全保證,任何銀行都別妄想正常運營。數(shù)據(jù)中心資產也同樣如此,這可能只包含人力資本之外的最有價值的資產。對于真正需要安全的設施,請堅持任用內部安全團隊。在分析安全模式時,一定要評估內部安全人員、分層的安全區(qū)、攝像頭及安全系統(tǒng),這些系統(tǒng)可以360度覆蓋,且具有高級安全認證,如PCI DSS 2.0、SSAE 16和ISO 27002。 (5)電力供應情況 電力既是一個廣義的問題,也是一個狹義的問題。在宏觀層面上,需要考慮區(qū)域電網基礎設施的穩(wěn)定性及冗余能力。尋找發(fā)電站、變電站、電纜到數(shù)據(jù)中心的距離、位置以及對于整個配電系統(tǒng)的冗余的考慮。確保沒有電力限制會IDC區(qū)域的運行。這聽起來覺得有些遠,但是如果你經歷過拉閘限電,或者用電高峰期或季節(jié)性供應而停電,就不會如此認為。不要忘記對當?shù)刈罱娏χ袛嗪途S修記錄進行了解,以便制定對應的應急計劃。 在微觀層面上,需要考慮在IDC空間內進行電力監(jiān)測。他們是否能精確量化計量功率,是否具有隨著時間的推移增加或降低功耗的靈活性,從而清楚目前使用電力的情況?他們是否有辦法檢測、監(jiān)測并緩解電力激增和其他異常?當電力中斷發(fā)生在與外部電源無關的托管設施中時,他們的備份和災難恢復計劃是什么?所有這些都需要仔細考慮。 (6)服務等級協(xié)議(SLA) 通過明確的SLA可以為租戶提供可見性和管理工具,這是建立良好持續(xù)關系的基石,可以主動避免沖突,選擇正確的托管服務提供商時,創(chuàng)建或擁有良好的SLA并建立明確的劃界線至關重要,通常,SLA可以根據(jù)具體的租戶需求和正在托管的資產進行調整。 這意味著識別關鍵工作負載,應用程序,服務器等。 它強調的是,當您為數(shù)據(jù)中心IDC付費時,您購買的是關鍵的基礎設施和正在進行的維護,您要確保SLA包括維護和測試。尋找備有證明文件的MOPs(程序法)和SOPs(標準操作程序),不斷地使用并改進。還要確保他們包括良好的管理工具來監(jiān)測電源、冷卻、機架情況、具有常規(guī)的正常運行時間及狀態(tài)報告的環(huán)境,并提供日志聚合工具,用于收集各種服務器、系統(tǒng)和安全日志進行分析。這樣,寶貴的時間可以花在識別和解決潛在問題上,而不是互相推諉責任。 (7)工作負載和工作流管理情況 在檢查完所有物理因素之后,現(xiàn)在應該關注工作負載的傳送方式以及工作流程的管理方式,關于組織通過數(shù)據(jù)中心嘗試提供的數(shù)據(jù)或應用程序的類型,有幾個關鍵的考慮因素,云和大數(shù)據(jù)將繼續(xù)發(fā)展和改變組織如何分配數(shù)據(jù),特別是當信息在多個位置之間分配時,現(xiàn)在可以比以往任何時候都更有效和快速地傳送信息,IT視野正在由“數(shù)據(jù)點播”,BYOD(自帶設備)和物聯(lián)網(物聯(lián)網)等重要轉變塑造,因此您希望確保您的托管服務提供商不僅在 - 但是,也能夠保持這樣做,因此它不會使您的數(shù)據(jù)中心管理過時的速度比應用程序更快。 同樣,平衡工作負載,連續(xù)性和災難恢復對于可持續(xù)性至關重要,數(shù)據(jù)必須移動的距離和托管提供商提供的帶寬量可能意味著偉大的用戶體驗與失敗的托管部署之間的差異,他們的工作流管理系統(tǒng)是否或者他們有多好,可以幫助確定某些數(shù)據(jù)和基礎設施組件的交付優(yōu)先級。 此外,它將有助于確定哪些需要具有較高的正常運行時間要求與優(yōu)先級較低的應用程序相比,在瓶頸或緊急情況下,您將能夠首先訪問最重要的信息。 預置的數(shù)據(jù)中心遷移到IDC數(shù)據(jù)中心的風險與對策 風險一:服務可用性 數(shù)據(jù)中心的主要目的就是,托管運行為業(yè)務提供服務的應用程序。無論你何時考慮從一個數(shù)據(jù)中心遷移到另一個數(shù)據(jù)中心,必須首先考慮底層服務的可用性。這些服務包括:活動目錄之類的基礎設施應用程序和SAP之類的面向客戶的應用程序。 當服務從一個數(shù)據(jù)中心轉移到另一個數(shù)據(jù)中心時,你必須制定一項策略,特定的服務何時遷移和應用程序對彼此的依賴關系都必須考慮進來。確保服務可用性的一個常見做法就是,建立遷移組,然后把互相依賴的應用程序分到同一組。 至于支持大多數(shù)企業(yè)應用程序的服務,比如活動目錄和DNS,一個常見做法就是,跨數(shù)據(jù)中心擴展這些核心服務。服務依然在兩邊的數(shù)據(jù)中心,直到遷移完成。 風險二:數(shù)據(jù)遷移 將應用程序數(shù)據(jù)從一處遷移到另一處可能是數(shù)據(jù)中心遷移工程的最復雜的環(huán)節(jié)之一,一種簡單的方案就是執(zhí)行基于磁帶或硬盤的備份,并執(zhí)行恢復,不過,類似平移遷移,備份和恢復在及時恢復服務方面提供的能力很有限。另外,備份和恢復并不是最適合數(shù)據(jù)遷移的理想方法――它更適合數(shù)據(jù)恢復方案有限的災難恢復這種場景。 為大多數(shù)數(shù)據(jù)遷移選擇的主要方法是配置一條租用線路。如果兩個數(shù)據(jù)中心之間有了一條專用連接,遷移團隊就能充分利用基于硬件或軟件的同步機制,執(zhí)行數(shù)據(jù)遷移。除了能夠遷移數(shù)據(jù)外,這個方法還可以用來執(zhí)行P2P遷移、P2V遷移和虛擬機到虛擬機(V2V)遷移。 許多企業(yè)決定在兩個數(shù)據(jù)中心之間擁有多條連接。連接至少需要兩條線路:一路連接支持平常的最終用戶和數(shù)據(jù)中心到數(shù)據(jù)中心的流量,以便支持活動目錄等應用程序和應用程序到應用程序的流量;第二路、通常速度更快的連接用來執(zhí)行數(shù)據(jù)同步。雙路連接可以防止兩種全然不同的流量干擾或影響對方。 風險三:硬件遷移 遷移物理服務器通常有兩種策略:一種名為“平移”(lift and shift),另一種名為數(shù)據(jù)復制,在平移策略中,硬件放到活動卡車上,然后安裝到新的數(shù)據(jù)中心。系統(tǒng)在搬到新址之前已備份好,不過這個策略會帶來一些風險。 最大的風險之一是物理服務器可能在搬運過程中遭到損壞,搬運過程中的損壞會導致備份毫無用處。另一個挑戰(zhàn)就是兩個數(shù)據(jù)中心相隔太遠,因而這個方法不現(xiàn)實,無法保證服務在可以接受的時間段內可用。 第二種策略是通過一條租用線路來進行數(shù)據(jù)遷移。租用線路帶來了兩種sub-swing硬件方案。一種方案是執(zhí)行物理機到物理機(P2P)遷移。P2P遷移需要購置同類硬件,以便原有數(shù)據(jù)中心的應用程序和硬件可以遷移過去,同時確保停機時間最短。 另一種硬件遷移方案是物理機到虛擬機(P2V)轉換。P2V需要通過租用線路,將物理機轉換成虛擬機。 P2V旨在實現(xiàn)兩個目標: 第一個目標是,將工作負載從一個數(shù)據(jù)中心遷移到另一個數(shù)據(jù)中心,同時確保硬件成本最低。 第二個目標是,通過轉移到虛擬平臺,實現(xiàn)數(shù)據(jù)中心轉型。P2V遷移是大受歡迎的方案,因為許多工程師已經習慣于執(zhí)行這種轉換,這是之前數(shù)據(jù)中心項目的一部分。 總結: 將數(shù)據(jù)中心遷移到IDC中可能對業(yè)務來說是至關重要的,三思而后行,一定要考慮以上列出的主要的因素、注意事項與風險,記住,所有的托管提供商都是不一樣的,你越能選擇最好的托管提供商,就越能從遷移中得到更多的價值和更加平和的心態(tài)。 相關下載 史上最全,數(shù)據(jù)中心機房標準及規(guī)范匯總(下載) 數(shù)據(jù)中心運維管理 | 資料匯總(2017.7.2版本) |
|