升級仍然是提升數據中(zhōng)心 IT 能(néng)力的主要手段。它們通過更換老化或性能(néng)不佳的 IT 資産(chǎn)來建立彈性、提高性能(néng)、降低運營成本、增強安(ān)全性并控制停機時間。但升級總是帶有(yǒu)風險因素:疏忽和錯誤可(kě)能(néng)導緻意外停機、工(gōng)作(zuò)負載可(kě)用(yòng)性問題、性能(néng)中(zhōng)斷以及不可(kě)接受的管理(lǐ)或安(ān)全漏洞。重要的是在第一次成功完成升級,或者至少在出現問題時有(yǒu)能(néng)力有(yǒu)效地回退。
順利、成功和有(yǒu)意義的數據中(zhōng)心升級的關鍵是準備。了解目标和每個目标的路徑,并在路上遇到障礙,為(wèi)升級過程帶來巨大的收益。
1. 了解您的業務(wù)需求
當業務(wù)領導者選擇不必要的技(jì )術投資或缺乏明确的 ROI 标準時,就會出現一些成本最高和風險最高的錯誤。升級不應作(zuò)為(wèi)新(xīn)技(jì )術的展示,而應有(yǒu)助于企業更有(yǒu)效地運營和更具(jù)競争力。他(tā)們應該專注于以下方面:
-
擴展重要資源,例如存儲或計算;
-
為(wèi)更多(duō)、新(xīn)的或更新(xīn)的應用(yòng)程序啓用(yòng)新(xīn)的工(gōng)作(zuò)負載;
-
支持額外的員工(gōng)、用(yòng)戶或交易;
-
降低每個用(yòng)戶或交易的成本;和
-
構建 IT 能(néng)力,例如工(gōng)作(zuò)負載彈性、業務(wù)連續性和災難恢複。
2. 确定升級目标
在明确定義業務(wù)需求的情況下,确定升級項目的範圍,并确定受升級影響的硬件、軟件、服務(wù)、策略、流程和工(gōng)作(zuò)流。
升級從來都不是一個全有(yǒu)或全無的決定。升級範圍可(kě)能(néng)非常狹窄和具(jù)體(tǐ),因此請提前明确确定範圍以防止潛在的災難性疏忽,例如意外的硬件或軟件版本不兼容。
考慮老化的舊工(gōng)作(zuò)負載和依賴于工(gōng)作(zuò)負載的硬件。您可(kě)以将重要的工(gōng)作(zuò)負載重新(xīn)設計為(wèi)更新(xīn)的軟件産(chǎn)品,在功能(néng)強大的新(xīn)服務(wù)器硬件上部署更新(xīn)的軟件,并淘汰老化的硬件。在這種情況下,主要升級目标将涉及舊服務(wù)器及其舊應用(yòng)程序。
此外,請考慮次要範圍,例如依賴項。例如,如果那個老化的應用(yòng)程序依賴于一個較舊的數據庫,您是否必須升級該數據庫及其硬件?應用(yòng)程序或系統管理(lǐ)等實踐被視為(wèi)依賴項,您應該将它們包括在範圍内。
3. 創建升級路線(xiàn)圖
一個升級項目或目标通常涉及多(duō)個離散的升級任務(wù)。例如,升級可(kě)能(néng)涉及向基礎架構添加兩個服務(wù)器機架,但這可(kě)能(néng)還需要增加電(diàn)源和冷卻能(néng)力升級或增強 WAN 訪問。
即使是像服務(wù)器升級這樣簡單的事情也可(kě)能(néng)涉及支持工(gōng)作(zuò)。例如,要将 2U 服務(wù)器添加到完整機架,您可(kě)能(néng)需要先重新(xīn)安(ān)置一台或多(duō)台其他(tā)服務(wù)器以騰出空間。這些考慮可(kě)能(néng)看起來像細枝末節,但即使是小(xiǎo)細節也可(kě)能(néng)會延遲升級。
檢查預期目标及其依賴關系,并首先确定依賴關系。這可(kě)能(néng)是簡單地重新(xīn)定位硬件以騰出适當的機架空間或升級支持平台(例如數據庫及其服務(wù)器)的問題,然後再推出預期的升級。
4. 确定升級技(jì )術
為(wèi)升級确定新(xīn)産(chǎn)品可(kě)能(néng)就像為(wèi)存儲升級選擇新(xīn)磁盤或為(wèi)新(xīn)服務(wù)器選擇品牌、型号和負載一樣簡單。更大的升級需要更多(duō)的考慮。例如,如果需要更新(xīn)一組相關服務(wù)器,請評估先進技(jì )術平台的潛力,例如超融合基礎設施。
使用(yòng)不熟悉的硬件和軟件進行升級是災難的根源,因此請盡可(kě)能(néng)在投入使用(yòng)之前測試産(chǎn)品。使用(yòng)動手評估和原理(lǐ)驗證項目來驗證新(xīn)的硬件和軟件産(chǎn)品,并了解它們的部署、設置、配置和互操作(zuò)性注意事項。
5. 清理(lǐ)或增強現有(yǒu)基礎設施
數據中(zhōng)心中(zhōng)的一切都有(yǒu)一個生命周期,而老化的基礎設施可(kě)能(néng)會對業務(wù)構成障礙。當您審查基礎架構以确定升級的範圍和要求時,請花(huā)更多(duō)時間考慮可(kě)能(néng)不會直接影響預期升級但仍可(kě)以在更廣泛的意義上使業務(wù)和基礎架構受益的任務(wù)或項目,包括以下内容:
-
為(wèi)關鍵應用(yòng)程序增加冗餘;
-
從不再需要它的應用(yòng)程序中(zhōng)删除冗餘;
-
更新(xīn)老化的布線(xiàn)以促進更大的網絡帶寬;
-
更新(xīn)配電(diàn)和備用(yòng)電(diàn)源,例如配電(diàn)單元和不間斷電(diàn)源子系統;
-
重新(xīn)定位機架并關閉開放的硬件間隙以增強冷卻氣流;和
-
審查系統管理(lǐ)工(gōng)具(jù)和功能(néng)。
6. 準備文(wén)件
大多(duō)數數據中(zhōng)心硬件和軟件都需要各種各樣的部署細節。詳細信息包括默認網絡地址、許可(kě)數據(例如激活碼)以及設置和配置的詳細說明(例如産(chǎn)品手冊和用(yòng)戶指南)。
組織這些數據,并在啓動升級任務(wù)之前确保一切可(kě)用(yòng)。否則,由于缺少詳細信息,業務(wù)将面臨無法接受的延誤和不必要的取消風險。例如,新(xīn)軟件産(chǎn)品可(kě)能(néng)需要許可(kě)證号或激活碼。IT 人員不想在淩晨 2 點執行升級時争先恐後地獲取此信息,因為(wèi)此時供應商(shāng)的銷售和支持人員可(kě)能(néng)無法及時響應。
7. 備份并準備恢複
當今的虛拟化數據中(zhōng)心環境使得将工(gōng)作(zuò)負載轉移到其他(tā)服務(wù)器變得相對容易,這使您能(néng)夠更換和配置空服務(wù)器。同時,您可(kě)以使用(yòng)複制或快照技(jì )術複制在 VM 内運行的工(gōng)作(zuò)負載。盡管如此,錯誤和意想不到的後果還是會發生,即使是看似簡單的升級也可(kě)能(néng)會匆忙橫掃。在升級之前和升級期間,使用(yòng)簡單的指導方針為(wèi)最壞的情況做好準備,例如:
-
對升級過程中(zhōng)涉及的任何服務(wù)器應用(yòng)程序或存儲系統執行完整備份;
-
測試修複過程并确保修複工(gōng)作(zuò);
-
确保所有(yǒu)參與升級任務(wù)的 IT 人員都能(néng)成功執行恢複或回滾;
-
記錄現有(yǒu)硬件和軟件的當前配置——即使你計劃淘汰這些産(chǎn)品——以便在必要時将它們恢複到已知的工(gōng)作(zuò)狀态;和
-
記錄升級期間發生的所有(yǒu)更改——例如更改 IP 地址或将 VM 移動到不同的物(wù)理(lǐ)服務(wù)器——并确保這些更改反映在系統或更改管理(lǐ)工(gōng)具(jù)中(zhōng)。
升級可(kě)能(néng)會中(zhōng)斷常規業務(wù)并使重要的工(gōng)作(zuò)負載長(cháng)時間不可(kě)用(yòng)。這會影響員工(gōng)、業務(wù)合作(zuò)夥伴、客戶和業務(wù)領導者。數據中(zhōng)心升級應始終将利益相關者納入流程。
升級項目通常涉及許多(duō)任務(wù)。因此,單獨處理(lǐ)每項任務(wù),并将其傳達給利益相關者。常見的通信包括以下内容:
-
告訴利益相關者計劃進行哪些升級,為(wèi)什麽需要進行這項工(gōng)作(zuò),應該提供哪些更改或新(xīn)功能(néng)以及工(gōng)作(zuò)何時進行;
-
提醒利益相關者升級計劃——通常包括導緻實際升級任務(wù)的幾個提醒;
-
如果您遇到問題或延誤,向利益相關者發送更新(xīn);和
-
升級任務(wù)完成并恢複正常功能(néng)後,向利益相關者發送完全清除通知。
9. 驗證部署
完成升級任務(wù)後,測試并驗證硬件或軟件部署是否正常工(gōng)作(zuò)。例如,新(xīn)服務(wù)器應該運行良好并具(jù)有(yǒu)安(ān)全配置。當您重新(xīn)安(ān)裝(zhuāng)或将工(gōng)作(zuò)負載遷移回服務(wù)器時,這些工(gōng)作(zuò)負載應該可(kě)以通過本地數據中(zhōng)心網絡訪問。在這個階段,IT 人員必須對性能(néng)進行基準測試和衡量,對升級問題進行故障排除和修複,或者在需要時執行回滾。隻有(yǒu)當您知道一切都按預期工(gōng)作(zuò)時,您才應該在企業 LAN 或 Internet 上打開資源以供一般使用(yòng)。
升級可(kě)能(néng)會破壞系統或應用(yòng)程序管理(lǐ)工(gōng)具(jù)。捕獲所有(yǒu)數據中(zhōng)心系統和安(ān)全管理(lǐ)工(gōng)具(jù)中(zhōng)升級任務(wù)所涉及的任何更改,或準備使用(yòng)您收集的文(wén)檔手動輸入更改。一些管理(lǐ)平台需要額外安(ān)裝(zhuāng)代理(lǐ)或驅動程序,然後管理(lǐ)工(gōng)具(jù)才能(néng)正确監督新(xīn)資産(chǎn)。
10. 必要時系統地展開部署
分(fēn)階段推出涉及高度不确定性或風險的升級項目。例如,更新(xīn)任務(wù)關鍵型遺留應用(yòng)程序及其相關硬件涉及同時部署新(xīn)資産(chǎn)——與當前資産(chǎn)并行——并打開環境部分(fēn)進行 beta 測試,而不是簡單地在升級中(zhōng)替換應用(yòng)程序和硬件。這可(kě)以最大限度地減少升級上線(xiàn)後不可(kě)預見的問題的影響,因為(wèi)原始硬件和軟件仍然可(kě)用(yòng)且可(kě)操作(zuò)。
如果新(xīn)資産(chǎn)按預期運行,您可(kě)以系統地将其他(tā)用(yòng)戶組遷移到新(xīn)資産(chǎn)。當您成功遷移所有(yǒu)用(yòng)戶并徹底驗證新(xīn)資産(chǎn)後,您可(kě)以将任何舊資産(chǎn)作(zuò)為(wèi)較小(xiǎo)的清理(lǐ)升級任務(wù)停用(yòng)并删除。
11. 考慮數據中(zhōng)心标準
對數據中(zhōng)心的設計、實施、性能(néng)或可(kě)用(yòng)性沒有(yǒu)既定要求。然而,政府、利益相關者、合作(zuò)夥伴和客戶已經開始期望在一定程度上遵守某些标準。升級項目是檢查數據中(zhōng)心标準并考慮采用(yòng)現有(yǒu)标準的價值的絕佳機會。
衆多(duō)代碼和最佳實踐标準可(kě)以驗證您的數據中(zhōng)心,包括 Uptime Institute、電(diàn)信行業協會 942、美國(guó)國(guó)家标準協會/BICSI 002-2014、EN 50600 和一系列可(kě)選标準,例如能(néng)源和環境設計領導力、綠色地球儀和能(néng)源之星。了解每個标準的作(zuò)用(yòng),評估其重要性或對您的業務(wù)的好處,并計劃實施所需的标準作(zuò)為(wèi)正在進行的數據中(zhōng)心升級項目的一部分(fēn)。