近日,維諦(Vertiv,原艾默生網絡能源)主辦的“思無界·設享V來—2018設計院專家高端論壇”在北京隆重召開。論壇以“關鍵技術成就可靠與節能的完美平衡”為主題,來自權威設計院的技術大咖及維諦(Vertiv)的產品技術專家,針對數據中心的發展趨勢,從技術應用、規劃設計以及供配電、熱管理關鍵系統的選擇等維度呈獻了多個精彩的技術報告,并分享了維諦(Vertiv)的科技創新成果及大量成功實踐。
一直以來供配電系統作為數據中心基礎設施主要組成部分,它的高可靠、高可用性、高節能性能高可維護性在數據中心行業備受關注,因此對于數據中心供配電技術的研究也從未中斷。當前圍繞數據中心供配電技術、產品、應用和整體解決方案也逐漸向標準化、系統化的方向發展,選擇綠色的、經濟的、高效的、可用性高的供配電系統已經成為數據中心建設和運維行業的共識。
中國科學院計算所高級工程師李成章先生
對此,中國科學院計算所高級工程師李成章在《數據中心供配電系統的可用性分級管理》的演講中,深入探討了高性價比的數據中心供配電解決方案追求的核心價值,并指出要根據數據中心的不同用戶對可靠性、效率、成本的不同業務需求來選擇最適合的UPS產品及其對應的供配電系統的可用性級別和架構,從而獲得最佳的TCO。
誘發數據中心供配電系統故障的幾大因素
在造成數據中心癱瘓的原因中,以因供配電系統的產品選型和設計架構的”考慮欠妥”所誘發的電氣癱瘓的危害性最大。相關的統計資料顯示,它存在如下幾種典型的故障隱患:
(1)因UPS供電系統的產品或可用性級別的”選配欠妥”所誘發的故障占29%;
(2)因人為操作“失誤”所誘發的故障占24%(例:2017年5月,因托管機房的工程師對UPS供配系統的輸入開關執行”誤關斷”操作而致使某國外航空公司的幾乎所有的IT設備進入”宕機癱瘓”的事故);
(3)因未考慮到發電機帶電容性負載的帶載能力會“變弱“以及因階躍性負載的“負載突增量過大”等原因所誘發的發電機“自動關機”的故障占10%;
(4)因氣候及自然災害所誘發的故障占12%(例:2017年12月,國外某機場因電力電纜的火災所造成的長達十余小時的大面積停電事故)。
顯而易見,能否消除掉上述的、足以對供配電系統的安全運行造成“致命危害”的故障隱患是能否確保該數據中心機房能長期可靠地運行的關鍵所在,以便為在后期的機房的日常運維操作過程中,能夠及時地發現和規避這些風險、確保它能獲得令人滿意的可用性(99.99%∽99.999%)奠定下堅實的技術基礎。根據GB50174—2017數據中心設計規范的要求,對于負責向IT/網絡等關鍵設備供電的供配電系統而言,它所允許的瞬間供電中斷時間應小于10ms。
通過對近年來發生在數據中心供配電系統中的多起事故的分析發現:同工頻機UPS供配電系統相比,導致傳統高頻機UPS和模塊化UPS供配電系統的故障率增高的重要誘因是:因為它們的抗瞬態輸入過壓保護的能力“變差“所致。通過在用戶現場所捕捉到的輸入故障波形以及在所搭建的故障模擬平臺上所檢測到數據可見:因“輸入瞬態過壓”而致使傳統高頻機和模塊化UPS的典型故障類型有:因電池組異常放電所誘發的電池組使用壽命縮短;在UPS供配電系統的輸出端發生輸出閃斷或“被損環”的事故。其故障高發期是:
(a)當10KV高壓因故發生停電/閃斷事故時或位于這些UPS供電系統上游側的大容量ATS開關因故需執行切換操作的瞬間。在此期間,在UPS的輸入端出現“輸入瞬態過壓”故障的幾率很高;
(b)為降低生產成本和充分利用廉價電能(注:夜間谷期電價僅為白天峰期電價的1/3左右),高能耗企業可能會采用夜間生產、白天停工的生產管理體制。對于地處鄰近高能耗企業的數據中心而言,極易在高能耗企業“突然抽閘”的瞬間,在它的市電輸入電網上誘發出”瞬態輸入高壓”。在此條件下,易發生電池組異常放電故障,從而造成電池組使用壽命縮短,增加后期運維成本。
李成章在演講中以某數據中心的供配電系統故障為例,指出在該數據中心的運行中,因故遇到10KV高壓電網發生停電幾分鐘的電力事故,導致運行僅1年多的3*300KVA高頻UPS并機系統發生故障:UPS并機系統輸出“閃斷”,并長期停留在交流旁路上。與此同時,位于同一機房中的已運行十幾年的另外兩套3*800KVA工頻機UPS并機系統卻一直正常地運行著。由此不難看出:此次事故就是因傳統高頻機UPS抗“瞬態輸入過壓”的保護能力”變差”所誘發出的故障,給該數據中心所需的應持續穩定運行帶來負面影響。
“電池組異常放電”的故障案例:對于同時配置有工頻機UPS和傳統高頻機UPS的某數據中心而言,在其運行中,常發現:對于它的4*500KVA高頻機UPS供電系統而言,在每天的早上的7∽8點期間,易發生”電池異常放電”現象。與此同時,對于位于同一10KV供電網下運行的4*400KVA工頻機UPS供電系統,它卻繼續正常運行,從未發生過”電池組異常放電”的現象。
除此之外,李成章還舉例指出:隨著模塊化UPS內部所并聯的電源模塊的數量的不斷地增多(例:從傳統高頻塔式機的內置2-3個功率模塊增加到傳統模塊化UPS的內置10-20個電源模塊),它的“內部環流”必然會隨之而增大。由此所帶的新故障現象是:當用戶在因故對這種模塊化UPS執行停電維修操作之后(例:對機柜前面板上的“通風過濾罩”執行除塵清洗操作),再重新執行開機操作時,易發生UPS輸出閃斷或電源模塊”被損壞”的事故。
高性價比的高頻UPS產品應具備的運行特性
由于高頻UPS電源具有效率高、體積小、重量輕以及輸入功率因數達到0.99以上、輸入電流的諧波含量小于5%、對市電電網的污染小等優點而日益受到用戶的青睞。近年來,隨著UPS制備技術的進步和發展,為提高它的可維護性,高頻UPS逐步走向高智能模塊化,可通過增減UPS機柜內的小功率電源模塊數量的多少來滿足用戶對其功率輸出及可維護性的要求。這樣一來,它不僅具有極大的彈性,而且只要冗余允許還可以在線進行維護,實現”零維修時間”的操作功能。然而,對于部分高頻UPS的生產和開發企業來說,由于存在只重視追求更高的效率和更低的制備成本的傾向,不夠重視應采取必要的技術措施來消除傳統高頻機UPS和模塊化UPS因抗瞬態輸入過壓保護能力”變差”所帶來的故障率相對偏高的現象。
近年來,維諦(vertiv)公司遵循”不妥協的可靠性”的設計思念,通過在傳統高頻機UPS的整流器中增配”抗輸入過壓”保護部件的技術措施。這樣一來,在確保它能獲得”高效率”優點的前提下,還收到能大幅度地提高UPS可靠性以及將高頻機UPS的輸入功率因數(PF)從傳統的電容性調控到所期望的電感性。在此基礎上,開發出創新型的高性價比的UPS產品。
李成章指出,高性價比的高頻機UPS應該具有效率高(≧97%)、可靠性高(具有很強的抗輸入過壓保護能力,UPS單機內部環流=0)、輸入PF呈現電感性、高可維護性(例:易于對機內的”老化.濾波電容”執行現場的更換操作)等特點。只有具備這些特性,才能更好的保障數據中心的安全高效運行。在此背景下,不僅能為數據中心的供配電系統獲得令人滿意的高可用性奠定下堅實的技術基礎。而且,還有十分利于降低它的Capex和Opex。
數據中心供配電系統的”可用性分級管理”
確保數據中心安全無疑是整個信息系統安全運行的前提保障,對此,李成章表示,電癱瘓、熱癱瘓、網絡安全已然成為當今數據中心所面臨的三大故障隱患,如何避免及做好提前措施也成為備受關注的焦點。
同時,李成章基于全新的現場故障分析能力和實踐工作經驗,重點闡釋了供配電系統的”分級可用性”的設計與規劃。在對金融、交通,BAT及教育、商業等具有代表性用戶的業務特點、允許業務中斷的容忍度、IT系統及空調系統對供電系統的可用性的不同級別需求、IT/網絡的機柜功率密度的高低對MDC(微模塊)的設計架構的影響等進行全面分析后,李成章指出,采用“可用性分級管理”的設計理念的最終目標是:在充分滿足用戶的不同業務需求的前提下,制定和選用具有TCO最低運行特性的供配電系統的設計方案。
為進一步闡釋供配電系統分級可用性理念的重要意義,李成章以金融用戶和BAT用戶的供配電系統需求為例進行了說明。他表示,金融行業(集中處理)與BAT行業(分布式處理)對數據處理、存儲和分享性數據傳送的要求具有很大差異,前者要求數據應具有極高的完整性、一致性和高時效性。為此,其供配電系統的建設標準應采用帶物理隔離運行特性的A級標準。李成章同時指出,即使在金融行業用戶中,由于總行、省市分行及縣級支行等機構級別的不同,其供配電系統的可用性級別也應不相同,在建設上也有所區別。
李成章最后表示,只有“根據用戶對實際運行業務的不同需求來決定所選用的可用性級別的最適合的架構+最適合的UPS產品”才是最能恰如所需地滿足用戶需求的完美設計方案。顯然,只有這樣才能更好地為數據中心的用戶提供最具有實用價值的服務和支持。