能夠實現基礎設施有效監控的十個步驟
來源:慧聰安防網 作者:cofee 編輯:數字音視工程 2011-08-30 00:00:00 加入收藏 咨詢
![](http://static.dav01.com/site/onlineExhibition/mould1/images/close.png)
所在單位: | * |
姓名: | * |
手機: | * |
職位: | |
郵箱: | * |
其他聯系方式: | |
咨詢內容: | |
驗證碼: |
|
一、測量
如果你無法對數據中心的一些數據進行監測,那么你也就無法控制它,這也是為什么監測是這10個步驟中首要的一步。部署傳感器可以幫助你搜集電力配置、冷卻能力等關乎數據中心安全的數據資料。
1、溫度傳感器
高熱密度是數據中心向高密度和復雜性方向發展所造成的嚴重問題之一。隨著密度的增加,制冷負荷的增長,使數據中心問題更加多樣化。同一個高密度機架上可能會出現局部熱點,也可能會有局部溫度低于冷卻溫度的情況,所以,即便是同一個機架設備溫度也會有很大差異。
在整個數據中心安裝部署溫度傳感器網絡有助于確保設備工作溫度在ASHRAE推薦的64.4°F-80.6°F范圍內。通過對機架多個位置溫度的監測,可以精確的控制冷卻裝置,使其更加有效的運作。
另外通過傳感器網絡,還可以放心地把數據中心溫度提高到接近ASHRAE所規定的溫度上限,例如從65°F提高到75°F。實驗證明,服務器入口溫度每提高10°F,其制冷耗電量就會減少30%。
對數據中心送風溫度和回風溫度的測量都是用于輔助測量服務器進風口溫度的,以便更精確地掌控服務器的運行溫度。如今,越來越多的制冷系統已經遷移至機架上,而傳感器也可以直接連接到冷卻裝置的某個特定位置上,形成一個小型的傳感器網絡,服務器入口的溫度可以根據對相鄰機架溫度和冷卻溫度的測量而進行相應的調整。
最好的做法是在每個機架上至少安裝一個傳感器,也可以在冷通道/熱通道的機架上統一安裝,傳感器的位置必須是在該行溫度最高的那臺機架的頂部。這樣也可以監測到是否有熱空氣從熱通道進入到冷通道。
傳感器直接連接到冷卻系統的優勢在于,當傳感器與冷卻系統協同冷卻系統可以自動調整運行溫度,可以消除熱點,對熱負荷的變化作出反映,還可以協調同一工作區間的其他制冷設備運行。傳感器安裝的具體位置應該遵循ASHRAE所提供的《數據處理環境熱指南》,以便讀取機架入口處的溫度數據,測量送風溫度、回風溫度和風量值。
2、監測電源的使用情況
功率密度和能源成本上升的同時,能夠監測能源的有效使用率對數據中心管理是至關重要的。那么電源監測是如何影響能源使用效率的呢?要通過更多的監測信息對PUE進行討論。
為了對數據中心的能耗有一個全面的了解,應該在UPS進行監測,并在機架上安裝電源分配單元(PDU)。對UPS進行監測所搜集的數據可以用于計算電源使用效率(PEU),使IT經理確定電源消耗的方向并作出應對措施。利用PDU還能預防發生過載事件,確保設備的電力分布平均。
最好的IT功耗檢查方法就是機架內部的PDUA,機柜PDU的特點是能夠對連續運行功率實施綜合測量和控制。由于每個機架的負載和機架內的基礎設備的功耗都有所不同,所以每個機架都應該安裝一個PDU,在雙總線環境下,機柜PDU可以監測電源的消耗,多種輸入型式與多樣的插位組合的PDU在過載時起到保護作用。這就為數據中心的電力消耗管理提供了直接的監測數據,同時也提高了數據中心的效率和可用性。除了有效的電源管理,機柜PDU還能為IT服務價格提供參考和識別未被充分利用的空間。遠程開啟和關閉功能還能防止因新增設備而造成的過載。
3、對機柜運行環境的監測
隨著密度的增長,現在單個機柜支撐的計算能力可以相當于過去的整個機房。機柜內設備運行情況的可見性,能夠幫助預防其常見的威脅,包括:意外的或是惡意的篡改、水的進入、煙霧、濕度或者溫度過高。
當機柜門被打開、監測到有水或煙霧,或是當溫度或濕度超出設定值時,都會觸發機柜內的監控單元配置的報警器發出警報。這些“機柜內的眼睛”可以連接到中央監控系統,其環境數據和機柜內PDU所采集的電源消耗數據可以被集成,如果監測出現問題也會通過激活指示燈和報警器發出本地報警。因此,這些設備應該被部署在高密度機架和機架內的關鍵業務設備中。
4、液體泄漏監測
數據中心內液體泄漏會造成數千萬美元的設備損壞和失去大量的數據,嚴重影響客戶交易和企業的生產力。液體泄漏監測系統利用部署在不同位置的傳感器探測整個數據中心,通過及時報警防止設備損壞。
泄漏監測系統可以作為一個獨立的操作系統進入到中央監控系統,這樣就簡化了報警管理。無論那種方式,它都是讓數據中心經理了解其運營狀況的傳感器網絡的一個重要組成部分。
二、控制管理
4、精密制冷系統的智能控制
把智能控制整合到房間空氣調節器里,可以更高效、更精確地控制溫濕度。智能控制系統可以協調多個制冷機組運行,使個機組之間實現功能互補并避免沖出。例如,對濕度的控制,絕對濕度的控制方式可以按空氣中的水分含量控制濕度,不會因溫度波動引起相對濕度波動,造成機組不必要的加濕或除濕動作,也節約了不必要的能耗。數據中心或者機架級制冷系統的控制系統還可以縮短管理人員對系統問題的響應和維護時間,控制系統還能根據所搜集的數據對組件進行預測分析,對整個系統維護提供依據。另外,詳細的事件日志、服務歷時記錄、備件清單都能提高服務的效率。
5、供電系統的智能控制
現在,數字化和智能化大大優化了UPS供電系統的性能。UPS的智能化主要通過系統的控制軟件實現。在系統運行狀態識別與控制方面,通過內部傳感器和狀態邏輯及識別系統所處的運行狀態,判定系統運行程序和運行是否正常。數字化則是采用數字信號處理算法,有效地解決并行系統之間的相互溝通問題,以減少故障機會。在大部分情況下,還能自行診斷故障并且隨即解決問題。如果遇到用戶預先設定的重大故障,則會直接報警。
通過能源優化和智能并聯等特性還能使系統更有效地運作。能源優化模式在提高UPS系統對IT負載供電效率的同時,還具有調節功率的特點,例如在電力需求不高的周末或晚上,可以對供電功率進行調整,就能有效避免不必要的能源消耗。并聯智能控制為模塊化UPS提供了一個提高效率的途徑,它不僅能對多模塊并聯UPS進行智能管理,還可以實現自動關閉不需要支持負載的UPS模塊,以提高系統效率。
6、集中監控和管理
集中監控的目標就是要能夠通過管理與技術的應用,對基礎設施與IT基礎架構的運行情況進行監視,實現故障與異常的實時發現與通知;此外還可以通過對監控數據搜集與整理,為容量管理、事件管理、問題管理、符合性管理提供分析的基礎,最終實現數據中心高可用性的目標。
目前,數據中心的供電系統和制冷系統都可以顯示運行數據,例如可以顯示機架服務器的入口溫度,這些工具的使用都推動了集中監控系統的發展。
7、報警和警報的管理
對數據中心基礎設施集中監控的目的是最大限度地減少系統停機時間,及時有效地應對系統問題。集中報警管理系統為數據中心提供一個統一的運營窗口,對臨界報警這種比較嚴重的事件可以做到優先處理。對多個同時報警的故障,可以根據對業務的影響度決定其處理順序。
更近一步的說,管理人員可以根據監測系統的數據來分析設備的運行狀況,并執行有效的維護計劃。
8、監測能源使用效率
在大多數情況下,數據中心并不會安裝相應的能源使用使用監測設施。很多數據中心的管理員覺得安裝這樣的設施很沒有必要,這對提高數據中心的能源使用效率并沒有多大的效果。其實并不是這樣的,建立一套能源使用狀況監測系統對于提高能源使用效率有著很好的激勵作用,它能夠很直觀的顯示出數據中心內部的能源狀況。這可以提醒數據中心的管理員應該時刻關注數據中心的能源使用率并提高。
建立這樣的能源監測系統,可以根據數據輕松算出PUE值,有利于IT經理跟蹤能源消耗,從而分析和優化能源的使用。
9、電池監測
為了防止數據丟失和提高正常運行時間,大多數數據中心需要一個專用的電池監測系統。電池監測系統可以把電池的潛在故障通知給管理員,最好的做法是實施一個監測系統,并跟蹤串聯電池組中的每節電池的健康狀況。有效的電池跟蹤監測系統包括對內阻參數的測量和對蓄電池充放電情況的監測,以確保測量的準確度。
UPS的許多用戶認為UPS本身已帶蓄電池監測功能,無需再安裝另外的蓄電池監測系統。確實,大部分UPS都帶有一定的蓄電池監測功能,可以監測組壓及記錄放電曲線,但是對于準確掌握每節蓄電池的運行狀況這些監測是遠遠不夠的。UPS一般只能監測組壓,不能監測每節電池的電壓,一旦某節電池失效,組壓往往還是正常的,而對于串接的電池組來說,這是非常危險的。
10、遠程監控管理
在減少能耗的趨勢下,數據中心遠程監控和管理應運而生。你可以用最小的人力成本來執行關鍵任務工作,且不管你身在何處,這也就是無人值守的概念。
但無論如何,遠程管理確實節約了大量的成本。一個數據中心的管理者,只須考慮機架上的虛擬主機、高效的安全人員以及他的數據中心的地理位置,然后用遠程管理操作數據中心,所有他所要做的就是坐視成本的急劇下降。此外,限制訪問的另外的好處是,實際進入數據中心接觸到計算機的人少了,因此發生意外及安全漏洞的機會也少了。這種遠程管理用遠程輸入輸出系統訪問數據中心的服務器,這種方式還可以提高反應時間。通過這個系統,也可以實現地理上的獨立性。
三、基礎設施監控的效益評估
通過這10個步驟,數據中心關鍵設施的可用性和效率是可以量化的。幾乎每個步驟都有助于監測數據中心的可用性,并能分析系統潛在問題從而提高響應速度。從整個監控系統中,管理員可以準確知道任何一個機架在什么時候發生了什么事件,集中報警管理和電池監測等基礎設施監控從根本上消除了數據中心停機最常見的原因。
在許多情況下,這些系統是相對容易實現的,而且一旦安裝,可以對數據中心優化提供可視的和必要的控制。
評論comment