公務(wù)員期刊網(wǎng) 論文中心 正文

機房精細(xì)化管理及運維工作原則分析

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了機房精細(xì)化管理及運維工作原則分析范文,希望能給你帶來靈感和參考,敬請閱讀。

機房精細(xì)化管理及運維工作原則分析

1前言

為扎實做好數(shù)據(jù)機房運維管理工作、保障人民銀行的正常履職,人民銀行數(shù)據(jù)中心按照機房精細(xì)化管理及科學(xué)運維的工作思路對提高數(shù)據(jù)機房制冷效率、優(yōu)化設(shè)備布局、設(shè)備功率監(jiān)控及加強電氣化火災(zāi)防控等方面進(jìn)行了深入研究并提出了合理的實現(xiàn)方案,旨在強調(diào)用技術(shù)手段加強管理,在提高數(shù)據(jù)機房業(yè)務(wù)連續(xù)性保障能力的同時降低能源消耗和運維成本,積極探索提升人民銀行IT風(fēng)險管理整體水平的有效手段。在上述研究過程中,摸索并驗證了大型數(shù)據(jù)中心精細(xì)化管理的若干工作原則,現(xiàn)整理歸納如下,以饗讀者。

2大型數(shù)據(jù)中心精細(xì)化管理的若干工作原則

2.1細(xì)化監(jiān)控顆粒度

數(shù)據(jù)中心機房的精細(xì)化管理體現(xiàn)在環(huán)境溫/濕度精確監(jiān)控、機房制冷;M評估及制冷效率提升、設(shè)備功率實時采集、機柜空間合理利用、故障過程暫態(tài)波形記錄及火災(zāi)風(fēng)險防控等各個方面,數(shù)據(jù)積累的越多、監(jiān)控顆粒度越細(xì)則越有利于總結(jié)規(guī)律和發(fā)現(xiàn)問題,也越有利于及時準(zhǔn)確地對相關(guān)內(nèi)容進(jìn)行調(diào)整以達(dá)到最優(yōu)效果。目前人民銀行分支行中尚有不少機房對設(shè)備運行功率的監(jiān)揑只達(dá)到配電柜一級,配電柜后端每個機柜的用電功率數(shù)據(jù)都無法獲得,更不能對機柜內(nèi)部每臺IT設(shè)備進(jìn)行功率實時監(jiān)控,故機柜空間和空調(diào)制冷量的高效利用更是無從談起。所以,只有把精細(xì)化管理思想切實貫穿到機房運維的方方面面,才能使機房整體的運行更加高效、更加安全可靠。

2.2提倡科學(xué)運維管理工作方式

在數(shù)據(jù)中心機房運維管理工作中,維保計劃編制、設(shè)備冗余配置、設(shè)備擺放位置選擇、空調(diào)分組及通風(fēng)地板通風(fēng)重調(diào)整等都是在科學(xué)分析的基礎(chǔ)上確定的,對于大型數(shù)據(jù)中心而言,甚至現(xiàn)場值班人員的人數(shù)和專業(yè)搭配乃至巡檢路線的規(guī)劃都是可以通過運籌學(xué)原理進(jìn)行方案最優(yōu)化選擇的,機房運維管理尤其是基礎(chǔ)設(shè)施運維管理工作是一項科學(xué)性很強的工作,每—項決策都不能憑借拍腦門、想當(dāng)然。近幾年數(shù)據(jù)中心機房行業(yè)蓬勃發(fā)展,然而機房總能耗高、空調(diào)制冷效率低、機房內(nèi)設(shè)備擺放不科學(xué)、設(shè)備功率無法監(jiān)控、高水平專業(yè)技術(shù)人員緊缺等問題卻是普遍問題、共性問題,這也是科學(xué)運維觀念不強導(dǎo)致的歷史問題。所以在專業(yè)知識集合程度高的數(shù)據(jù)機房從事運維管理工作一定要提倡科學(xué)運維的工作方式,主動學(xué)習(xí)機房管理所需的通風(fēng)、消防、水循環(huán)、供配電、網(wǎng)絡(luò)、建筑結(jié)構(gòu)、環(huán)境監(jiān)控、項目管理等各方面知識,以嚴(yán)謹(jǐn)?shù)摹⒖茖W(xué)的態(tài)度對待每一項運維工作,才能使機房的可靠性和安全性得到不斷提升。

2.3重視機房制冷和氣流組織優(yōu)化

在調(diào)研中發(fā)現(xiàn)仍有少數(shù)分支行的數(shù)據(jù)機房存在不區(qū)分冷熱通道、設(shè)備擺放沒有規(guī)律等不重視機房制冷和氣流組織的問題,這樣的機房短期內(nèi)可能不會發(fā)生溫度超標(biāo)的情況,但是隨著機房內(nèi)設(shè)備的増多、功率密度的增大,其后期非常有可能出現(xiàn)局部熱點問題。對機房制冷和氣流組織粗放式管理,不僅制冷量利用效率低,造成能源無端浪費、機房能耗PUE值居高不下,而且無法使運維人員準(zhǔn)確掌握機房各區(qū)域的設(shè)備擺放能力,導(dǎo)致無法制定合理的機房區(qū)域使用規(guī)劃,嚴(yán)重制約機房的可持續(xù)發(fā)展能力。

2.4強調(diào)以電氣火災(zāi)防控為重點

電氣火災(zāi)占我國火災(zāi)總數(shù)的三分之一以上,我國面臨的火災(zāi)形勢非常嚴(yán)峻。對于數(shù)據(jù)中心機房而言,電氣火災(zāi)是災(zāi)難性的風(fēng)險,機房區(qū)域內(nèi)火災(zāi)必然影響IT設(shè)備的運行,對于銀行、證券等行業(yè)而言,數(shù)據(jù)中心機房火災(zāi)導(dǎo)致的損失是不可估量的。配電系統(tǒng)三相不平衡易引發(fā)火災(zāi),諧波含量超標(biāo)易引發(fā)火災(zāi),機房接地效果不良易引發(fā)火災(zāi),這些都屬于電氣火災(zāi)的范疇。而機房空氣濕度太低導(dǎo)致靜電容易聚集并放電引發(fā)火災(zāi),電源插□距地面太近易受周圍空調(diào)水管漏水浸入導(dǎo)致短路起火等間接引發(fā)電氣火災(zāi)的問題亦需警惕。所以電氣火災(zāi)的風(fēng)險防控并不只是做好供配電系統(tǒng)巡檢就萬事大吉了,數(shù)據(jù)中心機房的火災(zāi)風(fēng)險管控一定是以電氣火災(zāi)為重點的綜合管控,每一個可能引發(fā)火災(zāi)的細(xì)節(jié)都應(yīng)認(rèn)真辨識并及時進(jìn)行處置,這樣才能最大限度地降低數(shù)據(jù)中心發(fā)生火災(zāi)的可能性。

2.5積極引入先進(jìn)技術(shù)與設(shè)備

冷通道封閉技術(shù)、機房氣流模擬技術(shù)、極早期空氣采樣裝置、電氣化火災(zāi)智能監(jiān)控系統(tǒng)、故障錄波裝置、高頻UPS主機、智能PDU、模塊化機柜、有源濾波器、即插式母線槽系統(tǒng)等技術(shù)與裝備,都是能夠提高數(shù)據(jù)中心機房基礎(chǔ)設(shè)施設(shè)備安全運行水平且能節(jié)約大量人力成本的技術(shù)與設(shè)備,機房管理人員應(yīng)根據(jù)機房的實際情況和面臨的具體問題積極引入類似的技術(shù)手段或設(shè)備。所以在機房日常運維管理過程中應(yīng)關(guān)注主流設(shè)備廠家的最新產(chǎn)品及行業(yè)的最新技術(shù)發(fā)展動向,還可以針對具體問題邀請廠家專業(yè)工程師到現(xiàn)場進(jìn)行技術(shù)交流,通過這樣的方式加強與最新技術(shù)的接軌。

2.6避免發(fā)生系統(tǒng)性故障

數(shù)據(jù)中心機房基礎(chǔ)設(shè)施主要包括配電系統(tǒng)、空調(diào)及水循環(huán)系統(tǒng)、UPS及蓄電池系統(tǒng)、柴油機系統(tǒng)、環(huán)境監(jiān)控系統(tǒng)和消防系統(tǒng)等幾大相對獨立但又相互關(guān)聯(lián)的系統(tǒng),一定要根據(jù)機房實際情況深入分析各系統(tǒng)的薄弱點,避免發(fā)生系統(tǒng)性風(fēng)險。比如,依靠水系統(tǒng)蒸發(fā)散熱的機房一旦循環(huán)水泵或管道主管路出現(xiàn)問題,則可導(dǎo)致機房溫度升高繼而引發(fā)丨T設(shè)備大面積宕機,再比如,供配電系統(tǒng)長時間三相不平衡可能產(chǎn)生變壓器或開關(guān)故障并導(dǎo)致區(qū)域性停電。及時發(fā)現(xiàn)并規(guī)避系統(tǒng)性故障,可以有效控制事故嚴(yán)重程度和影響范圍,對提高數(shù)據(jù)中心機房安全性十分重要。

2.7關(guān)注隱性風(fēng)險

數(shù)據(jù)中心機房內(nèi)的空氣溫度、濕度及含塵濃度指標(biāo)對基礎(chǔ)設(shè)施設(shè)備和IT設(shè)備都非常關(guān)鍵,雖然這三項指標(biāo)是現(xiàn)行國家標(biāo)準(zhǔn)《電子信息系統(tǒng)機房設(shè)計規(guī)范》(GB50174-2008)中規(guī)定的有關(guān)機房空氣質(zhì)量指標(biāo)的明確要求,但對機房安全運行而言這幾項指標(biāo)卻并不是全部:空氣中二氧化硫、二氧化氣及臭氧可以腐蝕電路板和電子元器件,可以引發(fā)設(shè)備宕機或信息傳輸錯誤等問題。目前國內(nèi)對數(shù)據(jù)中心機房內(nèi)的類似腐蝕性氣體濃度標(biāo)準(zhǔn)尚無強制要求,但是應(yīng)該留意針對這些項目檢測、治理的最新發(fā)展動態(tài),將有效的措施及時應(yīng)用到人民銀行總行和分支機構(gòu)數(shù)據(jù)中心運維工作中,嚴(yán)防類似的隱性風(fēng)險給機房帶來危害。

2.8打造穩(wěn)定可靠的運維團(tuán)隊

對于數(shù)據(jù)中心機房而言,不論其基礎(chǔ)設(shè)施設(shè)備配置有多先進(jìn),不論其環(huán)境監(jiān)控系統(tǒng)功能有多完善,機房安全可靠運行的根本支撐點仍在于機房運維管理人員的工作積極性和業(yè)務(wù)水平,只有在運維管理工作中積極承擔(dān)、主動探索并不斷學(xué)習(xí)提升自己的工作能力,才能發(fā)現(xiàn)深層次風(fēng)險并提前預(yù)防和消除風(fēng)險。應(yīng)做好機房運維人才梯隊建設(shè)及培養(yǎng)規(guī)劃,鼓勵運維人員參與技術(shù)研究和學(xué)術(shù)交流活動,大膽嘗試新的管理思路和技術(shù)手段,培養(yǎng)運維人員發(fā)現(xiàn)問題和科學(xué)分析問題、解決問題的能力。只有具備了人員穩(wěn)定、技術(shù)過硬的機房運維隊伍,才能為保證機房的安全可靠運行打好堅實基礎(chǔ)。

3結(jié)語

提升機房安全可靠運行保障能力、降低機房運維成本是國內(nèi)大型數(shù)據(jù)中心面臨的嚴(yán)峻挑戰(zhàn),是建設(shè)‘‘綠色機房”的必經(jīng)之路。人民銀行數(shù)據(jù)中心在不斷提升機房運維管理工作水平的過程中摸索、總結(jié)了機房精細(xì)化管理及科學(xué)運維的一些經(jīng)驗與大家分享,希望我們的淺見薄識能為銀行業(yè)數(shù)據(jù)中心在機房管理方面提供參考與借鑒,同時希望與大家共同推進(jìn)整個銀行業(yè)數(shù)據(jù)中心的轉(zhuǎn)型發(fā)展。

作者:肖鑫 單位:中國人民銀行金融信息中心

相關(guān)熱門標(biāo)簽