簡(jiǎn)介
本文旨在介紹供電中斷對(duì)于交流供電系統(tǒng)可用性和正常運(yùn)行時(shí)間的影響,提供有關(guān)實(shí)際環(huán)境中正常運(yùn)行時(shí)間的量化數(shù)據(jù),包括UPS電源對(duì)于正常運(yùn)行時(shí)間的影響。這些數(shù)據(jù)還涉及斷電頻率和持續(xù)時(shí)間的影響、設(shè)備的重啟行為,以及UPS可靠性相關(guān)因素等。此外,本白皮書(shū)也將列舉延長(zhǎng)UPS運(yùn)行時(shí)間對(duì)于提高系統(tǒng)可靠性方面的優(yōu)勢(shì)。
目前,對(duì)于IT系統(tǒng)正常運(yùn)行時(shí)間的要求日益提高,通常會(huì)將可靠性目標(biāo)設(shè)定為99.999%(5個(gè)9)。然而,眾多因素都會(huì)成為系統(tǒng)實(shí)現(xiàn)這一高標(biāo)準(zhǔn)水平的阻力,交流供電的可靠性便是其中一個(gè)不可忽視的障礙。不過(guò),交流供電可靠性和正常運(yùn)行時(shí)間的關(guān)系表現(xiàn)得并非特別明顯,而且不同地點(diǎn)的交流供電可靠性通常極為不同,也使情況進(jìn)一步復(fù)雜化。
交流供電環(huán)境
有關(guān)交流電可靠性的標(biāo)準(zhǔn)化數(shù)據(jù)極為有限。不過(guò),在美國(guó)進(jìn)行了兩次極為重要的交流電可靠性調(diào)查研究,一次是由ATT貝爾實(shí)驗(yàn)室完成的,另一次是由IBM完成的。另外,鑒于施耐德電氣已達(dá)千萬(wàn)余臺(tái)UPS系統(tǒng)的裝機(jī)量,并且其中很多UPS能夠?qū)㈦娫磫?wèn)題記錄下來(lái),因此我們?cè)谶@方面也累積了一定的經(jīng)驗(yàn)。
交流供電問(wèn)題大致可分為三大類(lèi),分別是:
1.會(huì)導(dǎo)致負(fù)載設(shè)備臨時(shí)停止運(yùn)行的斷電或電壓過(guò)低情況
2.會(huì)導(dǎo)致負(fù)載設(shè)備臨時(shí)中止或故障的瞬變電壓
3.會(huì)損壞負(fù)載設(shè)備的瞬變電壓
本文主要分析第一類(lèi)交流供電問(wèn)題,即斷電或電壓過(guò)低造成的影響。因此,我們的假設(shè)前提是1)該設(shè)備已受到浪涌抑制器或UPS正確保護(hù),能夠應(yīng)對(duì)瞬變電壓,或2)因交流供電問(wèn)題而造成的實(shí)際宕機(jī)時(shí)間將比本文所述時(shí)間更長(zhǎng)。
美國(guó)調(diào)查數(shù)據(jù)與施耐德電氣多年積累的豐富經(jīng)驗(yàn)相一致,要點(diǎn)如下:
1.在普通地點(diǎn),每年造成IT系統(tǒng)故障的平均斷電次數(shù)大約為15次。
2.90%的斷電時(shí)長(zhǎng)不超過(guò)5分鐘。
3.99%的斷電時(shí)長(zhǎng)不超過(guò)1小時(shí)。
4.斷電累計(jì)總時(shí)長(zhǎng)大約為每年100分鐘。
以上信息因地而異,在美國(guó)部分地區(qū),如佛羅里達(dá)州(這一地區(qū)經(jīng)常發(fā)生雷電現(xiàn)象),斷電率要高出一個(gè)數(shù)量級(jí)。某些建筑物問(wèn)題也會(huì)將斷電率推高,甚至高達(dá)三個(gè)數(shù)量級(jí)。這些數(shù)據(jù)也能夠體現(xiàn)日本和西歐的狀況。根據(jù)這些信息,美國(guó)地區(qū)交流供電正常運(yùn)行時(shí)間在99.980%左右,每年的宕機(jī)時(shí)間大約在100分鐘。而要實(shí)現(xiàn)99.999%的正常運(yùn)行時(shí)間目標(biāo),意味著每年宕機(jī)時(shí)間僅能控制在4.8分鐘,因此實(shí)現(xiàn)這一目標(biāo)的困難之處也是實(shí)實(shí)在在的。
設(shè)備行為對(duì)于正常運(yùn)行時(shí)間的影響
設(shè)備應(yīng)對(duì)斷電的方式會(huì)大大延長(zhǎng)實(shí)際宕機(jī)時(shí)間。在發(fā)生交流電斷電時(shí),設(shè)備一般會(huì)有以下三類(lèi)應(yīng)對(duì)方式:
1.在電力恢復(fù)后立即重啟
2.在一定延時(shí)后自動(dòng)重啟
3.手動(dòng)重啟(人工干預(yù))
如果選擇手動(dòng)重啟,那么根據(jù)人員對(duì)于設(shè)備的服務(wù)水平的不同,會(huì)出現(xiàn)延遲。服務(wù)水平通常有以下三個(gè)級(jí)別:
1.有人值守:1小時(shí)響應(yīng)
2.電話告警:4小時(shí)響應(yīng)
3.無(wú)人值守:24小時(shí)響應(yīng)
考慮到這些因素,交流供電問(wèn)題而造成的設(shè)備宕機(jī)會(huì)變得非常嚴(yán)重,如下表所示。
UPS對(duì)于系統(tǒng)宕機(jī)的影響
在增加使用UPS后,會(huì)出現(xiàn)另外三種對(duì)系統(tǒng)宕機(jī)造成影響的情況,它們是:
1.如果斷電時(shí)間短于UPS運(yùn)行時(shí)間,可由UPS正常供電,消除了斷電對(duì)系統(tǒng)的影響
2.如果斷電時(shí)間長(zhǎng)于UPS運(yùn)行時(shí)間,延緩了斷電給系統(tǒng)帶來(lái)的影響
3.UPS本身有可能發(fā)生故障,造成斷電
很明顯,UPS的優(yōu)勢(shì)在于減少斷電事件。當(dāng)所安裝的UPS不考慮設(shè)備運(yùn)行或服務(wù)水平時(shí),斷電發(fā)生的次數(shù)就減少了,如下表所示(PA=N+1容錯(cuò)型UPS,如APCSymmetraPowerArray):
考慮所有因素,可以看出,添加UPS后,宕機(jī)時(shí)間會(huì)大幅縮短,但縮短幅度會(huì)在很大程度上受到提供給設(shè)備的服務(wù)水平和設(shè)備運(yùn)行的影響。如以下三個(gè)表格所示:
UPS選擇指引
根據(jù)以上數(shù)據(jù),可以總結(jié)出一系列有關(guān)如何選擇UPS來(lái)縮短宕機(jī)時(shí)間的普遍準(zhǔn)則。
1.一臺(tái)UPS有可能只是稍微縮短宕機(jī)時(shí)間,也有可能將宕機(jī)時(shí)間縮短三個(gè)數(shù)量級(jí),具體取決于所選的UPS類(lèi)型、設(shè)備運(yùn)行和服務(wù)水平。
2.如果從原本使用可運(yùn)行5分鐘的UPS改用可運(yùn)行1小時(shí)的UPS,宕機(jī)率一般能降低一個(gè)數(shù)量級(jí)。
3.為實(shí)現(xiàn)99.999%正常運(yùn)行時(shí)間的目標(biāo),需要部署可運(yùn)行時(shí)間在1小時(shí)以上的UPS或UPS配備發(fā)電機(jī)。
4.在無(wú)人值守地點(diǎn),需要部署一個(gè)容錯(cuò)型(N+1)冗余UPS和一個(gè)發(fā)電機(jī),才能實(shí)現(xiàn)99.999%正常運(yùn)行時(shí)間的目標(biāo)。
5.安裝UPS后,需要手動(dòng)重啟的系統(tǒng)在延長(zhǎng)正常運(yùn)行時(shí)間方面受益最大。
結(jié)論
斷電是阻礙實(shí)現(xiàn)99.999%正常運(yùn)行時(shí)間目標(biāo)(每年宕機(jī)時(shí)間僅為4.8分鐘)的一個(gè)主要障礙。對(duì)于系統(tǒng)需要手動(dòng)重啟的遠(yuǎn)程地點(diǎn)來(lái)說(shuō),其宕機(jī)時(shí)間將達(dá)到4.8分鐘的4000倍,而就普通公司部署的IT系統(tǒng)而言,其宕機(jī)時(shí)間則可能為4.8分鐘的23倍。UPS能大幅延長(zhǎng)正常運(yùn)行時(shí)間,但如果希望實(shí)現(xiàn)99.999%的可靠性目標(biāo),可能需要部署更長(zhǎng)時(shí)間運(yùn)行的UPS或帶發(fā)電機(jī)的UPS。
本文未涉及除斷電外其它交流供電干擾對(duì)于正常運(yùn)行時(shí)間的影響;電壓過(guò)高和瞬變電壓?jiǎn)栴}也會(huì)造成宕機(jī)次數(shù)增加,影響系統(tǒng)性能,因此也需要對(duì)它們進(jìn)行預(yù)防。而使用UPS電源也有助于消除此類(lèi)問(wèn)題,所以UPS電源為用戶帶來(lái)的獲益遠(yuǎn)不止本文中介紹的優(yōu)勢(shì)。