IT部門規(guī)模較大的企業(yè)一般將IT部門至少劃分為開發(fā)中心和數(shù)據(jù)中心,甚至測試中心和需求中心。相對而言,數(shù)據(jù)中心與其他中心區(qū)別最大,其職責(zé)是維護和運營IT產(chǎn)品(包括硬件設(shè)備、軟件系統(tǒng)、通信網(wǎng)絡(luò)等)。),其管理特點與金融銀行業(yè)最為相似。
數(shù)據(jù)中心價值的實現(xiàn)就是提供IT服務(wù)。國際主流IT服務(wù)管理標(biāo)準(zhǔn)是ITIL。基本上,小規(guī)模的數(shù)據(jù)中心必須通過ITIL認(rèn)證和ISO20000/27000。就像ISO9000是企業(yè)運營的基本保障,ITIL只是IT服務(wù)的基本保障。獲得該認(rèn)證意味著其標(biāo)準(zhǔn)得到遵守,IT服務(wù)的質(zhì)量水平可控,但質(zhì)量控制并不意味著質(zhì)量過硬。
數(shù)據(jù)中心的客戶價值是提供可用的信息技術(shù)服務(wù)。因此,IT系統(tǒng)的持續(xù)可用性是其首要指標(biāo)。借鑒惠普提出的軟件質(zhì)量FURPS模型,產(chǎn)品質(zhì)量包括功能性、可用性、可靠性、性能和可支持性五個方面。狹義理解IT系統(tǒng)的持續(xù)可用性,僅指其可用性的可靠性指標(biāo)。廣義而言,IT系統(tǒng)的持續(xù)可用性也應(yīng)該意味著功能的完備性和性能的正常性。為
與此同時,隨著移動互聯(lián)網(wǎng)的應(yīng)用日益廣泛,IT系統(tǒng)負(fù)載的差異也在迅速增大。在日常業(yè)務(wù)周期中,業(yè)務(wù)IT系統(tǒng)的峰值負(fù)載與平均負(fù)載之比僅為傳統(tǒng)業(yè)務(wù)的數(shù)倍,而移動互聯(lián)網(wǎng)業(yè)務(wù)的峰值負(fù)載與平均負(fù)載之比高達(dá)數(shù)十倍,不包括雙十一營銷期、春節(jié)紅包期等極端情況。這種極不平衡的業(yè)務(wù)量趨勢,對業(yè)務(wù)IT系統(tǒng)的能力儲備提出了嚴(yán)峻挑戰(zhàn)。原始系統(tǒng)規(guī)劃中的冗余估計不再可靠。數(shù)據(jù)中心面臨著繁忙時段系統(tǒng)過載概率和空閑時段系統(tǒng)利用率的雙重煎熬,IT系統(tǒng)運維成本壓力陡然增大。IT系統(tǒng)的靈活容量分配雖然在技術(shù)上可以通過虛擬機動態(tài)資源分配技術(shù)來實現(xiàn),但虛擬機池的整體規(guī)劃仍然離不開對IT系統(tǒng)容量需求的估算,容量估算的假設(shè)是業(yè)務(wù)應(yīng)用系統(tǒng)對IT資源的需求是不變的,即性能穩(wěn)定。
去年,在某商業(yè)銀行數(shù)據(jù)中心IT系統(tǒng)利用率研究項目中,我們利用生產(chǎn)環(huán)境中的大量系統(tǒng)數(shù)據(jù)進行假設(shè)驗證,證明IT系統(tǒng)的負(fù)載分布滿足一定的分布模式,說明精益六西格瑪統(tǒng)計分析方法能夠準(zhǔn)確預(yù)測IT系統(tǒng)的合理容量冗余和過載風(fēng)險。
此外,精益六西格瑪技術(shù)可以輔助建立IT系統(tǒng)的性能包絡(luò),加強當(dāng)前IT系統(tǒng)性能監(jiān)測技術(shù)的準(zhǔn)確性和預(yù)測能力,大大降低系統(tǒng)擴展的成本。這些效果在某商業(yè)銀行數(shù)據(jù)中心IT系統(tǒng)能力評估試點項目中得到了很好的實現(xiàn)。因此,精益六西格瑪方法論與IT運維專業(yè)知識的融合,可以為金融銀行等大型數(shù)據(jù)中心提供降本增效的解決方案。