人們對(duì)新事物的認(rèn)知過程總是螺旋式迭代演進(jìn)的,對(duì)于智能運(yùn)維也是如此,智能運(yùn)維是運(yùn)維發(fā)展的方向,而且是一個(gè)長期的過程—從經(jīng)驗(yàn)主義到數(shù)據(jù)驅(qū)動(dòng),再回歸到業(yè)務(wù)驅(qū)動(dòng)的過程。從2016年對(duì)于Gartner的概念的理解,到之后每一年不斷的探索與實(shí)踐,到2020年,在筆者參加的智能運(yùn)維國家標(biāo)準(zhǔn)編寫組會(huì)議上,行業(yè)內(nèi)達(dá)成了高度的、更加面向現(xiàn)實(shí)的共識(shí):以數(shù)據(jù)為基礎(chǔ)、以場景為導(dǎo)向、以算法為支撐,如圖2-1所示。
▲圖2-1 行業(yè)對(duì)智能運(yùn)維發(fā)展演進(jìn)的理解智能運(yùn)維一定來源于非常好的數(shù)據(jù)基礎(chǔ),同時(shí),如果沒有明確的業(yè)務(wù)場景,或者需求,或者功能方面的落腳點(diǎn),所謂的智能化就是為了AI而AI,也沒有意義。工程化算法是要擬合數(shù)據(jù)的,根據(jù)數(shù)據(jù)和場景需求才能選擇或研發(fā)合適的算法。只有具備上述三個(gè)條件,才能真正形成一個(gè)工程化落地的智能運(yùn)維,如圖2-2所示。
▲圖2-2 “三架馬車”工程化落地的智能運(yùn)維需要著重提及的是,以往很多用戶忽略了作為智能業(yè)務(wù)運(yùn)維“基石”的運(yùn)維數(shù)據(jù)的重要性。為切實(shí)落地企業(yè)的智能業(yè)務(wù)運(yùn)維規(guī)劃,一方面要強(qiáng)調(diào)運(yùn)維數(shù)據(jù)的基礎(chǔ)作用,另一方面要形成運(yùn)維數(shù)據(jù)治理與應(yīng)用的全局體系,圍繞規(guī)劃、系統(tǒng)與實(shí)施三個(gè)核心階段工作,面向運(yùn)維數(shù)據(jù)的全生命周期與業(yè)務(wù)導(dǎo)向結(jié)果,從數(shù)據(jù)的整體規(guī)劃、運(yùn)維數(shù)據(jù)源、數(shù)據(jù)采集、數(shù)據(jù)的計(jì)算與處理、指標(biāo)管理體系的規(guī)劃與實(shí)施、專業(yè)運(yùn)維數(shù)據(jù)庫的建立、數(shù)據(jù)的典型應(yīng)用場景等多角度進(jìn)行思考。但需要正視的是我們對(duì)運(yùn)維數(shù)據(jù)的認(rèn)識(shí)及應(yīng)用還處于皮毛階段,雖有理念但缺乏必要的、可執(zhí)行的方法。隨著運(yùn)維數(shù)據(jù)平臺(tái)的建設(shè),將極有可能出現(xiàn)當(dāng)前大數(shù)據(jù)領(lǐng)域出現(xiàn)的數(shù)據(jù)孤島、數(shù)據(jù)不可用、數(shù)據(jù)質(zhì)量不高、融合應(yīng)用難、有數(shù)據(jù)不會(huì)用等諸多問題。上述問題,在當(dāng)前運(yùn)維領(lǐng)域資源投入不足時(shí)顯得尤其重要。借鑒大數(shù)據(jù)領(lǐng)域數(shù)據(jù)治理的經(jīng)驗(yàn),反思運(yùn)維數(shù)據(jù)平臺(tái)建設(shè)應(yīng)該關(guān)注的問題,減少不必要的坑,做好運(yùn)維數(shù)據(jù)治理,讓運(yùn)維數(shù)據(jù)更好用、用得更好,完善運(yùn)維數(shù)字化工作空間。在運(yùn)維領(lǐng)域,運(yùn)維數(shù)據(jù)分布在大量的機(jī)器、軟件和“監(jiān)管控析”工具上,除了上面大數(shù)據(jù)領(lǐng)域提到的數(shù)據(jù)孤島、質(zhì)量不高、數(shù)據(jù)不可知、數(shù)據(jù)服務(wù)不夠的痛點(diǎn)外,運(yùn)維數(shù)據(jù)還有以下突出痛點(diǎn):
一、資源投入不夠。從組織的定位看,運(yùn)維屬于企業(yè)后臺(tái)中的后臺(tái)部門,所做的事甚至都很難讓IT條線的產(chǎn)品、項(xiàng)目、開發(fā)明白系統(tǒng)架構(gòu)越來越復(fù)雜、迭代頻率越來越高、外部環(huán)境越來越嚴(yán)峻等需要持續(xù)性的運(yùn)維投入,更不要說讓IT條線以外的部門理解你在做的事,在運(yùn)維的資源投入通常是不夠的。所以,運(yùn)維數(shù)據(jù)體系建設(shè)要強(qiáng)調(diào)投入產(chǎn)出比,在有限的資源投入下,收獲更多的數(shù)據(jù)價(jià)值。
二、數(shù)據(jù)標(biāo)準(zhǔn)化比例低。運(yùn)維數(shù)據(jù)主要包括監(jiān)控、日志、性能、配置、流程、應(yīng)用運(yùn)行數(shù)據(jù)。除了統(tǒng)一監(jiān)控報(bào)警、配置、機(jī)器日志、ITIL里的幾大流程的數(shù)據(jù)格式有相關(guān)標(biāo)準(zhǔn),其他數(shù)據(jù)存在格式眾多、非結(jié)構(gòu)化、實(shí)時(shí)性要求高、海量數(shù)據(jù)、采集方式復(fù)雜等特點(diǎn),可以說運(yùn)維源數(shù)據(jù)天生就是非標(biāo)準(zhǔn)的,要在“資源投入不夠”的背景下,采用業(yè)務(wù)大數(shù)據(jù)的運(yùn)作模式比較困難。
三、缺乏成熟的方法。雖然行業(yè)也提出了ITOA、DataOps、AIOps等運(yùn)維數(shù)據(jù)分析應(yīng)用的思路,但是缺少一些成熟、全面的數(shù)據(jù)建模、分析、應(yīng)用的方法,主流的運(yùn)維數(shù)據(jù)方案目前主要圍繞監(jiān)控和應(yīng)急領(lǐng)域探索。
四、缺乏人才。如“資源投入不夠”這點(diǎn)提到的背景,因?yàn)橥度氩蛔悖茈y吸引到足夠的人才投入到運(yùn)維數(shù)據(jù)分析領(lǐng)域。通俗一點(diǎn)來說,就是運(yùn)維數(shù)據(jù)分析要借鑒當(dāng)前傳統(tǒng)大數(shù)據(jù)領(lǐng)域數(shù)據(jù)治理的經(jīng)驗(yàn),提高投入產(chǎn)出比,少走彎路,少跳坑。
(部分內(nèi)容來源網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系刪除)