第一章 總 則
運(yùn)維目標(biāo)是在服務(wù)出現(xiàn)異常時(shí)盡可能快速恢復(fù)服務(wù),從而保障服務(wù)的可用 性;同時(shí)深入分析故障產(chǎn)生的原因;推動并修復(fù)服務(wù)存在的問題,同時(shí)設(shè)計(jì)并開發(fā)相關(guān)的預(yù)案以確保服務(wù)出現(xiàn)故障可以高效止損。第一條 為保障信息系統(tǒng)軟硬件設(shè)備的良好運(yùn)行,使運(yùn)維技術(shù)人員工作制度化、流程化、規(guī)范化,特制定本制度。第二條 運(yùn)維管理工作總體目標(biāo):立足根本促發(fā)展,開拓運(yùn)維新局面。在辦公系統(tǒng)運(yùn)行推廣時(shí)期,通過網(wǎng)絡(luò)、桌面、系統(tǒng)等的運(yùn)維,促進(jìn)信息系統(tǒng)能夠穩(wěn)定可持續(xù)性發(fā)展。第三條
運(yùn)維管理制度的適用范圍:運(yùn)維全體人員。
第二章 編制方法
第一條 本實(shí)施細(xì)則包括運(yùn)維服務(wù)全生命周期管理方法、管理標(biāo)準(zhǔn)/規(guī)范、管理模式、管理支撐工具、管理對象以及基于流程的管理方法。第二條
本實(shí)施細(xì)則以 ITIL/ISO20000為基礎(chǔ),以信息化項(xiàng)目的運(yùn)維為目標(biāo),以管理支撐工具為手段,以流程化、規(guī)范化、標(biāo)準(zhǔn)化管理為方法,以全生命周期的 PDCA 循環(huán)為提升途徑,體現(xiàn)了對運(yùn)維服務(wù)全過程的體系化管理。
第三章 運(yùn)維部工作職責(zé)
第一條 系統(tǒng)運(yùn)維和技術(shù)支持
1)根據(jù)公司業(yè)務(wù)的推進(jìn)和發(fā)展目標(biāo),負(fù)責(zé)平臺信息系統(tǒng)管理及數(shù)據(jù)交換策略的整體架構(gòu)、 對應(yīng)用系統(tǒng)等技術(shù)開發(fā)方案的基礎(chǔ)支撐,保障基礎(chǔ)平臺的穩(wěn)定性和先進(jìn)性。2)負(fù)責(zé)系統(tǒng)基礎(chǔ)平臺的使用培訓(xùn)和操作使用指南編寫,對用戶使用過程中出現(xiàn)問題的溝通和解決;3)會同項(xiàng)目實(shí)施,確認(rèn)系統(tǒng)信息基礎(chǔ)設(shè)備和軟件數(shù)量、品牌規(guī)格、技術(shù)參數(shù),確保項(xiàng)目有效推進(jìn)實(shí)施。4)系統(tǒng)信息基礎(chǔ)設(shè)備和軟件操作規(guī)程、應(yīng)用管理制度的制定,并負(fù)責(zé)監(jiān)督執(zhí)行。5)系統(tǒng)信息基礎(chǔ)設(shè)備的軟件安裝、調(diào)試和驗(yàn)收,使用培訓(xùn)和維修保養(yǎng)。6)系統(tǒng)信息基礎(chǔ)平臺日常運(yùn)行過程中信息安全和技術(shù)問題的協(xié)調(diào)解決,保障平臺 24小時(shí)安全穩(wěn)定運(yùn)行。7)負(fù)責(zé)平臺系統(tǒng)管理及設(shè)備保密口令的設(shè)置、更新、保存。8)負(fù)責(zé)系統(tǒng)信息協(xié)同管理及協(xié)同數(shù)據(jù)交換策略研究新程序、新系統(tǒng)和軟件改版升級工作。
第二條. 平臺信息和技術(shù)安全
1)執(zhí)行國家有關(guān)網(wǎng)絡(luò)信息技術(shù)安全的法律法規(guī),與通信管理和網(wǎng)絡(luò)安全監(jiān)管部門聯(lián)絡(luò),及時(shí)處理基礎(chǔ)研發(fā)平臺信息技術(shù)安全方面存在的問題,確保平臺 安全、穩(wěn)定、可靠運(yùn)行。2)基礎(chǔ)運(yùn)營平臺信息技術(shù)安全保密制度和工作流程的制定,落實(shí)信息技術(shù)安全保密責(zé)任制,執(zhí)行“誰主管、誰負(fù)責(zé),誰主辦、誰負(fù)責(zé)”的原則,責(zé)任到人。3)在服務(wù)器和計(jì)算機(jī)之間設(shè)置硬件防火墻,在服務(wù)器及工作站上均安裝防病毒軟件,進(jìn)行硬件和技術(shù)雙保護(hù),確保基礎(chǔ)研發(fā)平臺不受病毒和黑客攻擊4)負(fù)責(zé)基礎(chǔ)運(yùn)營平臺信息技術(shù)安全應(yīng)急處理預(yù)案制定和實(shí)施。5)建立多機(jī)備份基礎(chǔ)平臺信息服務(wù)系統(tǒng)機(jī)制,一旦主系統(tǒng)遇到故障或受到攻擊導(dǎo)致不能正常運(yùn)行,可以在最短的時(shí)間內(nèi)替換主系統(tǒng)提供服務(wù)。6)建立基礎(chǔ)平臺系統(tǒng)集中式權(quán)限管理,按照崗位職責(zé)設(shè)定工作人員操作權(quán)限,針對不同應(yīng)用系統(tǒng)、終端、操作人員,設(shè)置共享數(shù)據(jù)庫信息的訪問權(quán)限, 并設(shè)置密碼。不同的操作人員設(shè)定不同的用戶名,且定期更換,嚴(yán)禁操作人員泄漏密碼。
第四章 運(yùn)維服務(wù)管理體系
運(yùn)維服務(wù)管理體系規(guī)定了運(yùn)維工作涉及的各類實(shí)體,以及這些實(shí)體間的相互 關(guān)系。相關(guān)的實(shí)體按照運(yùn)維服務(wù)管理體系進(jìn)行有機(jī)組織,并協(xié)調(diào)工作,按照服務(wù)協(xié)議要求提供不同級別的 IT 運(yùn)維服務(wù)。
第一條 運(yùn)維服務(wù)管理對象
運(yùn)維服務(wù)管理對象包括基礎(chǔ)設(shè)施、應(yīng)用系統(tǒng)、用戶、供應(yīng)商、以及IT運(yùn)維部門和人員,具體內(nèi)容如下:1)基礎(chǔ)設(shè)施包括網(wǎng)絡(luò)、主機(jī)系統(tǒng)、存儲/備份系統(tǒng)、終端系統(tǒng)、安全系統(tǒng)、 以及機(jī)房動力環(huán)境等。2)應(yīng)用系統(tǒng)包括 OA 辦公信息系統(tǒng)、門戶網(wǎng)站等應(yīng)用系統(tǒng)等。3)用戶包括使用如上應(yīng)用系統(tǒng)的用戶。4)供應(yīng)商包括基礎(chǔ)設(shè)施和應(yīng)用系統(tǒng)的供應(yīng)商以及 IT 運(yùn)維服務(wù)的供應(yīng)商。5)運(yùn)維部門和人員包括內(nèi)部參與運(yùn)維活動的相關(guān)部門和人員,以及提供運(yùn)維服務(wù)的企業(yè)和相關(guān)人員。
第二條 運(yùn)維系統(tǒng)功能框架
根據(jù)建設(shè)單位的系統(tǒng)結(jié)構(gòu)和業(yè)務(wù)開展需要,運(yùn)維項(xiàng)目組將項(xiàng)目的維護(hù)框架分 為9個具體組成部分,分別為:服務(wù)臺、時(shí)間管理。工單管理、問題管理、變更管理、配置管理、工程師考核、知識庫管理、統(tǒng)計(jì)、系統(tǒng)管理等。
第二條 運(yùn)維管理組織結(jié)構(gòu)
運(yùn)維項(xiàng)目的運(yùn)維管理結(jié)構(gòu)為三層模式,由項(xiàng)目負(fù)責(zé)人與甲方進(jìn)行業(yè)務(wù)范圍接洽,并將溝通結(jié)果向下傳遞。項(xiàng)目經(jīng)理負(fù)責(zé)項(xiàng)目的整體運(yùn)維工作,包括各種制度的制定和實(shí)施。運(yùn)維工程師則在項(xiàng)目經(jīng)理的指導(dǎo)下開展維護(hù)工作.

第三條
項(xiàng)目負(fù)責(zé)人職責(zé):負(fù)責(zé)項(xiàng)目商務(wù)、整體協(xié)調(diào)事宜。職位描述:
1、整體負(fù)責(zé)建設(shè)單位運(yùn)維項(xiàng)目服務(wù)計(jì)劃的制定,領(lǐng)導(dǎo)項(xiàng)目經(jīng)理并安排項(xiàng)目工作,指導(dǎo)項(xiàng)目經(jīng)理完成具體維護(hù)工作,每周聽取項(xiàng)目經(jīng)理的工作匯報(bào),負(fù)責(zé)考核項(xiàng)目經(jīng)理工作完成情況。
2、協(xié)助建設(shè)單位完成新增項(xiàng)目的調(diào)研、方案設(shè)計(jì)并指導(dǎo)項(xiàng)目經(jīng)理進(jìn)行具體實(shí)施。
第四條
項(xiàng)目經(jīng)理
職責(zé):規(guī)劃、執(zhí)行、完善信息化項(xiàng)目的運(yùn)維工作,指導(dǎo)網(wǎng)絡(luò)、數(shù)據(jù)庫維護(hù)工 程師開展工作。職位描述:
1、根據(jù)公司戰(zhàn)略目標(biāo),指導(dǎo)下屬工程師開展服務(wù)工作,確保運(yùn)維工作能夠滿足客業(yè)務(wù)的實(shí)際需要;
2、建立和持續(xù)完善運(yùn)維管理體系,優(yōu)化運(yùn)維流程流程,解決運(yùn)維服務(wù)中出現(xiàn)的特殊問題;
3、規(guī)劃并提升運(yùn)維工程師專業(yè)服務(wù)能力,在整體上提高服務(wù)滿意度;
4、制定和持續(xù)完善績效考核體系;
5、制定整理運(yùn)維項(xiàng)目的應(yīng)急預(yù)案系統(tǒng),并指導(dǎo)運(yùn)維工程師實(shí)施;
6、提高自身專業(yè)技能,在業(yè)務(wù)方面給予網(wǎng)絡(luò)管理員和數(shù)據(jù)庫管理員指導(dǎo)。
第五條
技術(shù)主管
職責(zé):應(yīng)用、數(shù)據(jù)庫管理,數(shù)據(jù)庫性能調(diào)優(yōu),實(shí)現(xiàn)應(yīng)用負(fù)載均衡。職位描述:
1. 技術(shù)主管非項(xiàng)目常駐人員,根據(jù)項(xiàng)目需要進(jìn)行專業(yè)方面指導(dǎo);
2. 負(fù)責(zé)數(shù)據(jù)庫性能分析與調(diào)優(yōu),數(shù)據(jù)庫運(yùn)行狀態(tài)監(jiān)控,及時(shí)發(fā)現(xiàn)異常并快速處理。
3. 熟練掌握數(shù)據(jù)庫技術(shù),能夠?qū)崿F(xiàn)部署及調(diào)優(yōu)。
4. 掌握中間件的工作原理,能夠?qū)崿F(xiàn)部署調(diào)優(yōu)及故障解決。
5. 熟練掌握 linux 操作系統(tǒng),部署數(shù)據(jù)庫。熟練掌數(shù)據(jù)庫冗災(zāi)、數(shù)據(jù)保護(hù)、故障恢復(fù)技術(shù)。
6. 負(fù)責(zé)應(yīng)用負(fù)載均衡的部署和調(diào)試。
7. 負(fù)責(zé)指導(dǎo)數(shù)據(jù)庫工程師管理員開展工作。
第六條
服務(wù)臺
職責(zé):故障電話受理,文檔管理。職位描述
1. 負(fù)責(zé)業(yè)務(wù)的救助電話的受理工作;
2. 故障處理的發(fā)起人,同時(shí)進(jìn)行維護(hù)工程師指派,跟蹤事件處理狀態(tài);
3. 進(jìn)行維護(hù)故障統(tǒng)計(jì)、用戶滿意度統(tǒng)計(jì)、工作報(bào)表輸出等工作;
4. 協(xié)助項(xiàng)目經(jīng)理,進(jìn)行文檔整理、歸類、保存等工作。
第七條 網(wǎng)絡(luò)管理員
職責(zé):維護(hù)建設(shè)單位網(wǎng)絡(luò)系統(tǒng)正常,解決網(wǎng)絡(luò)相關(guān)故障。職位描述:
1、對現(xiàn)有服務(wù)器、局域網(wǎng)絡(luò)及機(jī)房、配線間的日常管理維護(hù);
2、對信息安全建設(shè)提出相關(guān)建議,確保網(wǎng)絡(luò)的安全;
3、保證外網(wǎng)光纖線路正常,保證局域網(wǎng)運(yùn)行正常;
4、對網(wǎng)絡(luò)系統(tǒng)和網(wǎng)絡(luò)設(shè)備的運(yùn)行狀態(tài)進(jìn)行監(jiān)控;
5、熟練掌握域策略設(shè)置、 DHCP、DNS、FTP服務(wù)器、 NTFS 權(quán)限設(shè)置等;
6、編寫網(wǎng)絡(luò)部分的應(yīng)用處理預(yù)案并實(shí)施。
7、工作認(rèn)真、細(xì)致,積極主動有條理性,具有良好的溝通能力及團(tuán)隊(duì)合作精神.
第八條
應(yīng)用、數(shù)據(jù)庫管理員
職責(zé):維護(hù)建設(shè)單位業(yè)務(wù)系統(tǒng)運(yùn)行正常,解決應(yīng)用和數(shù)據(jù)庫故障。職位描述:
1、監(jiān)測業(yè)務(wù)系統(tǒng)運(yùn)行狀況,應(yīng)用、數(shù)據(jù)庫性能監(jiān)視及優(yōu)化,作必要調(diào)整;
2、規(guī)劃不同數(shù)據(jù)的生命周期,制定備份、恢復(fù)、遷移和災(zāi)備策略,根據(jù)業(yè)務(wù)的需要執(zhí)行數(shù)據(jù)轉(zhuǎn)換及遷移等操作;
3、保證應(yīng)用和數(shù)據(jù)庫系統(tǒng)的安全性、完整性和運(yùn)行效率。
4、負(fù)責(zé)數(shù)據(jù)庫平臺的整體架構(gòu)及解決方案的制定和實(shí)施;
5、工作認(rèn)真、細(xì)致,積極主動有條理性,具有良好的溝通能力及團(tuán)隊(duì)合作精神.
第九條 終端管理員
職責(zé):維護(hù)建設(shè)單位桌面系統(tǒng)運(yùn)行正常,解決終端、外設(shè)故障。職位描述:
1、各部門電腦、打印機(jī)、傳真機(jī)的維護(hù);
2、對各部門職員進(jìn)行電腦相關(guān)的技術(shù)支持及培訓(xùn)工作;
3、精通中標(biāo) Linux 及?WPS 辦公軟件的使用,能夠熟練使用Windows
;MS Office 軟件,能夠制作相應(yīng)教程對其他部門員工進(jìn)行培訓(xùn)。
第十條 運(yùn)維服務(wù)流程
IT運(yùn)維服務(wù)管理流程涉及服務(wù)臺、事件管理、問題管理、配置管理、變更管理、發(fā)布管理、服務(wù)級別管理、財(cái)務(wù)管理、能力管理、可用性管理、服務(wù)持續(xù)性管理、知識管理及供應(yīng)商管理等,隨著運(yùn)維活動的不斷深入和持續(xù)改進(jìn), 其他流 程可能會逐步獨(dú)立并規(guī)范。
第十一條 服務(wù)臺
服務(wù)臺是支持運(yùn)維服務(wù)的核心功能,與各個流程聯(lián)系密切。所有管理流程都要通過服務(wù)臺為用戶提供單點(diǎn)聯(lián)系,解答用戶的相關(guān)問題和需求,或?yàn)橛脩魧で笙鄳?yīng)的支持人員
第十二條
事件管理
事件管理流程的主要目標(biāo)是盡快恢復(fù)服務(wù)提供并減少其對業(yè)務(wù)的不利影響, 盡可能保證最好的服務(wù)質(zhì)量和可用性等級。事件管理流程通常涉及事件的偵測和記錄、事件的分類和支持、事件的調(diào)查和診斷、事件的解決和恢復(fù)以及事件的關(guān)閉。
第十三條
工單管理
工單管理:工單是現(xiàn)場運(yùn)維、二線支持的任務(wù)載體、?運(yùn)維工程依據(jù)所接收工 單進(jìn)行運(yùn)維工作。工單管理是對工單實(shí)現(xiàn)創(chuàng)建、變更、查詢?yōu)g覽、派發(fā)、監(jiān)督等功能的模塊。
第十四條
問題管理
問題管理流程的主要目標(biāo)是預(yù)防問題和事故的再次發(fā)生,并將未能解決的事 件的影響降低到最小。問題管理流程包括診斷事件根本原因和確定問題解決方案所需要的活動, 通過合適的控制過程,尤其是變更管理和發(fā)布管理, 負(fù)責(zé)確保解
決方案的實(shí)施。問題管理還將維護(hù)有關(guān)問題、應(yīng)急方案和解決方案的信息。問題管理是針對已處理事件的遺留問題或處理事件的方案只是治標(biāo)不治本的不能徹底解決問題而考慮的模塊。根據(jù)事件、及處理方案,問題處理人經(jīng)過調(diào)
查、診斷并提出最終解決方法。
第十五條
變更管理
變更管理實(shí)現(xiàn)所有基礎(chǔ)設(shè)施和應(yīng)用系統(tǒng)的變更,變更管理應(yīng)記錄并對所有要 求的變更進(jìn)行分類, 應(yīng)評估變更請求的風(fēng)險(xiǎn)、影響和業(yè)務(wù)收益。其主要目標(biāo)是以對服務(wù)最小的干擾實(shí)現(xiàn)有益的變更。變更管理是要對重大資源的新增、變更、升級等運(yùn)維活動進(jìn)行審核的功能,
以免這些活動對現(xiàn)有資源的可用性造成沒有必要的影響和破壞;同時(shí),他還要實(shí)現(xiàn)在工單中產(chǎn)生的變化進(jìn)行后審計(jì)的功能。
第十六條
配置管理
配置管理流程負(fù)責(zé)核實(shí)基礎(chǔ)設(shè)施和應(yīng)用系統(tǒng)中實(shí)施的變更以及配置項(xiàng)之間的關(guān)系是否已經(jīng)被正確記錄下來;確保配置管理數(shù)據(jù)庫能夠準(zhǔn)確地反映現(xiàn)存配置
項(xiàng)的實(shí)際版本狀態(tài)。配置管理實(shí)際上是全部資源的統(tǒng)一管理的功能,包括資源整個生命周期的參 數(shù)或配置的變化記錄的管理。管理信息主要涉及分類、型號、版本、位置,狀態(tài)、 相關(guān)資料等基本信息還包括核心參數(shù)等
第十七條
知識庫管理
知識庫管理:知識庫是提供給運(yùn)維人員重要的技術(shù)資料內(nèi)容,匯集在工作遇到的典型案例歸納總結(jié)的知識要點(diǎn)和全面實(shí)用資料手冊。?知識庫管理提供便于使用的人機(jī)接口、快速查詢的技術(shù)手段和維護(hù)手段。
第十八條 統(tǒng)計(jì)及工作報(bào)告
運(yùn)維管理系統(tǒng)提供一線解決率統(tǒng)計(jì)、客戶滿意度統(tǒng)計(jì)、按分類的事件匯總統(tǒng) 計(jì)、工作報(bào)告生成的功能,按照一定格式根據(jù)事件數(shù)據(jù)、工單數(shù)據(jù)、問題數(shù)據(jù)、 配置數(shù)據(jù)、變更數(shù)據(jù)可以幫助運(yùn)維管理者能把運(yùn)維的所做的工作內(nèi)容清晰的羅列
出來。
第四章 運(yùn)維服務(wù)內(nèi)容
第一條 服務(wù)目標(biāo)
運(yùn)維項(xiàng)目組提供的運(yùn)行維護(hù)服務(wù)包括,信息系統(tǒng)相關(guān)的主機(jī)設(shè)備、操作系統(tǒng)、 數(shù)據(jù)庫和存儲設(shè)備的運(yùn)行維護(hù)服務(wù),保證用戶現(xiàn)有的信息系統(tǒng)的正常運(yùn)行,
降低整體管理成本,提高網(wǎng)絡(luò)信息系統(tǒng)的整體服務(wù)水平。同時(shí)根據(jù)日常維護(hù)的數(shù)據(jù)和記錄,提供用戶信息系統(tǒng)的整體建設(shè)規(guī)劃和建議,更好為用戶的信息化發(fā)展提供有力的保障。用戶信息系統(tǒng)的組成主要可分為兩類:硬件設(shè)備和軟件系統(tǒng)。硬件設(shè)備包括 網(wǎng)絡(luò)設(shè)備、安全設(shè)備、主機(jī)設(shè)備、存儲設(shè)備等;軟件設(shè)備可分為操作系統(tǒng)軟件、典型應(yīng)用軟件(如:數(shù)據(jù)庫軟件、中間件軟件等)、業(yè)務(wù)應(yīng)用軟件等。服務(wù)項(xiàng)目范圍覆蓋的信息系統(tǒng)資源以下方面的關(guān)鍵狀態(tài)及參數(shù)指標(biāo):運(yùn)行狀態(tài)、故障情況、配置信息、可用性情況及健康狀況性能指標(biāo)
第二條
資產(chǎn)統(tǒng)計(jì)服務(wù)
服務(wù)內(nèi)容包括:硬件設(shè)備型號、數(shù)量、版本等信息統(tǒng)計(jì)、記錄軟件產(chǎn)品型號、版本和補(bǔ)丁等信息統(tǒng)計(jì)記錄網(wǎng)絡(luò)結(jié)構(gòu)、網(wǎng)絡(luò)路由、網(wǎng)絡(luò)? IP 地址統(tǒng)計(jì)記錄綜合布線系統(tǒng)結(jié)構(gòu)圖的繪制其它附屬設(shè)備的統(tǒng)計(jì)記錄
第三條 網(wǎng)絡(luò)、安全系統(tǒng)運(yùn)維服務(wù)
從網(wǎng)絡(luò)的連通性、網(wǎng)絡(luò)的性能、網(wǎng)絡(luò)的監(jiān)控管理三個方面實(shí)現(xiàn)對網(wǎng)絡(luò)系統(tǒng)的 運(yùn)維管理。設(shè)備基礎(chǔ)性能檢測:CPU、內(nèi)存使用情況監(jiān)測;設(shè)備日志查看;設(shè)備 SNMP 狀態(tài);測試 Ping ,tracert 等工具的連通性;網(wǎng)絡(luò)安全策略應(yīng)用是否正常;Internet 帶寬流量的實(shí)時(shí)監(jiān)測;網(wǎng)絡(luò)拓?fù)滏溌窢顟B(tài)監(jiān)測;異常網(wǎng)絡(luò)數(shù)據(jù)包流量;Dos 、 ddos 等網(wǎng)絡(luò)攻擊情況監(jiān)測;Internet 線路的誤碼率、丟包率監(jiān)測;
第四條 主機(jī)、存儲系統(tǒng)運(yùn)維服務(wù)
提供的主機(jī)、存儲系統(tǒng)的運(yùn)維服務(wù)包括:主機(jī)、存儲設(shè)備的日常監(jiān)控,設(shè)備
的運(yùn)行狀態(tài)監(jiān)控,故障處理,操作系統(tǒng)維護(hù),補(bǔ)丁升級等內(nèi)容。
進(jìn)行監(jiān)控管理的內(nèi)容包括:CPU 性能管理;內(nèi)存使用情況管理;硬盤利用情況管理;系統(tǒng)進(jìn)程管理;
主機(jī)性能管理;實(shí)時(shí)監(jiān)控主機(jī)電源、風(fēng)扇的使用情況及主機(jī)機(jī)箱內(nèi)部溫度;監(jiān)控主機(jī)硬盤運(yùn)行狀態(tài);
監(jiān)控主機(jī)網(wǎng)卡、陣列卡等硬件狀態(tài);監(jiān)控主機(jī)HA 運(yùn)行狀況;主機(jī)系統(tǒng)文件系統(tǒng)管理;監(jiān)控存儲交換機(jī)設(shè)備狀態(tài)、端口狀態(tài)、傳輸速度;監(jiān)控備份服務(wù)進(jìn)程、備份情況(起止時(shí)間、是否成功、出錯告警);監(jiān)控記錄磁盤陣列、磁帶庫等存儲硬件故障提示和告警,并及時(shí)解決故障問題;
對存儲的性能(如高速緩存、光纖通道等)進(jìn)行監(jiān)控。
第五條
數(shù)據(jù)庫系統(tǒng)運(yùn)維服務(wù)?
提供的數(shù)據(jù)庫運(yùn)行維護(hù)服務(wù)是包括主動數(shù)據(jù)庫性能管理,數(shù)據(jù)庫的主動性能 管理對系統(tǒng)運(yùn)維非常重要。通過主動式性能管理可了解數(shù)據(jù)庫的日常運(yùn)行狀態(tài),識別數(shù)據(jù)庫的性能問題發(fā)生在什么地方,有針對性地進(jìn)行性能優(yōu)化。同時(shí),密切注意數(shù)據(jù)庫系統(tǒng)的變化,主動地預(yù)防可能發(fā)生的問題。1、進(jìn)行監(jiān)控管理內(nèi)容包括:數(shù)據(jù)庫基本信息:文件系統(tǒng)、碎片、死鎖、 CPU 占用率較大或時(shí)間較長的 SQL 語句。表空間使用信息監(jiān)測;數(shù)據(jù)庫文件 I/0 讀寫情況;Session 連接數(shù)量監(jiān)控;數(shù)據(jù)庫監(jiān)聽運(yùn)行狀態(tài)監(jiān)測;查看每日數(shù)據(jù)備份、數(shù)據(jù)同步是否正常;報(bào)警日志監(jiān)測;對表和索引進(jìn)行 Analyze, 檢查表空間碎片;檢測數(shù)據(jù)庫后臺進(jìn)程;數(shù)據(jù)庫對象的空間擴(kuò)展情況監(jiān)測;2、數(shù)據(jù)庫維護(hù)是指當(dāng)一個數(shù)據(jù)庫被創(chuàng)建以后的工作都叫做數(shù)據(jù)庫維護(hù)。包括備份系統(tǒng)數(shù)據(jù)、恢復(fù)數(shù)據(jù)庫系統(tǒng)、產(chǎn)生用戶信息表,并為信息表授權(quán)、監(jiān)視系統(tǒng)運(yùn)行狀況,及時(shí)處理系統(tǒng)錯誤、保證系統(tǒng)數(shù)據(jù)安全,周期更改用戶口令。3、需求受理流程1)產(chǎn)品組提出業(yè)務(wù)需求。2)開發(fā)組對需求進(jìn)行分析,并將需要更改的內(nèi)容反饋給運(yùn)維組3)運(yùn)維組對需求進(jìn)行分析,對需求分類,包括對數(shù)據(jù)庫的變更,升級,維護(hù)等方面的操作。4)DBA 將解決方案反饋給運(yùn)維部門領(lǐng)導(dǎo)審批,并反饋風(fēng)險(xiǎn)評估結(jié)果。5)運(yùn)維部門領(lǐng)導(dǎo)審批通過,提交方案到研發(fā)部分管領(lǐng)導(dǎo)審批,并反饋風(fēng)險(xiǎn)評價(jià)結(jié)果。6)研發(fā)部分管領(lǐng)導(dǎo)審批通過, DBA 實(shí)施變更方案。7)變更完成后,讓開發(fā)組協(xié)助驗(yàn)證變更結(jié)果,同時(shí)測試組對測試功能驗(yàn)
證。8)開發(fā)組核對數(shù)據(jù)無誤,測試組驗(yàn)證正常, DBA 對該需求歸檔。
第六條 中間件運(yùn)維服務(wù)
中間件管理是指對 tomcat 、ngnix等中間件的日常維護(hù)管理和監(jiān)控 工作,提高對中間件平臺事件的分析解決能力,確保中間件平臺持續(xù)穩(wěn)定運(yùn)行。中間件監(jiān)控指標(biāo)包括配置信息管理、故障監(jiān)控、性能監(jiān)控。
執(zhí)行線程:監(jiān)控中間件配置執(zhí)行線程的空閑數(shù)量。
JVM 內(nèi)存:JVM 內(nèi)存曲線正常,能夠及時(shí)的進(jìn)行內(nèi)存空間回收。
JDBC 連接池:連接池的初始容量和最大容量應(yīng)該設(shè)置為相等,并且至少等于執(zhí)行線程的數(shù)量,以避免在運(yùn)行過程中創(chuàng)建數(shù)據(jù)庫連接所帶來的性能消耗。
檢查中間件日志文件是否有異常報(bào)錯如果有中間件集群配置,需要檢查集群的配置是否正常。
第七條 終端、外設(shè)運(yùn)維服務(wù)
負(fù)責(zé)對終端PC 、筆記本以及工作站的操作系統(tǒng)、應(yīng)用軟件和硬件的維護(hù), 解決使用人員在應(yīng)用過程中遇到的問題并進(jìn)行簡單培訓(xùn),完成打印機(jī)等其他外設(shè) 的故障處理工作。
第五章 應(yīng)急服務(wù)響應(yīng)措施
運(yùn)維項(xiàng)目組制定了詳盡的應(yīng)急處理預(yù)案,整個流程嚴(yán)謹(jǐn)而有序。但在服務(wù)維 護(hù)過程中,意外情況將難以完全避免。我們將對項(xiàng)目實(shí)施的突發(fā)風(fēng)險(xiǎn)進(jìn)行詳細(xì)分析,并且針對各類突發(fā)事件,設(shè)計(jì)了相應(yīng)的預(yù)防與解決措施,
同時(shí)提供了完整的應(yīng)急處理流程。
第一條
應(yīng)急預(yù)案實(shí)施基本流程

第二條 突發(fā)事件應(yīng)急策略
1)值班人員平時(shí)應(yīng)做好應(yīng)急事件的監(jiān)控工作,對于突發(fā)事件應(yīng)認(rèn)真分析、 準(zhǔn)確判定故障發(fā)生的數(shù)據(jù)域,負(fù)責(zé)跟蹤該事件直至其結(jié)束。對于不在運(yùn)維中心的故障,應(yīng)在第一時(shí)間內(nèi)通知負(fù)責(zé)人去現(xiàn)場處理,密切關(guān)注事件流程及進(jìn)展情況,并做好登記工作上報(bào)領(lǐng)導(dǎo)。2)正常情況下,要求值班人員在15分鐘內(nèi)進(jìn)行事件確認(rèn)。如果屬于一般事件則按照事件流程進(jìn)行分派處理,否則應(yīng)迅速啟動《應(yīng)急預(yù)案》,并嚴(yán)格按照《應(yīng)急預(yù)案》所規(guī)定的步驟快速實(shí)施應(yīng)急處置,及時(shí)匯報(bào)上級領(lǐng)導(dǎo),掌握實(shí)時(shí)
處理情況。3)在處理過程中,如需其他部門去現(xiàn)場增援處理,應(yīng)及時(shí)向上級領(lǐng)導(dǎo)部門匯報(bào),協(xié)調(diào)溝通,盡快聯(lián)系技術(shù)工程師或廠家技術(shù)支持趕赴現(xiàn)場援助處理。
第六章 服務(wù)管理制度規(guī)范第一條 服務(wù)時(shí)間
1) 在 5*8 小時(shí)工作時(shí)間內(nèi)設(shè)置由專人值守的熱線電話,
接聽內(nèi)部服務(wù)請 求,并記錄服務(wù)臺事件處理結(jié)果。2) 在非工作時(shí)間設(shè)置有專人 7*24 小時(shí)接聽的移動電話熱線,用于解決內(nèi)部的技術(shù)問題以及接聽 7*24 小時(shí)機(jī)房監(jiān)控人員的機(jī)房突發(fā)情況匯報(bào)。3) 服務(wù)響應(yīng)時(shí)間:
|
故障級別
|
響應(yīng)時(shí)間
|
故障解決時(shí)間
|
|
I 級:屬于緊急問題;其具體現(xiàn)象為:系統(tǒng)崩潰導(dǎo)致業(yè)務(wù)停止、數(shù)據(jù)丟失。
|
10 分鐘,30 分鐘內(nèi)提交故障處理方案
|
3 小時(shí)以內(nèi)
|
|
II級:屬于嚴(yán)重問題;其具體現(xiàn)象為:出現(xiàn)部分部件失效、 系統(tǒng)性能下降但能 正常運(yùn)行,不影響正常業(yè)務(wù)運(yùn)作。
|
10 分鐘,30 分鐘內(nèi)提交故障處理方案
|
6 小時(shí)以內(nèi)
|
|
III 級:屬于較嚴(yán)重問題;其具體現(xiàn)象為:
|
10 分鐘,30 分鐘
|
|
|
出現(xiàn)系統(tǒng)報(bào)錯或警告,
?但業(yè)務(wù)系統(tǒng)能繼
|
內(nèi)提交故障處理
|
12 小時(shí)以內(nèi)
|
|
續(xù)運(yùn)行且性能不受影響。
|
方案
|
|
|
IV 級:屬于普通問題;其具體現(xiàn)象為:
|
10 分鐘,2 小時(shí)
|
|
|
系統(tǒng)技術(shù)功能、 安裝或配置咨詢,或其
|
內(nèi)提交故障處理
|
24 小時(shí)以內(nèi)
|
|
他顯然不影響業(yè)務(wù)的預(yù)約服務(wù)。
|
方案
|
|
第二條 行為規(guī)范1) 遵守用戶的各項(xiàng)規(guī)章制度,嚴(yán)格按照用戶相應(yīng)的規(guī)章制度辦事。2)與用戶運(yùn)行維護(hù)體系其他部門和環(huán)節(jié)協(xié)同工作,密切配合,共同開展技術(shù)支持工作。3)出現(xiàn)疑難技術(shù)、業(yè)務(wù)問題和重大緊急情況時(shí),及時(shí)向負(fù)責(zé)人報(bào)告。4)現(xiàn)場技術(shù)支持時(shí)要精神飽滿,穿著得體,談吐文明,舉止莊重。接聽電話時(shí)要文明禮貌,語言清晰明了,語氣和善。5)遵守保密原則。對被支持單位的網(wǎng)絡(luò)、主機(jī)、系統(tǒng)軟件、應(yīng)用軟件等的密碼、核心參數(shù)、業(yè)務(wù)數(shù)據(jù)等負(fù)有保密責(zé)任,不得隨意復(fù)制和傳播。
(部分內(nèi)容來源網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系刪除)