目前,國家正在大力推動傳統企業的改造與升級,企業運營的自動化也成為重要的升級目標。中培偉業《IT治理與審計最佳實踐》培訓專家王教授認為,自動化運維對企業實現卓越運營有著重要的推動力,而互聯網則在這其中發揮著不可替代的作用。
一、企業為何要實施自動化?
隨著,企業業務的迅速發展、不斷創新及虛擬化、大數據與云等新興IT技術的應用,各企業的IT管理者都正在面臨一個重要挑戰-如何在滿足各項合規要求下,迅速的為客戶交付真正的價值。例如,部署效率是否滿足業務產品上線頻率,因員工的誤操作影響業務的可用性,IT運維團隊一天中大量的工作時間在處理一樣的事件或完成一樣的任務等。
企業可通過實施自動化運維降低運維工作占用的大量人力資源,提升效率;減少因運維過程中因依賴人工操作造成的人工操作失誤,保障系統安全穩定。
二、企業目前實施自動化運維面臨的問題。
企業實施自動化運維通常希望事情能變的更簡單,效率能有所提高,例如執行調度、自動運行的腳本、部署、云資源管理平臺等自動化運維任務,目標是使這些任務能有效運行,并減少人為干預。但事實上,自動化運維帶來的效果往往并不明顯,甚至使運維更加混亂。主要的問題如下:
1. 大部分企業實施自動化運維更多的是從“流行技術”的角度考慮,未從減少運營成本,增加效率的角度對需要自動化運維的工作進行評估,使自動化運維的投入與產出不成正比。
2. 目前,大部分企業運維部門的各個組,例如服務器組、網絡組、數據庫組的管理員已經編寫了一些腳本去自動執行一些常規的IT運維工作,例如配置文件的自動備份、數據庫的日志檢查等工作。這種孤島式的工具的蔓延將會導致自動化運維工具功能上的重復使用及運維人員的誤用。
3. 由于缺少對自動化工具或產品的統一管理,包括評估、測試、部署、變更等控制環節,為業務帶來了額外的風險。
三、企業實施自動化運維的五個步驟。
1. 按照運維組(例如,服務器組、網絡組、存儲組、數據庫組、應用組等)梳理可以自動化運維的工作及已經實現自動化運維的工具。
2. 識別需要自動化運維工作的工作量、難易程度、工具所運行的環境等內容,并對工具進行評估。
3. 確認需要自動化運維的工作,進行測試、部署并最終納入CMDB及變更管理控制。
4. 將自動化運維的任務與IT流程集成,例如監控管理、事件管理、變更管理和發布管理,提高服務的效率及質量。
5. 將自動化運維的任務及IT流程與IT服務進行關聯,整體展現對業務帶來的價值。
四、某大行自動化運維的案例分享
某大型商業銀行近年來構建了自動化運維體系,此運維體系一方面可以實現對系統、網絡、存儲等基礎設施環境資源實時監測與故障快速定位,也可以對應用容量、交易量、成功率等進行在線監控與預警。截至2014年10月底,該行數據中心全年事件總數2165個,自動發現2034個,占事件數量94%,為應急事件的及時處置提供了技術保障。
另一方面,此運維體系還實現了應用一鍵式部署,可推進故障自動恢復。該行將自主研發的云平臺應用于生產,實現了基礎設施云服務的自動化供給、系統“一鍵式”啟停、“一鍵式”應用安裝部署、自動化變更等功能,人均維護設備數量從幾十二臺提升到幾百臺,極大地提高了工作效率,這既減輕了人員負擔,更降低了操作風險。