隨著信息時(shí)代的不斷發(fā)展,IT運(yùn)維已成為IT服務(wù)內(nèi)涵的重要組成部分。運(yùn)維已從最初的幾臺(tái)服務(wù)器發(fā)展成為一個(gè)龐大的數(shù)據(jù)中心。單靠人工已不能再滿足技術(shù),業(yè)務(wù),管理等方面的要求,因此標(biāo)準(zhǔn)化,自動(dòng)化,體系結(jié)構(gòu)優(yōu)化,流程優(yōu)化和其他降低IT服務(wù)成本的因素引起了人們?cè)絹?lái)越多的關(guān)注。其中,對(duì)自動(dòng)化運(yùn)維進(jìn)行了廣泛的研究,并將其作為替代手動(dòng)操作的起點(diǎn)。那么有哪些常用的自動(dòng)化運(yùn)維工具?
有哪些常用的自動(dòng)化運(yùn)維工具?
1、監(jiān)控
2、網(wǎng)絡(luò)設(shè)備存活監(jiān)控
對(duì)于SRE來(lái)說(shuō),需要監(jiān)控程序是否正常;對(duì)于主機(jī)組來(lái)說(shuō),需要監(jiān)控服務(wù)器硬件是否正常;對(duì)于網(wǎng)絡(luò)來(lái)說(shuō),我們首先需要關(guān)心網(wǎng)絡(luò)設(shè)備是否可達(dá)。當(dāng)一臺(tái)TOR不可達(dá)時(shí),基本上預(yù)示著會(huì)有一片服務(wù)器不可達(dá),業(yè)務(wù)的痛感是相當(dāng)強(qiáng)烈的。
3、設(shè)備日志監(jiān)控
設(shè)備存活告警雖然可以預(yù)警很多異常,并且準(zhǔn)確度很高,但是對(duì)于冗余性做得比較好的網(wǎng)絡(luò),能Ping通并不代表完全沒(méi)問(wèn)題,此時(shí),細(xì)心的網(wǎng)絡(luò)工程師會(huì)去看日志,這里可以反映出更多細(xì)節(jié)。對(duì)于萬(wàn)臺(tái)服務(wù)器規(guī)模,網(wǎng)絡(luò)設(shè)備的數(shù)量也就千臺(tái),但是逐臺(tái)查看日志,人肉判斷是否有異常,那簡(jiǎn)直是場(chǎng)噩夢(mèng)。
4、流量監(jiān)控
高速公路鋪得再好,也架不住車多人多。確保網(wǎng)絡(luò)順暢,品質(zhì)優(yōu)良,沒(méi)有丟包,延時(shí)穩(wěn)定也是網(wǎng)絡(luò)工程師的職責(zé) ,此時(shí)流量監(jiān)控就成了剛需。
業(yè)務(wù)的飛速發(fā)展體現(xiàn)在網(wǎng)絡(luò)層面就是DC內(nèi)流量上漲/DCI流量上漲/IDC出口流量上漲/專線流量上漲,流量監(jiān)控可以準(zhǔn)確掌握業(yè)務(wù)的高峰和低谷,當(dāng)線路需要擴(kuò)容時(shí),帶寬使用率是老板參考的重要數(shù)據(jù)。一般情況下線路中的流量超過(guò)50%即可發(fā)起擴(kuò)容,因?yàn)檫@意味著當(dāng)備份鏈路down之后,主線路將出現(xiàn)擁塞。
5、接口error監(jiān)控
接口的Error包監(jiān)控和流量監(jiān)控一樣,均可以通過(guò)snmp采集,OID:ifOutErrors,ifInErrors , Error包出現(xiàn)增量會(huì)直接影響業(yè)務(wù)的服務(wù)質(zhì)量,一旦發(fā)現(xiàn)需要優(yōu)先處理,否則業(yè)務(wù)會(huì)拎著一堆TcpTimeOut指標(biāo)找上門來(lái)。
6、制造自動(dòng)化運(yùn)維工具
第一章中的組合拳打完之后,基本上不會(huì)出現(xiàn)“意料之外的故障”,所有的異常都應(yīng)該有據(jù)可查,當(dāng)SRE莫名其妙提出對(duì)網(wǎng)絡(luò)環(huán)境的質(zhì)疑時(shí),你應(yīng)該早已心中有譜。
但是網(wǎng)絡(luò)工程師的工作并非只有救火,日常運(yùn)維工作中,經(jīng)常需要配合業(yè)務(wù)發(fā)展做一些線上變更/ 機(jī)房擴(kuò)建/業(yè)務(wù)類故障排查等。作為一名“懶惰”的網(wǎng)絡(luò)工程師,程序可以幫忙點(diǎn)什么忙呢?
7、UserDevice Tracker
這個(gè)名詞借用于Solarwinds套裝中的一個(gè)組件,直譯為“用戶設(shè)備追蹤器” , 在中小型企業(yè)網(wǎng)運(yùn)維中,經(jīng)常會(huì)有這樣的需求:
· 知道服務(wù)器的IP,請(qǐng)問(wèn)連接在交換機(jī)的哪個(gè)口?
· 知道交換機(jī)的某個(gè)端口,請(qǐng)問(wèn)連接的服務(wù)器的IP是多少?
· 給你一臺(tái)服務(wù)器的MAC地址,怎么知道在哪個(gè)交換機(jī)的哪個(gè)口?
大型互聯(lián)網(wǎng)公司一般會(huì)有CMDB或者網(wǎng)絡(luò)管理平臺(tái)來(lái)記錄這些信息, 但是如果你是一家中小型企業(yè)的網(wǎng)管,沒(méi)有運(yùn)維研發(fā)團(tuán)隊(duì)做支持,并且還在沿用二層的環(huán)境(服務(wù)器網(wǎng)關(guān)在核心設(shè)備),那就比較費(fèi)勁了。以上幾個(gè)問(wèn)題其實(shí)歸根到底是要捋清楚三個(gè)要素的對(duì)應(yīng)關(guān)系:PORT<>MAC<>IP 。
8、網(wǎng)絡(luò)設(shè)備北向接口的二次封裝
日常網(wǎng)絡(luò)運(yùn)維工作中,經(jīng)常會(huì)有一些 “簡(jiǎn)單重復(fù)勞動(dòng)”,例如:為某個(gè)接口劃分Vlan/給某臺(tái)設(shè)備添加一條指向主機(jī)的路由等, 這些操作既沒(méi)有科技含量,還占用了工程師寶貴的時(shí)間,更要命的是再簡(jiǎn)單的人肉操作,重復(fù)的次數(shù)只要足夠多,總有失誤的時(shí)候,正所謂“常在河邊走,哪有不濕鞋”,但是在這種問(wèn)題上犯錯(cuò)誤簡(jiǎn)直是對(duì)職業(yè)生涯的抹黑,如此“雞肋”的工作怎么才能干得漂亮?
上述就是關(guān)于有哪些常用的自動(dòng)化運(yùn)維工具的全部?jī)?nèi)容介紹,想了解更多關(guān)于自動(dòng)化運(yùn)維的信息,請(qǐng)繼續(xù)關(guān)注中培偉業(yè)。