在IT運維中,服務水平目標(SLO)是強大的決策工具,遠遠超出了團隊工作面,同時在那里提供價值。SLOs as Code in Reliably——面向開發人員的可靠性自動化平臺,提供可執行的、可版本化的工件,幫助您在系統演進的任何時候捕獲、構建、協作和啟用必要的可靠性對話。SLO 告訴我們我們關心什么以及對系統用戶來說什么是好的。出于這個原因,SLO 可以成為超越團隊采煤工作面的令人難以置信的決策工具,今天我們就來解釋一下在IT運維中如何在不停機的情況下擴展 AWS EBS 卷。
服務水平指標 (SLI) 告訴您可以衡量什么?
首先,SLO 是 很好的 對話啟動器。甚至在編寫一行代碼之前,就可以討論未來系統的各個方面應該如何表現才能為系統的未來用戶提供正確的可靠性體驗。
許多系統在早期實施中就死了,因為可靠性是事后的想法。盡管如此,通過盡早將 SLO 對話放在首位,每個人都有機會進行協作。更重要的是,SLO 有助于了解用戶會關心什么以及系統需要多可靠。
這并不意味著SLO僅為新的,未開發的系統啟用有價值的對話。SLO幾乎可以在任何系統上鼓勵相同的對話,無論是未開發的系統還是有點泥濘的“繼承”系統,因為某些原因,我們有時會忽略傳統系統。
SLO 可以鼓勵所有相關人員問:“我們關心什么?”、“我們需要的正確可靠性級別是多少?”、“對我們的用戶來說,可靠是什么樣的?” 甚至,“我們如何平衡成本和可靠性?”。
無論這些 SLO 對話何時發生,它們都可以通過將可靠性提升到架構和設計過程中的頂層來增加巨大的價值。
Reliably 的 SLO 代碼工件捕獲、構建并支持這些對話。使用 SLO 工件,您可以開發和改進您的 SLO,甚至在您有任何方法使用服務水平指標 (SLI) 來衡量這些 SLO 之前:
window: PT1H在上面的代碼片段中,我們描述了簡單網站服務的三個 SLO。
注意:您可以使用 Reliably SLO init 命令創建自己的 SLO 定義。更多信息可在 Reliably 文檔中獲得。
釋放SLO并將SLO視為代碼
SLO 經常在市場上的監控和可觀察性工具中定義和捕獲。這沒有錯。這通常意味著 SLO 對所有參與的不同合作者來說并不像他們可能看到的那樣可見,尤其是在可能有不同監控和可觀察性系統在起作用的組織中。
SLO 受到生命周期的影響也很常見,其中包括版本控制、在開放協作時發布。聽起來有點熟?確實如此!這是我們通常使用代碼的確切要求集,因此這也是 Reliably 將 SLO 編碼為代碼工件的另一個原因,這些工件可以使用相同(或類似)的流程進行創建、管理、版本控制和協作。用于處理其他系統關鍵工件。
可執行 SLO 作為代碼
隨著時間的流逝,您可以使用服務水平指示器(SLI)來豐富您的SLO,如代碼片段所示:
SLI 是在給定窗口內收集的測量值,為您提供“好”和“壞”事件,這些事件匯總到 SLO 是否仍在滿足、接近未完成的危險趨勢或已被破壞的整體計算中完全地。
使用 Reliably 編碼并最終包括一些 SLI 的 SLO 可以在任何時間由具有權限的任何人使用 SLO 報告命令進行報告:
$ reliably slo report
你甚至可以 觀看 與使用--watch開關實時更新您的SLO來:
$ reliably slo report --watch
上述就是關于IT運維中如何在不停機的情況下擴展 AWS EBS 卷的全部內容,想了解更多關于IT運維的信息,請繼續關注中培偉業。