事故管理 (信息技術服務管理)

維基百科,自由的百科全書

事故管理(Incident management,簡寫為IM),也作意外事件管理[1],是信息技術服務管理處理步驟的一個環節。事故管理的目的是令系統儘快地恢復到正常服務營運水平,且儘可能地減小事故對商業運作的影響,以此來保證達到服務質量的最高水平。

事故管理實例

一個典型的例子是,假設伺服器在運行的過程中出現故障並崩潰。如果說此故障發生在工作時間且造成一定後果,那麼此事件則被當做是一個「事故」(Incident)。反之,如果此伺服器僅在工作時間使用,而伺服器故障發生在工作之間之外,那麼根據信息技術基礎架構庫(ITIL)的定義,鑑於沒有任何服務受到影響,這不再被當做是一個「事故」。[2]

參考資料