インシデント管理

Enterprise Manager環境は、(インシデントが単一のイベントで構成されていたとしても)個々のイベントではなくインシデントを介してモニターおよび管理します。管理対象環境で生成されるすべてのイベントの中には、ビジネス・アプリケーションに影響を与えるため、対処を必要とするイベントのサブセットが存在します(ターゲットの停止イベントなど)。しかし、インシデントによる管理では、関心のあるイベントのサブセットが関連している、個別のイベントとしてではなく1つの問題として対応する必要のあるより高いレベルの問題を示す可能性のある、より複雑な状況に対応できます。イベントの1つのクラスタはそれ自身では小さな管理上の問題であっても、一緒に見てみると、モニター・インフラストラクチャの複数のドメイン/レイヤーからイベントを構成する可能性のある、より大きい問題を表している可能性があります。

たとえば、ホストをモニタリング中とします。1つ以上のホストの負荷をモニターする場合、興味を引かれるイベントとしては、許容可能なメトリックしきい値を超過しているCPU使用率、メモリー使用率、スワップ使用量などのイベントなどがあります。個別では、これらのイベントはホストの問題を示している場合もそうでない場合もありますが、全体として、これらのイベントはモニター対象のホストの負荷が非常に高くなっていることを示すインシデントを形成します。

インシデントは、個別のイベントではなく、ビジネスに影響を与える可能性のあるより大きなサービスの中断を表します。そのためインシデントによる管理では、ビジネスに影響を与える可能性のある、複数のドメインに関連する可能性のある複雑な操作の問題をモニターできます。これらのインシデントは、通常、追跡され、適切な人員が割り当てられ、できるだけ早く解決する必要があります。モニタリング情報を統合し、エコシステム間でリソースをより効果的に割り当てる集中管理モニタリングを効果的に実装して、問題を解決または問題の発生を防ぐことができます。最終的な成果は、ITリソースのより高いパフォーマンスを導く、ビジネス・プロセスをより適切に実装することです。

イベントが管理対象の環境で対応が必要な問題を示している間は、関連するイベントをまとめたサブセットを1つの作業単位として処理する方が効率的です。同じ問題を表している異なるイベントを処理したり、複数の領域関連のイベントを含む1つのインシデントを処理したりできます。たとえば、実行中に領域が少なくなっていることを示す複数のスペース・イベントを様々なターゲットから受け取ります。多数の個別のイベントを管理するかわりに、より小さいインシデントのセットをより効果的に管理できます。

インシデントは、潜在的にビジネス・アプリケーションに影響を与える可能性があり、その管理を必要とする重要なイベントまたは関連する重要なイベントのセットです。これらのインシデントは、通常、追跡され、適切な人員が割り当てられ、できるだけ早く解決する必要があります。これらのインシデント管理操作を、Enterprise Manager内の直感的なUIであるインシデント・マネージャを使用して実行します。

インシデント・マネージャは、インシデントを表示、管理、診断および解決し、混乱の根本原因を識別、解決および排除する中枢となる場所を提供します。このUIの詳細は、「インシデント・マネージャ」を参照してください。