イベント、インシデントおよび問題の管理

Enterprise Managerのモニタリング機能は、例外によるモニタリングの教訓に基づき構築されています。つまり、例外状況がIT環境に存在するとイベントが発生し、モニターして、管理者は適時に対応できます。前述のとおり、モニターに最もよく使用される2つのイベント・タイプは「メトリック・アラート」と「ターゲット可用性」です。これらはEnterprise Managerがモニターする最も一般的なイベント・タイプですが、他にも多数あります。使用可能なイベント・タイプは次のとおりです。

  • ターゲット可用性

  • メトリック・アラート

  • メトリック評価エラー

  • ジョブ・ステータスの変更

  • コンプライアンス標準ルール違反

  • コンプライアンス標準スコア違反

  • 高可用性

  • サービス・レベル合意のアラート

  • ユーザー報告

  • JVM診断しきい値違反

定義によると、インシデントは、管理環境内で管理者の注意を必要とする問題を識別する、単一または密接に関連付けられたイベントのセットを含む1つの単位です。そのため、インシデントは、表領域内の使用可能領域が指定した制限を下回ったことを示す単一のイベントと同じくらい単純な場合もあれば、リソース不足でサーバーが実行しているときの潜在的なパフォーマンスの問題に関連する複数のイベントを含む1つのインシデントのようにもっと複雑な場合もあります。このようなイベントは、CPU、I/Oおよびメモリー・リソースに関連するイベントを含みます。インシデントによる管理では、いくつもの原因となる要素からなる可能性のある問題に対応できます。インシデントおよびイベントに関する詳細な説明は、「インシデント管理の使用」を参照してください。

インシデントは1つのイベントに対応する場合もありますが、より一般的には、関連するイベントのグループに対応します。多数のイベントはすぐに管理しにくくなりますが、関連イベントの集合として処理されるインシデントにより、多数のイベント発生をより効果的に管理できます。

インシデントが作成されると、Enterprise Managerの豊富なインシデント管理ワークフロー機能群が使用できるようになり、インシデントをライフサイクル全体を通して管理および追跡できます。インシデント管理機能には次のものが含まれます。

  • インシデント所有権の割当て。

  • インシデント解決ステータスの追跡。

  • インシデント優先度の設定。

  • インシデントのエスカレーション・レベルの設定。

  • 手動での要約を提供する機能。

  • ユーザー・コメントを追加する機能。

  • 抑止および抑止解除する機能。

  • 手動でインシデントをクリアする機能。

  • 手動でチケットを作成する機能。

問題は、自動診断リポジトリ(ADR)に格納される診断インシデントおよび問題に関係し、そのような問題は、ソフトウェアにクリティカルなエラーが発生したときにOracleソフトウェアにより自動的に生成されます。Oracleソフトウェアに問題が発生した場合、オラクル社の推奨する問題解決の手続きは、サービス・リクエスト(SR)をオープンしてサポートに診断ログを送信してもらい、最終的にオラクル社からソリューションを提供することです。問題は、インシデントの基礎となる根本原因を表します。Enterprise Managerには、問題のライフサイクルを追跡し管理する機能が用意されています。