3.4 コンポーネント失敗の検出および自律的な自己修復

コンポーネント失敗を検出し、自律的に自己修復する能力が向上したことで、ビジネス継続性が改善されます。

クラスタ状態モニターは、保留中の障害または実際の障害を示す重要なコンポーネント・イベントを識別する新しい診断機能を導入し、修正アクションの推奨事項を提供します。これらのアクションは、自律的に実行される場合があります。このようなイベントおよびアクションは取得され、管理者はOracle Trace File Analyzerなどのコンポーネントを介して通知されます。

診断に関連する用語

CHMDiag: CHMDiagは、osysmondによって管理されるpythonデーモンで、イベントをリスニングし、アクションを実行します。CHMDiagは、様々なイベントまたはアクションを受信すると、これらのアクションが正しいかどうかを検証し、フロー制御を行って、アクションを実行するようにスケジュールします。CHMDiagは、各アクションをその完了まで監視し、そのアクションに固有の事前構成時間よりも時間がかかる場合にアクションを終了します。

このJSONファイルは、すべてのイベントまたはアクションと、それぞれの属性を記述します。すべてのイベントまたはアクションには、一意に識別可能なIDがあります。このファイルには、様々なアクションまたはイベントに対して様々な構成可能なプロパティも含まれます。CHMDiagは、起動時にこのファイルをロードします。

CRFE API: CRFE APIは、すべてのCクライアントでCHMDiagにイベントを送信するために使用されます。このAPIは、コンポーネント(RDBMS、CSS、GIPC)などの内部クライアントでイベントまたはアクションを公開するために使用されます。

また、このAPIはイベントの同期公開と非同期公開の両方のサポートを提供します。イベントの非同期公開は、バックグラウンド・スレッドを介して行われます。バックグラウンド・スレッドは、プロセス内のすべてのCRFE APIクライアントで共有されます。

CHMDIAG_BASE: このディレクトリはORACLEB_BASE/hostname/crf/chmdiagにあります。このディレクトリ・パスには、CHMDiagによって移入または管理される次のディレクトリが含まれます。

  • ActionsResults: 各アクションのサブディレクトリを含む、起動されたすべてのアクションのすべての結果が含まれます。
  • EventsLog: CHMDiagによって受信されたすべてのイベントまたはアクションのログと、それぞれのアクション結果の場所が含まれます。これらのログ・ファイルは、固定サイズに達した後も自動ローテーションされます。
  • CHMDiagLog: CHMDiagデーモン・ログが含まれます。ログ・ファイルは、自動ローテーションされ、特定のサイズに達すると実行されます。ログには、CHMDiagを実行できる問題を診断するための十分なデバッグ情報が必要です。
  • Config: CHMDiagプロセスのpidファイル管理の実行サブディレクトリが含まれます。
様々なコンポーネントによって送信されたCHMDiagイベントまたはアクションを問い合せ、収集および説明するための新しいコマンドは、次のとおりです。
  • oclumon chmdiag description: oclumon chmdiag descriptionコマンドを使用して、サポートされているすべてのイベントおよびアクションの詳細な説明を取得します。
  • oclumon chmdiag query: oclumon chmdiag queryコマンドを使用して、様々なコンポーネントによって送信されたCHMDiagイベントまたはアクションを問い合せ、HTMLまたはテキスト・レポートを生成します。
  • oclumon chmdiag collect: oclumon chmdiag collectコマンドを使用して、CHMDiagによって生成されたすべてのイベントまたはアクションのデータを、指定した出力ディレクトリの場所に収集します。