3 OMSおよびリポジトリ

OMSとリポジトリ、Oracle Management Service、OMSコンソールおよびOMSプラットフォーム・ターゲットは、Oracle Enterprise Manager Management Service(OMS)およびManagement Repositoryの監視に便利なメトリックを提供します。

3.1 アクティブ・エージェント

このメトリック・カテゴリには、アクティブ・エージェントに関する情報が含まれます。

3.1.1 アクティブなエージェントの数

リポジトリ内のアクティブなエージェントの数。この数が0の場合、Enterprise Managerではどの外部ターゲットも監視していません。予期しない状況である場合は、問題が発生している可能性があります。

データ・ソース

mgmt_current_availability表でステータスが稼働中となっているエージェントの数。

ユーザーの処理

エージェントが1つも実行されていない場合、エージェントが停止した原因を特定し、必要に応じて修正した後に再起動します。エージェントの停止原因に関連する可能性のある情報は、エージェントの$ORACLE_HOME/sysman/logディレクトリ内のログ・ファイルに含まれます。

3.2 アクティブ・ローダーのステータス

このカテゴリは、スループットや過去1時間に処理された行数など、ローダーの使用状況とパフォーマンスに関する情報を提供します。

3.2.1 過去1時間に処理された行数

これは、処理された行数です。

データ・ソース

管理リポジトリ内のmgmt_system_performance_log表。

ユーザーの処理

この数値が長期にわたって増加し続けている場合は、ユーザーは管理サービスを追加するか、この管理サービスに対するローダー・スレッド数を増やすことを検討します。ローダー・スレッド数を増やすには、emoms.propertiesファイルのem.loader.threadPoolSizeエントリを追加または変更します。スレッド数のデフォルトは2です。2から10の間の値が一般的です。

3.2.2 最近1時間での合計ローダー・ランタイム(秒)

このメトリックは、最近1時間のローダー・スレッドの実行時間を秒単位で表します。

データ・ソース

管理リポジトリ内のmgmt_system_performance_log表。

ユーザーの処理

この数値が「ローダー・スループット(行/時間)」メトリックとともに継続して増加している場合、「ローダー・スループット(行/時間)」メトリックに関するヘルプ項目の「ユーザー処理」に示されている処理を実行します。この数値は増加しているがローダー・スループットは増加していない場合は、プロセスによる高いCPU使用率、管理リポジトリ・データベースでのデッドロック、プロセッサ・メモリーの問題など、リソースの制約を調べます。

3.3 アクティブな管理サーブレット

このメトリック・カテゴリには、アクティブな管理サーブレットのカテゴリに関する情報が含まれます。

3.3.1 処理された通知

最後の10分間に管理サービスによって配信された通知の合計数。メトリックは10分間隔で収集され、アラートは生成されません。

データ・ソース

管理リポジトリ内のmgmt_system_performance_log表。

ユーザーの処理

処理された通知の数が数日間増加し続けている場合は、管理サービスを追加することを検討します。

3.3.2 ページ・ヒット(/分)

これは、1分当たりのEMコンソール・アクセスの平均数を示します。メトリックは10分間隔で収集され、アラートは生成されません。

データ・ソース

このメトリックは、管理リポジトリでmgmt_oms_parameters表の次の問合せを使用して取得します。

SELECT value FROM mgmt_oms_parameters 
where name='loaderOldestFile'

ユーザーの処理

なし。

3.4 エージェント・ステータス

このメトリック・カテゴリには、エージェント・ステータスに関する情報が含まれます。

3.4.1 エージェントの再起動数

エージェントが過去24時間以内に再起動された回数。

データ・ソース

次のように導出されます。

(SELECT t.target_name, COUNT(*) down_count
  FROM mgmt_availability a, mgmt_targets t
  WHERE a.start_collection_timestamp = a.end_collection_timestamp
    AND a.target_guid = t.target_guid
    AND t.target_type = MGMT_GLOBAL.G_AGENT_TARGET_TYPE
    AND a.start_collection_timestamp > SYSDATE-1
  GROUP BY t.target_name)

ユーザーの処理

この回数が多い場合、エージェント・ログを調べて、再起動を引き起こすシステム状態が存在しているかどうかを確認します。エージェントが再起動を繰り返す場合、再起動問題が発生しているエージェントのターゲットに「データをアップロードしないターゲット」メトリックも設定できます。再起動問題は、システムのリソース制約や構成上の問題に原因がある可能性があります。

3.5 構成

このメトリック・カテゴリには、構成に関する情報が含まれます。

3.5.1 管理者数

Enterprise Managerに対して定義されている管理者の数。

データ・ソース

管理リポジトリ内のmgmt_created_users表。

3.5.2 グループ数

Enterprise Managerに対して定義されているグループの数。

データ・ソース

管理リポジトリ内のmgmt_targets表。

ユーザーの処理

「すべてのターゲット」ページの表示に問題がある場合は、ロール数およびグループ数を確認します。

3.5.3 ロール数

Enterprise Managerに対して定義されているロールの数。

データ・ソース

管理リポジトリ内のmgmt_roles表。

ユーザーの処理

「すべてのターゲット」ページの表示に問題がある場合は、ロール数およびグループ数を確認します。

3.5.4 ターゲット数

Enterprise Managerに対して定義されているターゲットの数。

データ・ソース

管理リポジトリ内のmgmt_targets表。

ユーザーの処理

このメトリックは情報を表示するのみです。

3.5.5 使用リポジトリ表領域

これは、現在管理リポジトリ表領域が使用している合計MB数です。

データ・ソース

管理リポジトリ内のdba_data_files表。

ユーザーの処理

このメトリックは情報を表示するのみです。

3.5.6 ターゲットの追加率(過去1時間)

ターゲットが作成される割合。通常、ターゲットの追加率は、EMがインストールされた直後に最大となり、新規エージェントが追加されるたびに一時的に増加します。この割合が不自然に増加している場合、異常なエージェントまたは管理者アクティビティが存在しないかどうかを調べ、ターゲットが適切に稼働していることを確認します。また、不要なグループが作成されていないかどうかを調べます。

データ・ソース

このメトリックは、mgmt_target表の現在のターゲット数(最新のサンプリングで取得されたターゲット数)から導出されます。

ユーザーの処理

このメトリックは情報を表示するのみです。

3.5.7 リポジトリ表領域の合計

管理リポジトリ表領域に割り当てられた合計MB。必ず使用済の領域以上になります。

データ・ソース

管理リポジトリ内のdba_free_space表。

ユーザーの処理

このメトリックは情報を表示するのみです。

3.5.8 ユーザーの追加率(過去1時間)

ユーザーが作成される割合。ターゲットの追加率は低く抑える必要があります。この割合が不自然に増加している場合、異常な管理者アクティビティが存在しないかどうかを調べます。

データ・ソース

このメトリックは、mgmt_created_users表の現在のユーザー数(最新のサンプリングで取得されたユーザー数)から導出されます。

ユーザーの処理

このメトリックは情報を表示するのみです。

3.6 DBMSジョブ・ステータス

このメトリック・カテゴリには、DBMSジョブ・ステータスに関する情報が含まれます。

3.6.1 DBMSジョブ無効スケジュール

このメトリックは、スケジュールが無効なDBMSジョブにフラグを立てます。1時間より前または1年より後にスケジュールされると、スケジュールは無効とマークされます。スケジュールが無効な場合、そのジョブは深刻な状況になります。

データ・ソース

管理リポジトリ内のuser_schedule_jobs表。

ユーザーの処理

なし。

3.6.2 DBMSジョブ処理時間(最近1時間の割合)

最近1時間にジョブが実行中だった割合です。

データ・ソース

管理リポジトリ内のmgmt_system_performance_log表。

ユーザーの処理

このメトリックの値が50%より大きい場合は、ジョブに問題がある可能性があります。「システム・エラー」ページで、ジョブによってエラーがレポートされていないかを調べます。アラート・ログで、ジョブ関連のアラートを調べます。

3.6.3 DBMSジョブの稼働/停止

停止状態は、dbms_jobの中断状態と同じです。上矢印の場合は、中断していません。

データ・ソース

「中断」列は、管理リポジトリ内のall_users表から取得されます。

ユーザーの処理

DBMSジョブの失敗の原因を特定します。失敗の原因を特定し、修正したら、dbms_job.runコマンドを使用して、ジョブを再起動します。

DBMSジョブの失敗の原因を特定するには、次の手順を実行します(myjobを表示された停止ジョブの名前に置き換えます)。

表内の行から停止中のDBMSジョブ名をコピーします。次の例では、停止中のDBMSジョブ名はyourDBMSjobnameです。
リポジトリ所有者としてデータベースにログインします。

次のSQL文を発行します。

select dbms_jobname 
  from mgmt_performance_names 
  where display_name='yourDBMSjobname';

dbms_jobnameがmyjobの場合、次のSQL文を発行します。
```
select job
  from all_jobs
  where what='myjob';
```
戻されたジョブIDを使用して、アラート・ログおよびトレース・ファイルでこのジョブIDに対するORA-12012メッセージを探し、問題の特定および修正を試みます。

次のデータベース・コマンドを使用すると、ジョブを手動で再起動できます。

execute dbms_job.run (jobid);

3.6.4 DBMSジョブ・スループット/秒

配信された1秒当たりの通知数(最近1時間の平均)。

データ・ソース

管理リポジトリ内のmgmt_system_performance_log表。

ユーザーの処理

このメトリックは情報を表示するのみです。

3.7 イベント・ステータス

このメトリック・カテゴリは、イベント・システムの状態を追跡するリポジトリ・メトリックに関する情報を提供します。

注意:

イベント・システムは、イベントを処理するためにデータベース・キュー表(em_event_bus_table)内にキューを維持し、その対応するデータベース・ビューはaq$em_event_bus_tableです。

3.7.1 平均イベント・デキュー時間(ミリ秒)

このメトリックは、イベント・キューからメッセージをデキューするために費やした時間の平均を表します。

データ・ソース

このメトリックのデータは、mgmt_system_performance_log where name= 'DequeueTime'のエントリから取得されます。

ユーザーの処理

平均イベント・デキュー時間が1時間を超える期間で定常的に大きい場合、その値はデータベース・キュー表(em_event_bus_table)のメンテナンスが必要であることを示している可能性があります。

3.7.2 平均イベント処理時間(秒)

このメトリックは、インシデント・ルールをイベント、インシデントまたは問題に適用するために費やした時間の平均を表します。

データ・ソース

このメトリックのデータは、mgmt_system_performance_log where name= 'ProcessingTime'のエントリから取得されます。

ユーザーの処理

平均イベント処理時間が、1時間を超える期間で継続して増加している場合は、必要ないまたは最新ではないインシデント・ルールを削除します。管理リポジトリ・データベースに存在するすべての操作の問題を修正します。管理サービスを追加して、イベント・システムの能力を増強する必要があります。

3.7.3 イベント・キュー問合せ時間(秒)

このメトリックは、イベント・バス(aq$em_event_bus_table)を問い合せるために費やした時間の平均を表します。

データ・ソース

このメトリックのデータは、mgmt_system_performance_log where name= 'QueryTime'のエントリから取得されます。

ユーザーの処理

平均イベント・キュー問合せ時間が1時間を超える期間で定常的に大きい場合、その値はデータベース・キュー表(em_event_bus_table)のメンテナンスが必要であることを示している可能性があります。

3.7.4 平均イベント・キュー待機時間(秒)

このメトリックは、イベント、インシデントまたは問題が、インシデント・ルールを適用するためにキューから取り出されるまでイベント・キューで待機した時間の平均を表します。

データ・ソース

このメトリックのデータは、mgmt_system_performance_log where name= 'Latency'のエントリから取得されます

ユーザーの処理

平均待機時間が、継続して増加している場合は、必要ないまたは最新ではないインシデント・ルールを削除します。管理リポジトリ・データベースに存在するすべての操作の問題を修正します。管理サービスを追加して、イベント・システムの能力を増強する必要があります。

3.7.5 イベント・システム稼働/停止

このメトリックは、イベント・システムのステータスを表します。イベント・キューに処理待ちのイベントが存在するにもかかわらず、5分を超える期間でイベントが処理されない場合、イベント・システムは停止しています。そうでない場合、イベント・システムは稼働しています。

データ・ソース

このメトリックのデータは、aq$em_event_bus_tableビューおよびem_event_bus_queues表のエントリから取得されます。

ユーザーの処理

管理サービスを再起動します。これにより、問題が解決することがあります。

3.7.6 リスナーが無効なキュー

存在しない管理サービスに割り当てられているイベント・キューがある場合、このメトリックは正の数を表します。それ以外の場合、値は0です。

データ・ソース

このメトリックのデータは、em_event_bus_queues、em_event_coordinatorsおよびmgmt_failover_tableのエントリから取得されます。

ユーザーの処理

値が30分を超える期間で継続して正である場合、Oracle Management Serviceを再起動すると、問題が解決することがあります。

3.7.7 リスナーのないキュー

管理サービスに割り当てられていないイベント・キューがある場合、このメトリックは正の値を表します。それ以外の場合、値は0です。

データ・ソース

このメトリックのデータは、em_event_bus_queues、em_event_coordinatorsおよびmgmt_failover_tableのエントリから取得されます。

ユーザーの処理

値が30分以上の期間で継続して正である場合、Oracle Management Serviceを再起動すると、問題が解決することがあります。

3.7.8 合計保留イベント

このメトリックは、イベント・キューで処理待ちとなっているイベントの数を表します。

データ・ソース

このメトリックのデータは、aq$em_event_bus_tableのエントリで、consumer_nameがADMで始まらず、msg_stateがREADYであるものから取得されます。

ユーザーの処理

値が30分以上の期間で継続して高い場合、イベントが大量に発生しており、問題は一時的である可能性があります。管理リポジトリ・データベースに存在するすべての操作の問題を修正します。Oracle Management Serviceを追加して、イベント・システムの能力を増強する必要があります。

3.7.9 処理されたイベント合計(過去1時間)

このメトリックは、イベント・キューで処理待ちとなっているイベントの現在の合計数を表します。

データ・ソース

このメトリックのデータは、aq$em_event_bus_tableのエントリで、consumer_nameがADMで始まらず、msg_stateがREADYであるものから取得されます。

ユーザーの処理

値が継続して高止まりしている場合、イベントが大量に発生した可能性があります。Oracle Management Serviceを追加して、イベント・システムの能力を増強する必要があります。

3.8 イベントのパフォーマンス

このメトリック・カテゴリは、各キュー・タイプのイベント・システムのパフォーマンスを追跡するリポジトリ・メトリックに関する情報を提供します。

キュー・タイプHは、高い優先度のキューを表します。高い優先度のキューは、ターゲットの可用性イベントを処理するために使用されます。
キュー・タイプMは、中程度の優先度のキューを表します。中程度の優先度のキューは、CRITICALまたはWARNINGなど、喚起を必要とする重大度を持つメトリック・アラートなどのイベントを処理するために使用されます。
キュー・タイプLは、低い優先度のキューを表します。低い優先度のキューは、単に情報を提供することを目的とするイベントを処理するために使用されます。

3.8.1 イベント処理時間(最近1時間の割合)

このメトリックは、特定のキュー・タイプのキューからの負荷を処理するために経過したCPU時間の割合を表します。

データ・ソース

このメトリックのデータは、mgmt_system_performance_log where name= 'ProcessingTime'のエントリから取得されます。

ユーザーの処理

3.8.2 処理されたイベント(過去1時間)

このメトリックは、特定のキュー・タイプのイベント・システム・キューで処理待ちとなっているイベントの現在の数を表します。

データ・ソース

このメトリックのデータは、mgmt_system_performance_log where name= 'ProcessingTime'のエントリから取得されます。

ユーザーの処理

3.8.3 保留イベント数

このメトリックは、特定のキュー・タイプのイベント・システム・キューで処理待ちとなっているイベントの現在の数を表します。

データ・ソース

このメトリックのデータは、aq$em_event_bus_tableのエントリで、consumer_nameが特定のキュー・タイプ値で始まり、msg_stateがREADYであるものから取得されます。

ユーザーの処理

3.9 エージェント(emctl)により開始された期限切れブラックアウト

このメトリック・カテゴリは、Enterprise Managerコマンドライン・ユーティリティ(emctl)により開始された期限切れブラックアウトに関する情報を提供します。

3.9.1 ブラックアウト名

このメトリックは、ブラックアウトの名前を表します。

ターゲットのリリース	収集頻度
すべてのリリース	1時間ごと

3.9.2 エージェントURL

このメトリックは、ホストにインストールされている管理エージェントのURLを表します。

ターゲットのリリース	収集頻度
すべてのリリース	1時間ごと

3.9.3 影響を受けるターゲットの数

このメトリックは、期限切れブラックアウトの影響を受けるターゲットの数を表します。

表3-1 メトリック・サマリー表

ターゲットのリリース	評価および収集頻度	デフォルトの警告のしきい値	デフォルトのクリティカルのしきい値	アラート・テキスト
すべてのリリース	1時間ごと	0	定義なし	url %emd_url%のエージェントに、(%target_count%)ターゲットが影響を受ける期限切れのブラックアウト(%blackout_name%)があります。

3.10 インシデント

このメトリック・カテゴリには、インシデント・ターゲットの情報が含まれます。

3.10.1 アラート・ログ・エラーのトレース・ファイル(Alert Log Error Trace File)

アラート・ログ・エラーのトレース・ファイルは、このインシデントを生成する問題が発生した場合に生成される関連付けられたサーバー・トレース・ファイルの名前です。追加のトレース・ファイルが生成されなかった場合、このフィールドは空です。

次の表は、メトリックの値が収集される頻度を示しています。

ターゲットのリリース	収集頻度
すべてのリリース	5分ごと

データ・ソース

アラート・ログ・エラーのトレース・ファイル名は、データベース・アラート・ログから抽出されます。

ユーザーの処理

ユーザーが発生した問題の詳細情報をこのファイルで参照するため、アラート・ログ・エラーのトレース・ファイル名が提供されます。

3.10.2 アラート・ログ名

現在のXMLアラート・ログ・ファイルの完全指定された(ディレクトリ・パスを含む)名前。

次の表は、メトリックの値が収集される頻度を示しています。

ターゲットのリリース	収集頻度
すべてのリリース	15分ごと

データ・ソース

最新(現在)のログ・ファイルに対してOMS ADR_HOME/alertディレクトリを検索して、この名前を取得します。

ユーザーの処理

ユーザーが発生した問題の詳細情報をこのファイルで参照するため、アラート・ログ・ファイル名が提供されます。

3.10.3 診断インシデント

診断インシデントは、Enterprise Managerの使用中にOMSプロセスで発生した問題(クリティカル・エラー)の1回の発生です。

次の表は、メトリックの値が収集される頻度を示しています。

ターゲットのリリース	収集頻度
すべてのリリース	15分ごと

データ・ソース

診断インシデントを説明するテキストは、データベース・メッセージおよびエラーの発生順のリストを格納する自動診断リポジトリ(ADR)に格納されるXMLファイルのデータベース・アラート・ログから抽出されます。

ユーザーの処理

診断インシデントは通常ソフトウェア・エラーを示し、Enterprise Managerサポート・ワークベンチを使用してOracleに報告する必要があります。

3.10.4 ECID

実行コンテキストID(ECID)は、アプリケーション・サーバーを介して移動する場合のリクエストを追跡します。この情報は、単一のタスクを実行する単一のユーザーに検出された関連する問題の関連付けに使用できるため、診断目的に役立ちます。

次の表は、メトリックの値が収集される頻度を示しています。

ターゲットのリリース	収集頻度
すべてのリリース	15分ごと

データ・ソース

ECIDは、データベース・アラート・ログから抽出されます。

ユーザーの処理

診断インシデントは通常ソフトウェア・エラーを示し、Enterprise Managerサポート・ワークベンチを使用してOracleに報告する必要があります。サポート・ワークベンチを使用して問題をパッケージ化する場合、追加の問題をパッケージに関連付けて含めるため、サポート・ワークベンチでECIDを使用します。

3.10.5 影響

発生した問題の影響を査定するオプションのフィールド(空の場合があります)。

次の表は、メトリックの値が収集される頻度を示しています。

ターゲットのリリース	収集頻度
すべてのリリース	15分ごと

データ・ソース

影響は、データベース・アラート・ログから抽出されます。

ユーザーの処理

このフィールドは、情報を表示するのみです。診断インシデントは通常ソフトウェア・エラーを示し、Enterprise Managerサポート・ワークベンチを使用してOracleに報告する必要があります。

3.10.6 インシデントID

インシデントIDは、診断インシデント(問題の1回の発生)を一意に識別する数値です。

次の表は、メトリックの値が収集される頻度を示しています。

ターゲットのリリース	収集頻度
すべてのリリース	15分ごと

データ・ソース

インシデントIDは、データベース・アラート・ログから抽出されます。

ユーザーの処理

診断インシデントは通常ソフトウェア・エラーを示し、Enterprise Managerサポート・ワークベンチを使用してOracleに報告する必要があります。問題は、同じインシデントの1回以上の発生です。サポート・ワークベンチを使用する場合、インシデントIDを使用して、パッケージ化してOracleに送信する正しい問題を選択できます。コマンドライン・ツールADRCIを使用する場合も、インシデントの表示コマンドとともにインシデントIDを使用して、インシデントの詳細を取得できます。

3.11 ジョブ・ディスパッチャ・パフォーマンス

このメトリック・カテゴリには、ジョブ・ディスパッチャのパフォーマンスに関する情報が含まれます。

3.11.1 ジョブ・ディスパッチャ処理時間(最近1時間の割合)

ジョブ・ディスパッチャは、必要に応じてジョブのスケジューリングを行います。これは定期的に起動して、ジョブを実行する必要があるかどうかを調べます。ジョブ・ディスパッチャがしきい値レベルを超えて実行している場合は、ジョブ・ロードの処理に問題があります。

データ・ソース

管理リポジトリ内のmgmt_system_performance_log表の、最近1時間にジョブが実行された時間の合計を1時間で割り、100を掛けてパーセントで表します。

ユーザーの処理

このメトリックは情報を表示するのみです。

3.11.2 ジョブ・ステップ/秒

ジョブ・ディスパッチャが処理した1秒当たりのジョブ・ステップの数(10分ごとにサンプリングした最近1時間の平均)。

データ・ソース

管理リポジトリ内のmgmt_job_execution表。

ユーザーの処理

このメトリックは情報を表示するのみです。

3.12 クリア済メトリック収集エラー/日

このメトリック・カテゴリは、日ごとにクリアされるメトリック収集エラーに関する情報を提供します。

3.12.1 クリア済エラー件数

このメトリックは、その日にクリアされたメトリック収集エラーの数を表します。

ターゲットのリリース	収集頻度
すべてのリリース	毎日

3.13 レポート済メトリック収集エラー/日

このメトリック・カテゴリは、日ごとにレポートされるメトリック収集エラーに関する情報を提供します。

3.13.1 レポート済エラー件数

このメトリックは、日ごとにレポートされたメトリック収集エラーの数を表します。

表3-2 メトリック・サマリー表

ターゲットのリリース	評価および収集頻度	デフォルトの警告のしきい値	デフォルトのクリティカルのしきい値	アラート・テキスト
すべてのリリース	毎日	定義なし	定義なし	メトリック収集エラー数%value%が警告(%warning_threshold%)またはクリティカル(%critical_threshold%)のしきい値を超えています。

3.14 通知配信パフォーマンス

このメトリック・カテゴリは、使用中の通知方法の様々なパフォーマンス測定値をレポートするリポジトリ・メトリックに関する情報を提供します。サポートされる通知方法を、次に示します。

EMAIL
OSCMD
PLSQL
SNMP
SNMPV3 (リリース12c (12.1.0.4以上))
JAVA
TICKET

3.14.1 平均通知時間(秒)

このメトリックは、この問題がEnterprise Managerに発行されたときから通知が配信されるまでに費やされた時間の平均を秒単位で表します。

データ・ソース

このメトリックのデータは、em_notify_requests表およびem_notify_deliveries表から取得されます(リリース12c (12.1.0.4以上))。
このメトリックのデータは、name=method_name||_OMS_SECONDSであるmgmt_system_performance_logのエントリから取得されます

ユーザー・アクション

平均通知時間が徐々に長くなっている場合は、指定した通知方法が期待どおりに動作していることを確認します。必要ないまたは最新ではないすべてのインシデント・ルールを削除します。

3.14.2 通知処理時間(最近1時間の割合)

このメトリックは、通知システムが通知を送信する処理でアクティブであったCPU (経過時間)の割合を表します。

ユーザー・アクション

このメトリックのデータは、em_notify_requests表およびem_notify_deliveries表から取得されます(リリース12c (12.1.0.4以上))。
このメトリックのデータは、name=method_name||DELIVERY_MILLISであるmgmt_system_performance_logのエントリから取得されます(12c (12.1.0.4)より前のすべてのリリース)。

ユーザー・アクション

通知の処理時間が徐々に長くなっている場合は、通知方法が期待どおりに動作していることを確認します。必要ないまたは最新ではないすべてのインシデント・ルールを削除します。

3.14.3 処理された通知(過去1時間)

このメトリックは、過去1時間に管理サービスによって配信された通知の合計数を表します。

データ・ソース

このメトリックのデータは、em_notify_requests表およびem_notify_deliveries表から取得されます(リリース12c (12.1.0.4以上))。
このメトリックのデータは、name=method_name||DELIVERY_MILLISであるmgmt_system_performance_logのエントリから取得されます(12c (12.1.0.4)より前のすべてのリリース)。

ユーザー・アクション

処理された通知の数が数日間増加し続けている場合は、管理サービスを追加することを検討します。

3.14.4 保留通知数

このメトリックは、配信が保留されている通知の合計数を表します。

データ・ソース

このメトリックのデータは、em_notify_requests表およびem_notify_deliveries表から取得されます(リリース12c (12.1.0.4以上))。
このメトリックのデータは、consumer_nameがmethod_name%であるようなaq$em_notify_qtableから取得されます(12c (12.1.0.4)より前のすべてのリリース)。

ユーザー・アクション

保留されている通知の数が増加し続けている場合は、操作の問題を修正します。管理サービスを追加して、通知システムの能力を増強する必要があります。

3.15 通知ステータス

これは、通知システムがクリティカル状態と判断すると、範囲外通知を送信しようとする管理エージェント・メトリックです。通知システムは、その配信ワークロードを管理するためにデータベース・キュー表(em_notify_qtable)を使用し、対応するデータベース・ビューはAQ$EM_NOTIFY_QTABLEであることに注意してください。

3.15.1 通知の稼働/停止

次の条件のいずれかが存在すると、メトリックの値は、停止中です。それ以外の場合は稼働中です。

500を超える通知が1時間を超えて完了待ちとなっている
高度な通知デバイスが1時間を超えて通知を処理しておらず、後で通知を再試行する要求を行っている

表3-3 メトリック・サマリー表

ターゲットのリリース	評価および収集頻度	デフォルトの警告のしきい値	デフォルトのクリティカルのしきい値	アラート・テキスト
すべてのリリース	5分ごと	定義なし	停止中	%Message%

データ・ソース

500を超える通知が1時間を超えて完了待ちとなっている場合、データはaq$em_notify_qtableから取得されます。

SELECT count(1)
 FROM aq$em_notify_qtable
WHERE msg_state='READY'
 AND consumer_name not like 'ADM%'
 AND consumer_name not like 'RCA1'
 AND enq_time <= sysdate - (1/24);

高度な通知デバイスが1時間を超えて通知を処理しておらず、後で通知を再試行する要求を行っている場合、データはem_notify_requeue表から取得されます。
```
  SELECT count(1)
        FROM (SELECT device_id, min(insertion_timestamp) as first_ts
            FROM EM_NOTIFY_REQUEUE
           GROUP BY device_id) a
WHERE a.first_ts > sysdate - (1/24);
```

ユーザー・アクション

保留通知数が大きい場合、通知方法が期待どおりに稼働していることを確認します。必要ないまたは最新ではないすべてのインシデント・ルールを削除します。管理サービスを追加して、通知システムの能力を増強する必要があります。
高度な通知方法が後での通知の再試行を要求している場合、原因となった問題を解決して、再試行が要求されないようにします。

3.16 全体ステータス

このメトリック・カテゴリは、管理リポジトリの全体的なステータスに関する情報を提供します。

3.16.1 過去10分間の全体バックオフ・リクエスト数

このメトリックは、過去10分間のバックオフ・リクエストの数を表します。

表3-4 メトリック・サマリー表

ターゲットのリリース	評価および収集頻度	デフォルトの警告のしきい値	デフォルトのクリティカルのしきい値	アラート・テキスト
すべてのリリース	10分ごと	定義なし	定義なし	定義なし

3.16.2 全体アップロードのバックログ(ファイル数)

このメトリックは、アップロードのバックログに存在するファイルの数を表します。

表3-5 メトリック・サマリー表

ターゲットのリリース	評価および収集頻度	デフォルトの警告のしきい値	デフォルトのクリティカルのしきい値	アラート・テキスト
すべてのリリース	10分ごと	定義なし	定義なし	定義なし

3.16.3 過去1時間にローダーによって処理された全行数

このメトリックは、過去1時間にデータ・ローダーによって処理された行の数を表します。

表3-6 メトリック・サマリー表

ターゲットのリリース	評価および収集頻度	デフォルトの警告のしきい値	デフォルトのクリティカルのしきい値	アラート・テキスト
すべてのリリース	10分ごと	定義なし	定義なし	定義なし

3.16.4 全体アップロードのバックログ(MB)

このメトリックは、アップロードのバックログのサイズ(MB)を表します。

表3-7 メトリック・サマリー表

ターゲットのリリース	評価および収集頻度	デフォルトの警告のしきい値	デフォルトのクリティカルのしきい値	アラート・テキスト
すべてのリリース	10分ごと	定義なし	定義なし	定義なし

3.16.5 未モニターのターゲット(%)

このメトリックは、監視されていないターゲットの割合を表します。

表3-8 メトリック・サマリー表

ターゲットのリリース	評価および収集頻度	デフォルトの警告のしきい値	デフォルトのクリティカルのしきい値	アラート・テキスト
すべてのリリース	10分ごと	25	50	定義なし

3.16.6 全体アップロード速度(MB/秒)

このメトリックは、管理リポジトリにデータをアップロードする速度を表します。

表3-9 メトリック・サマリー表

ターゲットのリリース	評価および収集頻度	デフォルトの警告のしきい値	デフォルトのクリティカルのしきい値	アラート・テキスト
すべてのリリース	10分ごと	定義なし	定義なし	定義なし

3.17 保留中のモニタリング・ジョブ

このメトリック・カテゴリは、保留中の監視ジョブに関する情報を提供します。

3.17.1 保留中のテンプレート適用

このメトリックは、ターゲットへの適用が保留されているテンプレートの数を表します。

監視テンプレートの詳細は、『Oracle Enterprise Manager Cloud Control管理者ガイド』を参照してください。

表3-10 メトリック・サマリー表

ターゲットのリリース	評価および収集頻度	デフォルトの警告のしきい値	デフォルトのクリティカルのしきい値	アラート・テキスト
すべてのリリース	10分ごと	定義なし	定義なし	保留中のテンプレート適用ジョブ数%value%が警告(%warning_threshold%)またはクリティカル(%critical_threshold%)のしきい値を超えています

3.17.2 保留中のメトリック拡張のデプロイ

このメトリックは、保留中のメトリック拡張のデプロイの数を表します。

メトリック拡張の詳細は、『Oracle Enterprise Manager Cloud Control管理者ガイド』を参照してください。

表3-11 メトリック・サマリー表

ターゲットのリリース	評価および収集頻度	デフォルトの警告のしきい値	デフォルトのクリティカルのしきい値	アラート・テキスト
すべてのリリース	10分ごと	定義なし	定義なし	保留中の拡張デプロイメント・ジョブ数%value%が警告(%warning_threshold%)またはクリティカル(%critical_threshold%)のしきい値を超えています。

3.18 リポジトリ収集パフォーマンス

このメトリック・カテゴリには、リポジトリ収集のパフォーマンスに関する情報が含まれます。各データは、収集ワーカーと呼ばれるリポジトリ・データベース内のバックグラウンドDBMSジョブによって収集されます。リポジトリのメトリックは、長期実行と短期実行のメトリックに分類されます。これらはタスク・クラス(短期タスク・クラスと長期タスク・クラス)と呼ばれます。いくつかの収集ワーカー(デフォルトは1)は短期タスク・クラスを処理し、別のいくつかの収集ワーカー(デフォルトは1)は長期タスク・クラスを処理します。「リポジトリ収集パフォーマンス」メトリックは、各タスク・クラスのリポジトリ・メトリック収集のパフォーマンス・データを測定します。このメトリックは、リポジトリ・メトリックの1つであるため、収集ワーカーによって収集されます。

3.18.1 平均収集時間(秒)

最近10分間に収集ワーカーが稼働していた合計時間を秒単位で表します。これは、リポジトリ収集サブシステムに対する負荷を示します。負荷が高い場合、収集の数が増加しているか、一部のメトリックで処理を完了するのに長い時間を要していると考えられます。このメトリックを「処理された収集」メトリックと関連付けて把握し、収集の数が増加しているか、メトリックの処理に長い時間を要しているかを判断する必要があります。

データ・ソース

このメトリックのデータは、job_name=MGMT_COLLECTION.Collection Subsystemという条件を満たすmgmt_system_performanceログのエントリから取得されます。

3.18.2 処理された収集

最近10分間に処理された収集の合計数。

データ・ソース

このメトリックのデータは、job_name=MGMT_COLLECTION.Collection Subsystemという条件を満たすmgmt_system_performanceログのエントリから取得されます。

3.18.3 実行待機中の収集

このメトリックの収集時点で実行を待機していた収集の合計数。この値が増加している場合、収集ワーカーが不足しているため、その数を増やす必要があります。実行待機中の収集は、システム起動時の初期段階では多く存在する可能性がありますが、その後は0(ゼロ)に近づいていくのが普通です。

データ・ソース

このメトリックのデータは、収集のすべてのリストを保持するmgmt_collection_tasks表のエントリから取得されます。

ユーザー・アクション

このメトリックは情報を表示するのみです。

3.18.4 収集ワーカー数

収集を処理しているワーカーの合計数。

データ・ソース

このメトリックのデータは、mgmt_collection_workers表のエントリから取得されます。

ユーザー・アクション

このメトリックは情報を表示するのみです。

3.18.5 収集ワーカー間の合計スループット

すべての収集ワーカーによって1秒当たりに処理された収集の合計数。

データ・ソース

このメトリックのデータは、job_name=MGMT_COLLECTION.Collection Subsystemという条件を満たすmgmt_system_performanceログのエントリから取得されます。

ユーザー・アクション

このメトリックは情報を表示するのみです。

3.19 リポジトリ収集タスク・パフォーマンス

このメトリックは、リポジトリ収集タスクのパフォーマンスに関する情報を提供します。

3.19.1 実行時間(秒)

このメトリックは、収集タスクの実行時間を秒単位で表します。

表3-12 メトリック・サマリー表

ターゲットのリリース	評価および収集頻度	デフォルトの警告のしきい値	デフォルトのクリティカルのしきい値	アラート・テキスト
すべてのリリース	10分ごと	定義なし	定義なし	ターゲット・タイプ%task_target_type%のタスクID/メトリック%metric_name%の実行期間は%value%で、警告(%warning_threshold%)またはクリティカル(%critical_threshold%)のしきい値を超えています。

3.20 リポジトリ・ジョブ・ディスパッチャ

このメトリック・カテゴリには、リポジトリ・ジョブ・ディスパッチャに関する情報が含まれます。

3.20.1 ジョブ・ステップ・バックログ

すべてのディスパッチャがビジーだったために、スケジュールの準備はできているがスケジュールできなかったジョブ・ステップの数。

この数が徐々に増加している場合は、ジョブ・スケジューラがワークロードに対応できていないことを示します。

ユーザー・アクション

このメトリックは、予定されているスケジュール時間がすでに経過してしまったジョブ・ステップ(実行準備は整っているがまだ実行されていないジョブ・ステップ)の合計数を示します。この数値のグラフが長期にわたって徐々に増加している場合は、次のいずれかの処理を行う必要があります。

web.xmlファイルのem.jobs.shortPoolSize、em.jobs.longPoolSizeおよびem.jobs.systemPoolSizeプロパティを大きくします。web.xmlファイルは、様々なタイプのジョブ・ステップを処理するために割り当てるスレッド数を指定します。ショート・プール・サイズは、ロング・プール・サイズより大きくします。

プロパティ	デフォルト値	推奨値	説明
em.jobs.shortPoolSize	10	10 50	実行時間が15分未満のステップ
em.jobs.longPoolSize	8	8 - 30	実行時間が15分を超えるステップ
em.jobs.systemPoolSize	8	8 - 20	内部ジョブ(エージェントのpingなど)

別のホスト上で新しい管理アービスを追加します。
ジョブ・ステップの内容を調べ、効率が上がるかどうかを確認します。

3.21 リポジトリ操作ステータス

このメトリック・カテゴリは、管理リポジトリの操作ステータスに関する情報を提供します。リポジトリのメトリックは、長期実行と短期実行のメトリックに分類されます。

3.21.1 リポジトリ・ジョブ・スケジューラのステータス

このメトリックは、リポジトリ・ジョブ・スケジューラのステータスを表します。

表3-13 メトリック・サマリー表

ターゲットのリリース	評価および収集頻度	デフォルトの警告のしきい値	デフォルトのクリティカルのしきい値	アラート・テキスト
すべてのリリース	5分ごと	定義なし	停止中	リポジトリ・ジョブ・スケジューラは%value%です

3.21.2 長時間実行中のメトリック収集ステータス

このメトリックは、長時間実行中のメトリック収集のステータスを表します。

表3-14 メトリック・サマリー表

ターゲットのリリース	評価および収集頻度	デフォルトの警告のしきい値	デフォルトのクリティカルのしきい値	アラート・テキスト
すべてのリリース	5分ごと	一部稼働中	停止中	長時間実行中のメトリック収集ステータスは%value%です

3.21.3 短時間実行中のメトリック収集ステータス

このメトリックは、短時間実行中のメトリック収集のステータスを表します。

表3-15 メトリック・サマリー表

ターゲットのリリース	評価および収集頻度	デフォルトの警告のしきい値	デフォルトのクリティカルのしきい値	アラート・テキスト
すべてのリリース	5分ごと	一部稼働中	停止中	短時間実行中のメトリック収集ステータスは%value%です

3.22 リポジトリ・セッション

このメトリック・カテゴリには、リポジトリ・セッションに関する情報が含まれます。

3.22.1 リポジトリ・セッション数

管理サービスと管理リポジトリ・データベースの間のセッション件数。

データ・ソース

gv$sessionシステム・ビュー。

ユーザー・アクション

このメトリックは情報を表示するのみです。

3.23 レスポンス

このページは、Enterprise Managerが稼働中か停止しているかを示します。停止していた期間の履歴情報も含まれます。

3.23.1 ステータス

このメトリックは、Enterprise Managerが稼働中かまたは停止中かを表示します。有効な電子メール・アドレスでoracle_emrepターゲットを監視するエージェントを構成している場合、Enterprise Managerが停止したときに電子メール通知を受信できます。

次の表は、メトリックの値が収集され、デフォルトのしきい値と比較される頻度を示しています。

表3-16 メトリック・サマリー表

ターゲットのリリース	評価および収集頻度	アップロード頻度	演算子	デフォルトの警告のしきい値	デフォルトのクリティカルのしきい値	通知前の発生の連続回数	アラート・テキスト
すべてのリリース	5分ごと	アップロードなし	=	定義なし	0	1	%Message%

データ・ソース

sysman/admin/scripts/emrepresp.pl

ユーザー・アクション

このメトリックは、次の項目を確認します。

管理リポジトリ・データベースが稼働していてアクセス可能かどうか。

管理リポジトリ・データベースが停止している場合は、起動します。「ユーザー名またはパスワードが無効です」というエラーが表示された場合、oracle_emrepターゲットの名前およびパスワードが、リポジトリ所有者の名前およびパスワードと同じであることを確認します。
1つ以上の管理サービスが実行中かどうか。

管理サービスが実行中でない場合は、開始します。
「リポジトリ・メトリック」のDBMSジョブが実行中かどうか。

DBMSジョブが停止中であるか、無効なスケジュールが割り当てられている場合、「DBMSジョブの無効なスケジュール」メトリックの「ユーザーの処理」で説明している処理を実行し、ジョブを再起動します。

3.24 サービスの初期化エラー

このカテゴリは、ローダーやイベントなどのサービスで発生した初期化エラーに関する情報を提供します。

3.24.1 サービス・ステータス

OMSの起動時にOMSサービス(ローダー、通知、PingRecorderなど)の初期化に失敗すると、このメトリックが生成されます。現在、このメトリックを使用しているのはLoaderサービスのみです。

このメトリックにはキー列が2つと、キーなし列が1つあります。

キー列は管理サービスとサービス名です。キーの値により、初期化に失敗したサービス・インスタンスが一意に識別されます。
キーなし列はサービス・ステータスです。この列により、サービスが問題なく実行されているかどうかがわかります。また、OMS起動時にエラーが発生していないかどうかもわかります。