Oracle Cloudコンソールを使用したトラブルシューティング

Oracle Cloudコンソールに示されるメトリックを使用してOCI GoldenGateをトラブルシューティングする方法について学習します。

ノート:

この情報は、データ・レプリケーション・デプロイメントにのみ適用されます。

デプロイメント情報

「デプロイメント情報」タブの次の情報を使用してトラブルシューティングできます:

  • OCPU数: OCI GoldenGateデプロイメントが自動スケーリングなしで消費できるOracle Compute Unit (OCPU)の基本数。これは、OCI GoldenGateの最小メーターでもあります。
  • 自動スケーリング: 有効にすると、OCI GoldenGateデプロイメントはOCPU数の値の3倍までスケール・アップできます。
  • パブリックIP: OCI GoldenGateデプロイメントの作成時にパブリック・エンドポイントが有効になっていた場合、パブリックIPが表示されます。
  • プライベートIP: (顧客の)サブネットからアクセス可能なプライベートIP。
  • コンソールURL: パブリックまたはプライベート・ネットワークを介したOCI GoldenGateデプロイメント・コンソールへのアクセスに使用できるFQDN。プライベートの場合、コンソールURLにはプライベート・ネットワークからアクセスする必要があります。
  • OCID: Oracle Supportでサービス・リクエスト(SR)を開くために必要な、デプロイメントのOracle Cloud Identifier (OCID)。

メトリック

ノート:

使用可能なすべてのメトリックを利用するには、デプロイメントを最新バージョンにアップグレードしてください。

メトリックは、デプロイメントごとに5分おきに収集されます。生成されるデータは、問題が発生した場合のトラブルシューティングに役立ちます。

  • CPU使用率: すべてのOCPUの集計。たとえば、OCPU数として3を指定し、デプロイメントの作成時に自動スケーリングを有効にした場合、使用できるOCPUの合計数は9になります。使用率が33.333%を超える場合は、9 OCPUの33.333%を意味します。
  • CPU使用量: 消費されたOCPUの総数。たとえば、OCPU使用率が9 OCPUの33.333%を超える場合は、33.333%を超える整数値、つまり4 OCPUについて請求されます。自動スケーリングが有効でない場合、OCPUの基本数について請求されます。
  • メモリー使用率: 集計されたメモリーの割合。OCPUごとに16GBのメモリーが割り当てられます。
  • デプロイメントの全体的なヘルス: 各デプロイメントにヘルス・スコアがあります。これは、基礎となるOCI GoldenGateデプロイメント・プロセス(管理サービス、分散サービス、レシーバ・サービスおよびパフォーマンス・メトリック・サービス)を集計ヘルスします。
    • 正常: 100%
    • 異常: >100%

      たとえば、4つのプロセスのうち2つが正常である場合、ヘルス・スコアは50%になります。

      ノート:

      Extractや分散パスなどのサブプロセスを追加するときに、「デプロイメントのヘルスにクリティカル」として指定できます。そのサブプロセスが停止した場合、管理サービスは異常とみなされます。
  • デプロイメントのインバウンド・ラグ: ラグは、クリティカルとして指定されているExtractについて取得されます。このメトリックは、すべてのクリティカルなExtractにわたって集計されます。
  • デプロイメントのアウトバウンド・ラグ: ラグは、クリティカルとして指定されているReplicatについて取得されます。このメトリックは、すべてのクリティカルなReplicatにわたって集計されます。
  • スワップ領域の使用量: デプロイメントが使用しているスワップ領域の量をギガバイト単位で表示します。
  • 一時領域の使用状況: デプロイメントが使用している一時領域の量をギガバイト単位で表示します。
  • ファイル・システムの使用状況: デプロイメントが使用しているファイル・システム領域の量をギガバイト単位で表示します。
  • Extractステータス: デプロイメントのExtractプロセスの全体的なヘルスが表示されます:
    • プロセスが実行中の場合は100%
    • プロセスが異常終了または停止した場合は0%
  • Replicatステータス: デプロイメントのReplicatプロセスの全体的なヘルスが表示されます:
    • プロセスが実行中の場合は100%
    • プロセスが異常終了または停止した場合は0%
  • 分散パス・ステータス: デプロイメントの分散パス・プロセスの全体的なヘルスが表示されます:
    • プロセスが実行中の場合は100%
    • プロセスが異常終了または停止した場合は0%
  • 受信パス・ステータス: デプロイメントの受信パス・プロセスの全体的なヘルスが表示されます:
    • プロセスが実行中の場合は100%
    • プロセスが異常終了または停止した場合は0%
  • Extractラグ: デプロイメント内のExtractプロセスの平均タイム・ラグ(秒)が表示されます。
  • Replicatラグ: デプロイメント内のReplicatプロセスの平均タイム・ラグ(秒)が表示されます。
  • 分散パス・ラグ: デプロイメント内の分散パス・プロセスの平均タイム・ラグ(秒)が表示されます。
  • 受信パス・遅れ: デプロイメント内の受信パス・プロセスの平均タイム・遅れ(秒)が表示されます。

詳細は、メトリックを参照してください。

例: デプロイメント・ヘルスのトラブルシューティング

この例では、デプロイメント・ヘルスが100%でない場合のトラブルシューティング方法を示します。

OCI GoldenGateデプロイメント・コンソールでデプロイメント・ヘルスをトラブルシューティングするには:

  1. デプロイメント・ヘルスを評価するアラームを作成します。

    デプロイメント・ヘルスが100%未満の場合は通知を受け取ります。

  2. 「デプロイメントの詳細」ページからOCI GoldenGateデプロイメント・コンソールを起動してサインインします。
  3. OCI GoldenGateデプロイメント・コンソールで、「パフォーマンス・メトリック・サービス」をクリックし、各プロセスのステータスを確認します。

    ExtractやReplicatなどのサブプロセスが停止した場合、そのサブプロセスは管理サービスのヘルスに直接影響し、ヘルス・スコアは0 (異常)になります。したがって、4つのプロセスのうち3つのみが正常であるため、全体的なデプロイメント・ヘルスは75%になります。

ログ・ファイルは、プロセスごとにも使用できます。OCI GoldenGateデプロイメント・コンソールのログ・ファイルを使用したトラブルシューティング方法の詳細は、デプロイメント・コンソールを使用したトラブルシューティングを参照してください。

例: OCPU使用率のトラブルシューティング

この例は、OCPU使用率が90%を超える場合のトラブルシューティング方法を示しています。

ExtractおよびReplicatは、データをレプリケートするときにOCPUサイクルを消費します。パラレルReplicatは、各Replicatプロセスに対して多数のアプライヤ・プロセスを作成します。OCI GoldenGateデプロイメント・コンソールでパフォーマンス・メトリックを確認した後、追加のOCPUをOCI GoldenGateデプロイメントに追加するか、自動スケーリングが有効になっていない場合は有効にする必要がある場合があります。

OCPU使用率をトラブルシューティングするには:

  1. OCI GoldenGateデプロイメント・コンソールを起動してサインインします。
  2. パフォーマンス・メトリック・サービスをクリックします。
  3. 各プロセスをクリックして詳細を確認し、「スレッド・パフォーマンス」をクリックしてそのプロセス内の各スレッドのステータスを参照します。

    スレッド・パフォーマンスの例
    図threadperformance.pngの説明

    この情報は、各スレッドのCPU使用量も含め、各プロセスのトラブルシューティングに使用できます。