5 Oracle Service Busのサービス・ヘルスのモニター

この章では、サービス・ヘルス統計を使用して、Service Busプロジェクトおよびサービスのヘルスをモニターする方法について説明します。レスポンス時間やメッセージ、エラーおよびアラートの数などの統計は、問題の検出、分析および修正に役立ちます。

この章の内容は次のとおりです。

5.1 サービス・ヘルスのメトリックについて

Service Busは、Fusion Middleware Controlを使用して、実行中のサービスおよびプロジェクトのヘルスのモニターに役立てるため、統計を収集します。「サービス・ヘルス」ページを使用して、ドメイン内のすべてのサービスを表示したり、特定のサービスを検索して表示できます。そして、「サービス」リストからサービスを選択して、そのサービス独自の「ダッシュボード」ページにサービスの状態に関する詳細情報を表示することができます。

現在の集約間隔に基づいて統計をモニターしたり、統計が最後にリセットされて以降の累積統計をモニターしたりすることができます。ドメイン、プロジェクトまたはサービスに対して、いつでも統計をリセットできます。

集約間隔に基づいて統計を表示する場合、各サービスによって収集された統計データの動的ビューが提供されます。このとき、表示される統計は集約間隔によって決まります。たとえば、特定のサービスの集約間隔が20分である場合、そのサービスの行には最後の20分間に収集されたデータが表示されます。集約間隔の詳細は、「集約間隔について」を参照してください。

5.1.1 ドメインとプロジェクトのサービス・ヘルス・メトリック

ドメインまたはプロジェクトのメトリックを表示する際、表示される統計は、各サービスに対して収集された一般メトリックのサブセットのみです。この統計には、集計間隔、平均レスポンス時間、メッセージ数、エラー数およびアラート数が含まれます。サービス・ヘルス・メトリックは、モニターが有効なサービスにのみ表示されます。

次の表に、それぞれの種類のサービスに表示されるメトリックを示します。収集される統計の詳細リストは、「Oracle Service Busについて収集される統計」を参照してください。

表5-1 Oracle Service Busサービスのメトリック

メトリック 説明

平均実行時間

プロキシ・サービスの場合、トランスポートにおけるメッセージの受信時から例外処理時またはレスポンス送信時までの時間の平均を示します。

ビジネス・サービスの場合、アウトバウンド・トランスポートにおけるメッセージの送信時から例外受信時またはレスポンス受信時までの時間の平均を示します。

メッセージの総数

サービスに送信されたメッセージの数です。JMSプロキシ・サービスで、例外によってトランザクションが中断され、メッセージが失われないようにキューに戻された場合、デキューが再試行されるたびに別々のメッセージとしてカウントされます。同様に、アウトバウンド・トランザクションの場合、再試行またはフェイルオーバーのたびに別々のメッセージとしてカウントされます。

エラーがあるメッセージ

エラー・レスポンスを伴うメッセージの数です。

プロキシ・サービスの場合、システム・エラー・ハンドラまたは返信失敗アクションによって終了される原因となったメッセージの数を示します。エラーがサービス内で処理され、返信が成功するか再開アクションが行われる場合、エラーとして扱われません。

ビジネス・サービスの場合、トランスポート・エラーまたはタイムアウトの原因となったメッセージの数を示します。再試行およびフェイルオーバーは別々のメッセージとして扱われます。

成功/失敗比率

(メッセージの総数 - エラーが発生したメッセージの数)/エラーが発生したメッセージの数

セキュリティ

WS-Securityエラーを伴うメッセージの数です。このメトリックは、プロキシ・サービスおよびビジネス・サービスの両方で計算されます。

検証

フロー内の検証アクションで失敗した数です。このメトリックは、プロキシ・サービスとパイプラインにのみ適用されます。

5.1.2 プロキシ・サービスのメトリック

プロキシ・サービスの「ダッシュボード」ページでは、サービスについて次のタイプのメトリックを表示できます。

  • 全般: 現在の集約間隔または最後のリセット以降のプロキシ・サービス・ステータスのスナップショットを表示します。これには、アラート、レスポンス時間、メッセージ数、エラー数、失敗率と成功率などが含まれます。

  • 操作: WSDLベースのサービスで定義されている操作の統計を表示します。サービスで定義されているWSDL操作がない場合、この表は空になります。

5.1.3 ビジネス・サービスのメトリック

ビジネス・サービスの「ダッシュボード」ページでは、サービスについて次のタイプのメトリックを表示できます。

  • 全般: 現在の集約間隔または最後のリセット以降のビジネス・サービス・ステータスのスナップショットを表示します。これには、アラート、レスポンス時間、メッセージ数、エラー数、失敗率と成功率などが含まれます。

  • 結果キャッシュ: サービスに対して結果キャッシュがどのように使用されているかに関する情報を表示します(結果キャッシュが有効な場合)。

  • スロットル: ビジネス・サービスのスロットル統計を表示します(スロットルが有効な場合)。これには、最小、最大および平均スロットル時間(ミリ秒単位)などが含まれます。

  • 操作: WSDLベースのサービスで定義されている操作の統計を表示します。サービスで定義されているWSDL操作がない場合、この表は空になります。

  • エンドポイントURI: ビジネス・サービスに対して構成されている様々なエンドポイントURIの統計を表示します。これには、状態、メッセージ数、エラー数、レスポンス時間などが含まれます。このビューからURIをオンラインにしたり、オフラインにしたりすることもできます。詳細は、「ビジネス・サービスに対するエンドポイントURIのメトリックの表示」」および「エンドポイントURIをモニターするためのメトリック」を参照してください。

5.1.4 パイプライン・サービスのメトリック

パイプラインの「ダッシュボード」ページでは、パイプラインについて次のタイプのメトリックを表示できます。

  • 全般: 現在の集約間隔または最後のリセット以降のパイプライン・ステータスのスナップショットを表示します。これには、アラート、レスポンス時間、メッセージ数、エラー数などが含まれます。

  • 操作: WSDLベースのサービスで定義されている操作の統計を表示します。サービスで定義されているWSDL操作がない場合、この表は空になります。

  • フロー・メトリック: パイプライン・サービス・レベル、パイプライン(ペア)・レベルまたはアクション・レベルのメッセージ・フローの統計を表示します。これは、パイプラインのモニター・レベルに応じて異なります。統計には、メッセージ数、エラー数およびレスポンス時間が含まれます。アクション・レベルの統計を選択すると、表には、パイプライン内のアクションに関する情報がノードとアクションの階層として表示されます。

5.1.5 分割-結合サービスのメトリック

分割-結合の「ダッシュボード」ページでは、分割-結合について次のタイプのメトリックを表示できます。

  • 全般: 現在の集約間隔または最後のリセット以降の分割-結合ステータスのスナップショットを表示します。これには、アラート、レスポンス時間、メッセージ数、エラー数などが含まれます。

  • フロー・メトリック: 分割-結合レベル、ブランチ・レベルまたはアクティビティ・レベルのメッセージ・フローの統計を表示します。これは、分割-結合のモニタリング・レベルに応じて異なります。統計には、メッセージ数、エラー数およびレスポンス時間が含まれます。アクション・レベルの統計を選択すると、表には、分割-結合内のアクションに関する情報がノードとアクションの階層として表示されます。

5.2 サービス・ヘルス統計のモニター

Service Busドメインおよびプロジェクトの「サービス・ヘルス」ページには、モニターが有効化されているサービスの全般的なメトリックが表示されます。各サービスの「ダッシュボード」ページには、そのサービスに関するより詳細なメトリックが表示されます。

「現在の集約間隔」ビューには、サービス・メトリックの変動する統計が表示されます。「最後のリセット以降」ビューには、メトリックの集計カウントが表示されます。クラスタが存在する場合はクラスタ全体のメトリックがデフォルトで表示されます。管理対象サーバーを個別に選択してそのサーバーのメトリックを表示します。

サービスのモニターは、デフォルトでは有効化されていません。サービスのモニターを有効にする方法を学習するには、「操作設定の表示と構成」を参照してください。デフォルトでは、ダッシュボード・リフレッシュ間隔は、「リフレッシュなし」です。

5.2.1 最も多くのエラーがあるサービスの統計の表示

Service Busダッシュボードには、選択した期間に最も多くのエラーを生成したサービスの特定の統計が表示されます。統計には、平均レスポンス時間、処理されたメッセージの数、生成されたエラーの数、サービスに対して生成されたSLAアラートの数などが含まれます。これは統計の限定セットです。そのサービスの統計の完全なセットを表示するには、サービス名をクリックします。

このページに表示される統計の詳細は、Service Busで提供されているオンライン・ヘルプを参照してください。

最も多くのエラーがあるサービスの統計を表示するには:

  1. Fusion Middleware Controlで、「SOA」を展開し、「service-bus」を選択します。
  2. Service Busダッシュボードで、「最多エラーのサービス」セクションにスクロールします。
  3. 「サービス・ヘルス・スナップショット表」で、現在の集約間隔の統計を表示するか、統計がリセットされて以降の統計を表示するかを選択します。
  4. 「サーバー」フィールドで、統計の表示対象のサーバーを選択します。
  5. サービスのその他の統計を表示するには、表内のサービス名をクリックします。

    選択したサービスの「ダッシュボード」が表示されます。

5.2.2 ドメインのサービス・ヘルス統計の表示

「Service Bus」-「サービス・ヘルス」ページには、モニターが有効なドメイン内のすべてのサービスのヘルス統計が表示されます。これはすべての統計のサブセットです。そのサービスの統計の完全なセットを表示するには、サービス名をクリックします。サービス表内に表示されているサービスは、様々な基準でフィルタできます。次の図は「サービス・ヘルス」ページを示しています。

図5-1 「サービス・ヘルス」ページ

図5-1の説明が続きます
「図5-1 「サービス・ヘルス」ページ」の説明

Service Busドメイン内のすべてのサービスの統計を表示するには:

  1. Fusion Middleware Controlで、「SOA」を展開し、「service-bus」を選択します。
  2. 「サービス・ヘルス」タブをクリックします。
  3. 「統計の表示」フィールドで、次のいずれかを行います。
    • 現在の集約間隔のモニター統計を表示するには、「現在の集約間隔」を選択します。

    • 統計の最後のリセット以降のサービスのモニター統計を表示するには、「最後のリセット以降」を選択します。

  4. 「サーバー」フィールドで、オプションのリストからサーバーを選択して、そのサーバーのメトリックを表示します。
  5. 特定のサービスのみをリストするには、次の検索基準のいずれかを入力します。
    • 「サービス」フィールドで、検索するサービスのタイプを選択するか、「すべてのサービス」を選択して、すべてのサービス・タイプを表示します。

    • 「名前」フィールドに、検索ターゲットの名前を入力します。このフィールドでは、アスタリスクと疑問符(*および?)をワイルドカード文字として使用できます。

    • 「パス」フィールドに、検索ターゲットのパスを入力します。このフィールドでは、アスタリスクと疑問符(*および?)をワイルドカード文字として使用できます。

      パスには次の形式を使用します。

      project-name/root-folder/ . . ./parent-folder
      

      サービスがプロジェクトの直下にある場合、次の形式を使用します。

      project-name
      
    • 「プロキシによる呼出し」フィールドで、検索アイコンをクリックし、検索対象のサービスを呼び出すプロキシ・サービスを選択します。

    • メッセージのあるサービスのみを表示するには、「メッセージあり」を選択します。

    • アラートのあるサービスのみを表示するには、「アラートあり」を選択します。

    • エラーのあるサービスのみを表示するには、「エラーあり」を選択します。

    • 「リセット」をクリックすると、検索フィルタが削除され、サービスがすべて表示されます。

  6. 「検索」をクリックします。

    基準に一致するサービスのリストが表示されます。

  7. サービスのその他の統計を表示するには、表内のサービス名をクリックします。

    選択したサービスの「ダッシュボード」が表示されます。

5.2.3 プロジェクトのサービス・ヘルス統計の表示

Service Busプロジェクト」-「サービス・ヘルス」ページには、モニターが有効なプロジェクト内のすべてのサービスのヘルス統計が表示されます。これはすべての統計のサブセットです。そのサービスの統計の完全なセットを表示するには、サービス名をクリックします。サービス表内に表示されているサービスは、様々な基準でフィルタできます。次の図にプロキシ・サービスの「ダッシュボード」ページを示します。

図5-2 Service Busサービスの「ダッシュボード」

図5-2の説明が続きます
「図5-2 Service Busサービスの「ダッシュボード」」の説明

Service Busプロジェクト内のサービスの統計を表示するには:

  1. Fusion Middleware Controlで、「SOA」「service-bus」の順に開いて、統計を表示するプロジェクトの名前を選択します。

    「Service Busプロジェクト」-「サービス・ヘルス」ページが表示されます。

  2. 「統計の表示」フィールドで、次のいずれかを行います。
    • 現在の集約間隔のモニター統計を表示するには、「現在の集約間隔」を選択します。

    • 統計の最後のリセット以降のサービスのモニター統計を表示するには、「最後のリセット以降」を選択します。

  3. 「サーバー」フィールドで、オプションのリストからサーバーを選択して、そのサーバーのメトリックを表示します。
  4. 特定のサービスのみをリストするには、次の検索基準のいずれかを入力します。
    • 「サービス」フィールドで、検索するサービスのタイプを選択するか、「すべてのサービス」を選択して、すべてのサービス・タイプを表示します。

    • 「名前」フィールドに、検索ターゲットの名前を入力します。このフィールドでは、アスタリスクと疑問符(*および?)をワイルドカード文字として使用できます。

    • 「パス」フィールドに、検索ターゲットのパスを入力します。このフィールドでは、アスタリスクと疑問符(*および?)をワイルドカード文字として使用できます。

      パスには次の形式を使用します。

      project-name/root-folder/ . . ./parent-folder
      

      サービスがプロジェクトの直下にある場合、次の形式を使用します。

      project-name
      
    • 「プロキシによる呼出し」フィールドで、検索アイコンをクリックし、検索対象のサービスを呼び出すプロキシ・サービスを選択します。

    • メッセージのあるサービスのみを表示するには、「メッセージあり」を選択します。

    • アラートのあるサービスのみを表示するには、「アラートあり」を選択します。

    • エラーのあるサービスのみを表示するには、「エラーあり」を選択します。

    • 「リセット」をクリックすると、検索フィルタが削除され、サービスがすべて表示されます。

  5. 「検索」をクリックします。

    基準に一致するサービスのリストが表示されます。

  6. サービスのその他の統計を表示するには、表内のサービス名をクリックします。

    選択したサービスの「ダッシュボード」が表示されます。

5.2.4 サービスのすべてのサービス・ヘルス統計の表示

Service Busサービスの「ダッシュボード」ページには、そのサービスのサービス・メトリックの完全なセットおよびサービス固有の統計が表示されますが、サービスでモニターが有効になっている場合に限ります。サービスの「ダッシュボード」ページには、いくつかの方法でアクセスできます。

サービスの状態統計の完全なセットを表示するには:

  1. Fusion Middleware Controlで次のページのいずれかにナビゲートします。
    • Service Busの「ダッシュボード」ページ。このページにアクセスするには、「SOA」を展開し、「service-bus」を選択します。

    • 「Service Bus」-「サービス・ヘルス」ページ。このページにアクセスするには、「SOA」を展開し、「service-bus」を選択して、「サービス・ヘルス」タブをクリックします。

    • 「Service Bus」-「アラート履歴」ページ。このページにアクセスするには、「SOA」を展開し、「service-bus」を選択して、「アラート履歴」タブをクリックします。

    • Service Busプロジェクト」-「サービス・ヘルス」ページ。このページにアクセスするには、「SOA」を展開し、「service-bus」を展開して、プロジェクトの名前をクリックします。

  2. 必要に応じて、統計を表示するサービスの検索を実行します。
  3. 統計を表示するサービスの名前をクリックします。

5.3 サービス・モニターの統計のリセット

「サービス・ヘルス」ページでは、ドメインまたはプロジェクト内のすべてのサービスのモニター統計、または特定の1つのサービスのモニター統計のみをリセットできます。

統計をリセットすると、統計の最後のリセット以降にサービス、プロジェクトまたはドメインに対して収集されたモニター統計がすべて削除されます。ただし、サービスの現在の集約間隔において収集中の統計は削除されません。統計がリセットされると、サービスのモニター統計の収集がただちに再開されます。

ノート:

ブランチまたはアクティビティ・レベルの統計を収集する分割-結合を再デプロイする場合、その統計をリセットして、表示される統計が現在のブランチおよびアクティビティと一致するようにします。

サービス・モニターの統計をリセットするには:

  1. 次のいずれかを行います:
    • ドメイン内のすべてのサービスの統計をリセットするには、「SOA」を展開し、「service-bus」を選択します。「サービス・ヘルス」タブをクリックします。

    • プロジェクト内のすべてのサービスの統計をリセットするには、「SOA」を展開し、「service-bus」を展開して、プロジェクトの名前を選択します。

    • 単一のサービスの統計をリセットするには、「サービスのすべてのサービス・ヘルス統計の表示」の説明に従って、サービスの「ダッシュボード」ページにナビゲートします。

  2. 統計の表示」フィールドで「最後のリセット以降」を選択します。
  3. 「サーバー」フィールドの右にある「リセット」アイコンをクリックします。

    表示されているレベルのすべての統計がリセットされます。

5.3.1 リセット・オプションでの統計のリセットの失敗

リセット・オプションによって統計がリセットされず、「チェンジ・センター」編集セッションが表示されない場合、参照先がないセッション・データがセッション・フォルダに存在することを示しています。セッション・データを手動で削除してください。
  1. OSB管理対象サーバーをシャットダウンします。
  2. 各OSB管理対象サーバーと管理サーバーのMIDDLEWARE_HOME\user_projects\domains\<domainname>\osb\configfwk\sessionsに移動します。
  3. \sessionsフォルダのバックアップを作成します。
  4. \sessionsフォルダを削除します。
  5. OSB管理対象サーバーを再起動します。
  6. OSBコンソールで、セッションを作成します。
  7. OSBコンソール・セッションを発行します。
    これで、統計がリセットされます。

5.3.2 統計のリセットについて知っておくべきこと

サービスの統計をリセットすると、最後のリセット以降にサービスに対して収集された統計がすべて失われます。ドメインの統計をリセットすると、ページ上に表示されているかどうかにかかわらず、モニターされているすべてのサービスの統計がリセットされます。リセット・アクションは、元に戻せません。エンドポイントURIのステータスは、統計をリセットしてもリセットされません。