1.1 Oracle Autonomous Health Frameworkの問題および解決の領域

Oracle Autonomous Health Frameworkは、可用性およびパフォーマンスの問題の監視、診断および予防に役立ちます。

システム管理者は、インストール、パッチ適用およびアップグレード時に、Oracle Autonomous Health Frameworkのほとんどのコンポーネントをインタラクティブに使用できます。データベース管理者は、Oracle Autonomous Health Frameworkを使用して、操作に関する実行時の問題を診断し、これらの問題の影響を緩和できます。

1.1.1 可用性の問題

可用性の問題は、ソフトウェア・スタックの使用を脅かす実行時の問題です。

可用性の問題は、ソフトウェアの問題(Oracle Database、Oracle Grid Infrastructure、オペレーティング・システム)または基礎となるハードウェア・リソース(CPU、メモリー、ネットワーク、ストレージ)から発生する場合があります。

Oracle Autonomous Health Framework内のコンポーネントは、次の可用性の問題に対処します:

サーバーの可用性の問題の例

サーバーの可用性の問題によって、サーバーがクラスタから削除され、そのサーバー上で実行されているすべてのデータベース・インスタンスが停止される場合があります。

そのような問題の例を次に示します:

  • 問題: プライベート・インターコネクトでのネットワークの輻輳により、時間に厳密なノード間またはストレージI/Oに過剰なレイテンシが発生するか、パケットが削除される可能性があります。このタイプの障害は一般に蓄積するものであり、早期に検出して修正または緩和できます。

    解決策: サーバー構成の変更によってこの問題が発生した場合、問題が1時間以上解決されないと、クラスタ検証ユーティリティ(CVU)でこの問題が検出されます。ただし、Oracle Cluster Health Advisorでは、数分内に問題が検出され、修正処理が提示されます。

  • 問題: プライベート・インターコネクト上のネットワーク障害が、ケーブルが抜かれたことやネットワーク・インタフェース・カード(NIC)の障害に起因するものである場合は、即座にノードが削除される可能性があります。

    解決策: これらのタイプのネットワーク障害は早期に検出できませんが、その原因は、クラスタ状態モニターおよびOracle Trace File Analyzerを使用し、障害の時間や関連するネットワーク・インタフェースを特定することで絞り込むことができます。

データベースの可用性の問題の例

データベースの可用性の問題が原因でOracleデータベースまたはいずれかのデータベース・インスタンスが応答しなくなり、ユーザーが使用できなくなる場合があります。

そのような問題の例を次に示します:

  • 問題: ランナウェイ問合せまたは遅延によって、ロック、ラッチ、CPUなどの重要なデータベース・リソースが他のセッションに対して拒否される場合があります。重要なデータベース・リソースの拒否のために、データベースまたはデータベース・インスタンスがアプリケーションに対して応答しなくなります。

    解決策: ブロッカ・リゾルバがこのようなタイプの遅延を検出し、自動的に解決します。また、Oracle Cluster Health Advisorはこのような遅延を検出し、特定し、データベース管理者に通知して、適切な修正処理を提供します。

  • 問題: サービス拒否(DoS)攻撃、脆弱性、または単なるソフトウェアのバグが原因で、データベースまたはデータベース・インスタンスが応答しなくなる場合があります。

    解決策: 既知の問題に対する事前対応の推奨事項、およびOracle Orachkが提供する解決策によって、これらの発生を回避できます。このような問題が回避されない場合は、Oracle Trace File Analyzerによるログの自動収集、およびクラスタ状態モニターによって収集されたデータによってこれらの問題を迅速に修正できます。

  • 問題: 構成の変更は、トラブルシューティングが困難なデータベースの停止を引き起こす場合があります。たとえば、oracle.binファイルに対する権限の誤りによって、セッション・プロセスが作成されない場合があります。

    解決策: クラスタ検証ユーティリティおよびOracle Orachkを使用して、これらのタイプの問題を迅速に特定および修正します。Oracle Orachkを使用して差異レポートを生成し、2つのレポートのベースライン比較と差異のリストを確認できます。クラスタ検証ユーティリティで作成された構成レポートを表示して、システムがOracleインストールの基準を満たしているかどうかを確認することもできます。

1.1.2 パフォーマンスの問題

パフォーマンスの問題は、システムのパフォーマンスを脅かす実行時の問題です。

パフォーマンスの問題は、ソフトウェアの問題(バグ、構成の問題、データ競合など)またはクライアントの問題(要求、問合せタイプ、接続管理など)が原因で発生します。

サーバーおよびデータベースの問題は絡み合っており、分離するのは困難です。その発生場所(データベース・サーバーまたはクライアント)で分類する方が簡単です。

データベース・サーバーのパフォーマンスの問題の例

  • 問題: 構成のベスト・プラクティスからの逸脱によって、データベース・サーバーのパフォーマンスの問題が発生する場合があります。

    解決策: Oracle Orachkは、Oracle Orachkが定期的に実行されたときに構成の問題を検出し、データベース管理者に適切な修正設定を通知します。

  • 問題: あるセッションが原因で他のセッションの速度が低下し、そのブロックしているセッションがリソースを解放するか、作業を完了するまで待機が発生する可能性があります。

    解決策: ブロッカ・リゾルバは、このようなセッションのチェーンを検出し、ルート・ホルダー・セッションを自動的に終了してボトルネックを緩和します。

  • 問題: 未解決の既知の問題、またはパッチが適用されていないバグは、データベース・サーバーのパフォーマンスの問題を引き起こす場合があります。

    解決策: このような問題は、自動Oracle Orachkレポートを介して検出でき、関連するパッチまたは回避策を使用してフラグを設定できます。Oracle Orachkは、既存の製品または新製品の領域における新しいクリティカルな問題を含めるように定期的に拡張されています。

データベース・クライアントに起因するパフォーマンスの問題の例

  • 問題: パラメータ(SGAおよびPGA割当て、セッションまたはプロセスの数、CPU数など)が正しく構成されていないと、データベースのパフォーマンスが低下する場合があります。

    解決策: Oracle OrachkおよびOracle Cluster Health Advisorが、設定と結果をそれぞれ検出し、推奨される修正処理を自動的に通知します。