クラスタ・ノードのシステム・メトリックの監視

4.6 クラスタ・ノードのシステム・メトリックの監視

この章では、Oracle Clusterwareを監視する方法について説明します。

Oracleでは、Oracle Enterprise Managerを使用して、Oracle Clusterwareの日常的な操作を監視することをお薦めします。

クラスタ状態モニターは、オペレーティング・システムを含む完全な技術スタックを監視し、円滑なクラスタ操作を確保します。どちらのコンポーネントも、すべてのOracleクラスタでデフォルトで有効になっています。Oracleでは、両方のコンポーネントを使用することをお薦めします。また、Clusterwareリソース・アクティビティ・ログを使用してOracle Clusterware管理リソースを監視します。

Oracle Enterprise ManagerによるOracle Clusterwareの監視
Oracle Enterprise Managerを使用して、Oracle Clusterware環境を監視します。
クラスタ状態モニターによるOracle Clusterwareの監視
OCLUMONコマンドライン・ツールを使用して、クラスタ状態モニターと対話できます。

親トピック: 診断データの収集

4.6.1 Oracle Enterprise ManagerによるOracle Clusterwareの監視

Oracle Enterprise Managerを使用して、Oracle Clusterware環境を監視します。

クライアントのブラウザを使用してOracle Enterprise Managerにログインすると、クラスタ・データベースのホーム・ページが表示され、ここでOracle Database環境とOracle Clusterware環境の両方のステータスを監視できます。Oracle Clusterwareの監視には、次の詳細が含まれます:

クラスタ・ターゲットに関する、Oracle Enterprise Managerのクラスタ状態モニターの現在のデータと履歴データ
VIPの再配置が発生した場合の通知
クラスタ検証ユーティリティ(CVU)を介して取得した情報を使用する、クラスタの各ノードのOracle Clusterwareのステータス
ノード・アプリケーション(nodeapps)が起動または停止した場合の通知
Oracle Cluster Registryに対するOracle Clusterwareのアラート・ログの問題、投票ファイルの問題(発生した場合)およびノード除去に関する通知

クラスタ・データベースのホーム・ページは、シングル・インスタンスのデータベースのホーム・ページに似ています。ただし、クラスタ・データベースのホーム・ページには、Oracle Enterprise Managerによってシステムの状態と可用性が表示されます。システムの状態および可用性には、アラート・メッセージおよびジョブ・アクティビティのサマリーと、すべてのデータベースおよびOracle Automatic Storage Management (Oracle ASM)インスタンスへのリンクが含まれます。たとえば、すべての優先インスタンスでサービスが実行されていない場合、またはサービス応答時間のしきい値が満たされていない場合など、クラスタのサービスでの問題を追跡します。

Oracle Enterprise Managerの「Interconnects」ページを使用して、Oracle Clusterware環境を監視します。「Interconnects」ページに次の詳細が表示されます:

クラスタ上のパブリック・インタフェースおよびプライベート・インタフェース
プライベートの相互接続での全体的なスループット
各ネットワーク・インタフェースのそれぞれのスループット
エラー率(存在する場合)
インターコネクトのデータベース・インスタンスによるロード
構成の誤りによりデータベース・インスタンスがパブリック・インタフェースを使用している場合の通知
インスタンスごとのインターコネクトのスループット

前述の情報はすべて、履歴ビューを含む収集としても使用できます。履歴ビューは、クラスタの待機イベントに関連する問題を診断する場合など、クラスタ・キャッシュの一貫性と併用すると役立ちます。「Interconnects」ページにアクセスするには、クラスタ・データベースのホーム・ページで、「Interconnect」タブをクリックします。

また、Oracle Enterprise Managerの「Cluster Database Performance」ページには、データベースのパフォーマンス統計のサマリーが表示されます。統計は、グラフにあるクラスタ・データベース内のすべてのインスタンス間でロールアップされます。グラフの横にあるリンクを使用すると、より詳細な情報を表示したり、次のタスクを実行できます:

パフォーマンスの問題の原因の特定
リソースを追加または再配布する必要があるかどうかの判断
SQLプランおよびスキーマのチューニングによる最適化
パフォーマンスの問題の解決

「Cluster Database Performance」ページにあるグラフは次のとおりです:

「Cluster Host Load Average」グラフ: 「Cluster Database Performance」ページの「Cluster Host Load Average」グラフには、データベース外部で発生する可能性がある問題が表示されます。グラフには、過去1時間のクラスタ内で使用可能なノードの最大ロード値、平均ロード値および最小ロード値が表示されます。
「Global Cache Block Access Latency」グラフ: 各クラスタ・データベース・インスタンスのシステム・グローバル領域(SGA)には、固有のバッファ・キャッシュがあります。Oracle RAC環境では、キャッシュ・フュージョンによって論理的に各インスタンスのバッファ・キャッシュを結合し、論理的に結合された単一のキャッシュに存在するデータとして、データベース・インスタンスでデータを処理できます。
「Average Active Sessions」グラフ: 「Cluster Database Performance」ページの「Average Active Sessions」グラフには、データベース内部で発生する可能性がある問題が表示されます。待機クラスと呼ばれる「Categories」には、CPUやディスクI/Oなどのリソースを使用しているデータベースの数が表示されます。CPU時間と待機時間を比較すると、応答時間のうちどれくらいの時間が、他のプロセスで保留にされている可能性のあるリソースを待機するのではなく、有効な作業に消費されているかを確認できます。
「Database Throughput」グラフ: 「Database Throughput」グラフは、「Average Active Sessions」グラフに表示される任意のリソース競合を要約する他、ユーザーやアプリケーションに代わってデータベースが実行中の作業の量を示します。「Per Second」ビューには、1秒当たりのログオン数に対するトランザクションの数とREDOサイズに対する物理読取りの量が表示されます。「Per Transaction」ビューには、トランザクション当たりのREDOサイズに対する物理読取りの量が表示されます。「Logons」は、データベースにログオンしているユーザー数です。

さらに、「Cluster Database Performance」ページにある「Top Activity」ドロップダウン・メニューでは、待機イベント、サービスおよびインスタンス単位でアクティビティを表示できます。また、グラフのスライダで以前の時点に移動し、SQL/セッションの詳細を表示することもできます。

親トピック: クラスタ・ノードのシステム・メトリックの監視

4.6.2 クラスタ状態モニターによるOracle Clusterwareの監視

OCLUMONコマンドライン・ツールを使用して、クラスタ状態モニターと対話できます。

OCLUMONはクラスタ状態モニターに付属しています。指定した期間のノード固有のメトリックを表示するには、これを使用してクラスタ状態モニター・リポジトリを問い合せます。また、OCLUMONは、次のような様々な管理タスクを実行する場合にも使用できます:

oclumon debugコマンドを使用したデバッグ・レベルの変更
oclumon versionコマンドを使用したクラスタ状態モニターのバージョンの問合せ
oclumon dumpnodeviewコマンドを使用した、収集された情報のノード・ビューの形式での表示
oclumon manageコマンドを使用したメトリック・データベース・サイズの変更

親トピック: クラスタ・ノードのシステム・メトリックの監視