クラスタ状態モニター(CHM)は、オペレーティング・システムおよびクラスタ・リソースに関連する状態の悪化や障害を検出し、分析します。CHMには、ご使用のクラスタに今後問題が発生した場合のトリアージにMy Oracle Supportとともに使用できる、Oracle Grid Infrastructure管理リポジトリにリアルタイムのオペレーティング・システム・メトリックが格納されています。
この項ではCHMについて説明します。内容は次のとおりです。
システム監視サービス
各ノードには、1つのシステム監視サービスがあります。システム監視サービス(osysmond
)は、監視や、データをクラスタ・ログ出力サービスに送信するオペレーティング・システム・メトリック収集をリアルタイムに行うサービスです。クラスタ・ログ出力サービスによってすべてのノードから情報が受信され、Oracle Grid Infrastructure管理リポジトリのデータベースに保持されます。
クラスタ・ログ出力サービス
クラスタの32ノードごとに1つのクラスタ・ログ出力サービス(OLOGGERD)があります。32ノード(ハブおよびリーフ・ノードの合計であることが可能)を追加するたびに、もう1つのOLOGGERDが生成されます。定められた回数の再試行後にサービスが起動できなかったことや、実行されていたノードが停止したことが原因で、クラスタ・ログ出力サービスに障害が発生すると、Oracle Clusterwareは別のノードでOLOGGERDを起動します。クラスタ・ログ出力サービスは、Oracle Grid Infrastructure管理リポジトリのオペレーティング・システム・メトリック・データベースを管理します。
Oracle Grid Infrastructure管理リポジトリ
Oracle Grid Infrastructure管理リポジトリ
CHMによって収集されたリアルタイムのオペレーティング・システム・メトリックを格納する、Oracle Databaseです。クラスタ上でOracle Clusterware 12cのインストールまたはこれへのアップグレード中に、Oracle Grid Infrastructure管理リポジトリを構成します。
注意:
Oracle ClusterwareをOracle Clusterware 12cにアップグレード中で、Oracle Cluster Registry (OCR)および投票ファイルがRAWまたはブロック・デバイス上に格納されている場合、ご使用のソフトウェアをアップグレードする前に、これらをOracle ASMまたは共有ファイル・システムに移動する必要があります。
クラスタ上の1つのノードで動作し(こOracle Flex Cluster構成のハブ・ノードである必要がある)、ノードやストレージでの障害に備えて別のノードへのフェイルオーバーがサポートされている必要があります。
Oracle Grid Infrastructure管理リポジトリをOLOGGERDと同じノードに配置して、パフォーマンスを向上させ、プライベート・ネットワークのトラフィックを減少できます。
プライベート・ネットワークを介して、あらゆるクラスタ・クライアント(OLOGGERDおよびOCLUMONなど)との通信を行います。Oracle Grid Infrastructure管理リポジトリは、パブリック・ネットワークを介して外部クライアントのみと通信します。
データ・ファイルはOCRおよび投票ファイルと同じディスク・グループにあります。
OCRが+MYDG
というOracle ASMディスク・グループにある場合、構成スクリプトは、Oracle Grid Infrastructure管理リポジトリの格納に同じディスク・グループを使用します。
オラクル社では、Oracle Grid Infrastructure管理リポジトリ(ネットワーク・ファイル・システム(NFS)、クラスタ・ファイル・システム、Oracle ASMディスク・グループなど)に対応するために、Oracle Clusterwareの共有ストレージ要件を増やしました。
サイズおよび保存は、OCLUMONで管理されます。
ノードでGrid_home
/bin/diagcollection.pl
スクリプトを実行することで、クラスタのいずれのノードからでもCHMデータを収集できます。
注意:
diagcollection.pl
スクリプトを実行してCHMデータを収集する場合、クラスタのすべてのノードでスクリプトを実行して、分析に必要なすべての情報を確実に収集します。
権限を持つユーザーとしてこのスクリプトを実行する必要があります。
関連項目:
diagcollection.pl
の詳細は、「診断収集スクリプト」を参照してください
クラスタ・ログ出力サービスが実行中のノードのみでデータ収集スクリプトを実行するには、次の手順を実行します。
次のコマンドを実行して、クラスタ・ログ出力サービスが実行しているノードを識別します。
$ Grid_home/bin/oclumon manage -get master
Gridホームの外部にある書込み可能なディレクトリから、権限を持つユーザーとしてクラスタ・ログ出力サービス・ノードで次のコマンドを実行して、Oracle Grid Infrastructure管理リポジトリで使用できるすべてのデータを収集します。
# Grid_home/bin/diagcollection.pl --collect
Windowsの場合は、次のコマンドを実行します。
C:\Grid_home\perl\bin\perl.exe C:\Grid_home\bin\diagcollection.pl --collect
diagcollection.pl
スクリプトは、次のように、chmosData_
host_name_time_stamp
.tar.gz
というファイルを作成します。
chmosData_stact29_20121006_2321.tar.gz
収集するデータの量を制限するには、次のコマンドを1行で入力します。
# Grid_home/bin/diagcollection.pl --collect --chmos --incidenttime time --incidentduration duration
前述のコマンドでは、--incidenttime
引数の書式はMM/DD/YYYY24HH:MM:SS
で、--incidentduration
引数の書式はHH:MM
です。次に例を示します。
# Grid_home/bin/diagcollection.pl --collect --crshome Grid_home --chmos --incidenttime 07/21/2013 01:00:00 --incidentduration 00:30