クラスタ状態モニター

クラスタ状態モニター(CHM)は、オペレーティング・システムおよびクラスタ・リソースに関連する状態の悪化や障害を検出し、分析します。CHMには、ご使用のクラスタに今後問題が発生した場合のトリアージにMy Oracle Supportとともに使用できる、Oracle Grid Infrastructure管理リポジトリにリアルタイムのオペレーティング・システム・メトリックが格納されています。

この項ではCHMについて説明します。内容は次のとおりです。

CHMサービス

CHMは、次のサービスで構成されています。

システム監視サービス

各ノードには、1つのシステム監視サービスがあります。システム監視サービス(osysmond)は、監視や、データをクラスタ・ログ出力サービスに送信するオペレーティング・システム・メトリック収集をリアルタイムに行うサービスです。クラスタ・ログ出力サービスによってすべてのノードから情報が受信され、Oracle Grid Infrastructure管理リポジトリのデータベースに保持されます。

クラスタ・ログ出力サービス

クラスタの32ノードごとに1つのクラスタ・ログ出力サービス(OLOGGERD)があります。32ノード(ハブおよびリーフ・ノードの合計であることが可能)を追加するたびに、もう1つのOLOGGERDが生成されます。定められた回数の再試行後にサービスが起動できなかったことや、実行されていたノードが停止したことが原因で、クラスタ・ログ出力サービスに障害が発生すると、Oracle Clusterwareは別のノードでOLOGGERDを起動します。クラスタ・ログ出力サービスは、Oracle Grid Infrastructure管理リポジトリのオペレーティング・システム・メトリック・データベースを管理します。

Oracle Grid Infrastructure管理リポジトリ

CHMによって収集されたリアルタイムのオペレーティング・システム・メトリックを格納する、Oracle Databaseです。クラスタ上でOracle Clusterware 12cのインストールまたはこれへのアップグレード中に、Oracle Grid Infrastructure管理リポジトリを構成します。

注意:
Oracle ClusterwareをOracle Clusterware 12cにアップグレード中で、Oracle Cluster Registry (OCR)および投票ファイルがRAWまたはブロック・デバイス上に格納されている場合、ご使用のソフトウェアをアップグレードする前に、これらをOracle ASMまたは共有ファイル・システムに移動する必要があります。
クラスタ上の1つのノードで動作し(こOracle Flex Cluster構成のハブ・ノードである必要がある)、ノードやストレージでの障害に備えて別のノードへのフェイルオーバーがサポートされている必要があります。

Oracle Grid Infrastructure管理リポジトリをOLOGGERDと同じノードに配置して、パフォーマンスを向上させ、プライベート・ネットワークのトラフィックを減少できます。
プライベート・ネットワークを介して、あらゆるクラスタ・クライアント(OLOGGERDおよびOCLUMONなど)との通信を行います。Oracle Grid Infrastructure管理リポジトリは、パブリック・ネットワークを介して外部クライアントのみと通信します。
データ・ファイルはOCRおよび投票ファイルと同じディスク・グループにあります。

OCRが+MYDGというOracle ASMディスク・グループにある場合、構成スクリプトは、Oracle Grid Infrastructure管理リポジトリの格納に同じディスク・グループを使用します。

オラクル社では、Oracle Grid Infrastructure管理リポジトリ(ネットワーク・ファイル・システム(NFS)、クラスタ・ファイル・システム、Oracle ASMディスク・グループなど)に対応するために、Oracle Clusterwareの共有ストレージ要件を増やしました。
サイズおよび保存は、OCLUMONで管理されます。

CHMデータの収集

ノードでGrid_home/bin/diagcollection.plスクリプトを実行することで、クラスタのいずれのノードからでもCHMデータを収集できます。

注意:

diagcollection.plスクリプトを実行してCHMデータを収集する場合、クラスタのすべてのノードでスクリプトを実行して、分析に必要なすべての情報を確実に収集します。
権限を持つユーザーとしてこのスクリプトを実行する必要があります。

関連項目:

diagcollection.plの詳細は、「診断収集スクリプト」を参照してください

クラスタ・ログ出力サービスが実行中のノードのみでデータ収集スクリプトを実行するには、次の手順を実行します。

次のコマンドを実行して、クラスタ・ログ出力サービスが実行しているノードを識別します。
```
$ Grid_home/bin/oclumon manage -get master
```
Gridホームの外部にある書込み可能なディレクトリから、権限を持つユーザーとしてクラスタ・ログ出力サービス・ノードで次のコマンドを実行して、Oracle Grid Infrastructure管理リポジトリで使用できるすべてのデータを収集します。
```
# Grid_home/bin/diagcollection.pl --collect
```
Windowsの場合は、次のコマンドを実行します。
```
C:\Grid_home\perl\bin\perl.exe
C:\Grid_home\bin\diagcollection.pl --collect
```
diagcollection.plスクリプトは、次のように、chmosData_host_name_time_stamp.tar.gzというファイルを作成します。
```
chmosData_stact29_20121006_2321.tar.gz
```

収集するデータの量を制限するには、次のコマンドを1行で入力します。

# Grid_home/bin/diagcollection.pl --collect --chmos
   --incidenttime time --incidentduration duration

前述のコマンドでは、--incidenttime引数の書式はMM/DD/YYYY24HH:MM:SSで、--incidentduration引数の書式はHH:MMです。次に例を示します。

# Grid_home/bin/diagcollection.pl --collect --crshome Grid_home
   --chmos --incidenttime 07/21/2013 01:00:00 --incidentduration 00:30