4.5 オペレーティング・システム・リソースのメトリックの収集
CHMは大量のオペレーティング・システム・メトリックを収集、分析、集計および格納する高パフォーマンスの軽量デーモンであり、システムの問題の診断およびトラブルシューティングに役立ちます。
Oracle Cluster Health Monitorをローカル・モードで動作するよう構成し、oclumon dumpnodeview local
コマンドを使用してオペレーティング・システム・メトリックをレポートできるようになりました。
ローカル・モードでは、ローカル・ノード・データのみを取得できます。
サポートされているプラットフォーム
Linux、Microsoft Windows、Solaris、AIX、IBM Z SeriesおよびARM
CHMがユニークである理由
CHM | 一般的なOSコレクタ |
---|---|
最終的な選択肢 - デーモンはロック済メモリーを実行し、RTスケジューリング・クラスによってシステム負荷に対してもデータ収集の一貫性を維持します。 |
システム負荷によるスケジュール遅延に起因する一貫性のないデータ・ドロップアウト。 |
5秒という忠実度の高いデータ・サンプリング・レート。サンプリング・レート5秒という、非常に低いリソース使用率プロファイル。 |
複数ユーティリティの実行により、監視対象システムへの追加のオーバーヘッド発生とそれによるサンプリング・レートが上昇し、悪化します。 |
高可用性デーモンにより、複数のリソース・カテゴリにわたって照合済データが収集されます。高度に最適化されたコレクタ(データはユーティリティと同じソースであるオペレーティング・システムから直接読み取られます)。 |
|
収集されたデータは、サンプルごとにシステム・スナップショットの概要(Nodeview)に照合され、Nodeviewには複数のリソース・カテゴリに収集されたデータの要約および分析も含まれます。 |
様々なリソース・カテゴリにおよぶシステム・スナップショットの概要は、照合が非常に困難です。 |
Nodeviewへのデータの収集および照合時の有用なインライン分析とサマリーにより、面倒な手作業の時間がかかる分析が大幅に減少し、有意義なインサイトが得られます。 |
複数のファイルにわたる様々なユーティリティの出力を照合、解析、解釈し、その後で有用なインサイトについて分析する必要があるため、この分析には時間がかかり、処理が集中します。 |
Clusterware固有のメトリック収集(プロセス集計、ASM/OCR/VDディスク・タグ付け、プライベート/パブリックNICタグ付け)を実行します。また、詳細なデータ分析とビジュアライゼーションのための豊富なツールセットも提供します。 |
なし |
- クラスタ状態モニター・サービスの理解
クラスタ状態モニターでは、システム監視サービス(osysmond
)を使用してオペレーティング・システム・メトリックを収集します。 - クラスタ状態モニター・データの収集
クラスタ内の任意のノードから、クラスタ状態モニター・データを収集します。 - クラスタ状態モニターによって収集されるオペレーティング・システム・メトリック
CHMによって収集されるメトリックを確認します。 - コンポーネント障害の検出および自律的な自己修復
コンポーネントの障害を検出する機能を向上させ、自律的な自己修復によってビジネス継続性を改善します。 - Enterprise Manager Cloud Controlからのクラスタ状態モニターの使用
リアルタイム・モードおよび履歴モードで表示されるヒストグラムを使用して、状態の悪化や障害の発生時に何が起こったのかを正確に理解できます。
親トピック: 診断データの収集
4.5.1 クラスタ状態モニター・サービスの理解
クラスタ状態モニターでは、システム監視サービス(osysmond
)を使用してオペレーティング・システム・メトリックを収集します。
システム監視サービスについて
システム監視サービス(osysmond
)は、各クラスタ・ノードで実行される監視およびオペレーティング・システム・メトリック収集のリアルタイム・サービスです。システム監視サービスは、High Availability Service (HAS)のリソースとして管理されます。クラスタ・ログ出力サービスは、そのデータをOracle Grid Infrastructure管理リポジトリのデータベースに格納します。
また、osysmond
は、収集されたオペレーティング・システム・メトリックをORACLE_BASEのディレクトリの下に保持します。
メトリック・リポジトリは、ローカル・ファイルシステムで自動管理されます。リポジトリの場所とサイズは変更できます。
- Nodeviewサンプルは、常にリポジトリ(JSONレコード)に書き込まれます
- 履歴データは1時間ごとのzipファイルに自動アーカイブされます
- アーカイブされたファイルは、デフォルトの保存制限に達すると自動的にパージされます(デフォルト: 200 MB)
親トピック: オペレーティング・システム・リソースのメトリックの収集
4.5.2 クラスタ状態モニター・データの収集
クラスタ内の任意のノードから、クラスタ状態モニター・データを収集します。
Oracleでは、Oracle Clusterwareエラーが発生したときに、tfactl diagcollect
コマンドを実行して診断データを収集することをお薦めします。
親トピック: オペレーティング・システム・リソースのメトリックの収集
4.5.3 クラスタ状態モニターによって収集されるオペレーティング・システム・メトリック
CHMによって収集されるメトリックを確認します。
メトリックの概要
CHMは、収集されたオペレーティング・システム・データをNodeviewにグループ化します。Nodeviewはメトリック・セットのグループで、各メトリック・セットには一意のシステム・リソースの詳細なメトリックが含まれます。
メトリック・セットの簡単な説明は次のとおりです:
- CPUメトリック・セット: 使用率でソートされた上位127のCPUのメトリック
- デバイス・メトリック・セット: ASM/VD/OCRを含む127のデバイスと、平均待機時間の長いのデバイスのメトリック
- プロセス・メトリック・セット: 127のプロセスのメトリック
- 上位25のCPUコンシューマ(アイドル・プロセスはレポートされません)
- 上位25のメモリー・コンシューマ(RSS <合計RAMの1%のものはレポートされません)
- 上位25のI/Oコンシューマ
- 上位25のファイル記述子コンシューマ(上位inodeコンシューマを識別できます)
- プロセス集計: すべてのOracle DatabaseおよびOracle ASMインスタンスのフォアグラウンド・プロセスおよびバックグラウンド・プロセス別に要約されたメトリック
- ネットワーク・メトリック・セット: パブリックおよびプライベート・インターコネクトを含む16のNICSのメトリック
- NFSメトリック・セット: ラウンド・トリップ時間でソートされた32 NFSのメトリック
- プロトコル・メトリック・セット: プロトコル・グループTCP、UDPおよびIPのメトリック
- ファイルシステム・メトリック・セット: ファイルシステム使用率のメトリック
- クリティカル・リソース・メトリック・セット: クリティカルなシステム・リソース使用率のメトリック
- CPUメトリック: システム全体のCPU使用率の統計
- メモリー・メトリック: システム全体のメモリー統計
- デバイス・メトリック: 個別デバイスのメトリック・セットとは異なるシステム全体のデバイス統計
- NFSメトリック: 30秒ごとに収集されるNFSデバイスの総数
- プロセス・メトリック: システム全体の一意のプロセス・メトリック
CPUメトリック・セット
使用率でソートされた、すべてのCPUコアからのメトリックが含まれます。
表4-14 CPUメトリック・セット
メトリック名(単位) | 説明 |
---|---|
system [%] | システム・レベル(カーネル)で実行中にエラーが発生したときのCPU使用率。 |
user [%] | ユーザー・レベル(アプリケーション)で実行中にエラーが発生したときのCPU使用率。 |
usage [%] | 合計使用率(system[%] + user[%])。 |
nice [%] | niceの優先度のユーザー・レベルで実行中にエラーが発生したときのCPU使用率。 |
ioWait [%] | CPUがアイドルで、システムに未処理のディスクI/Oリクエストがあった時間の割合。 |
steal [%] | ハイパーバイザが別の仮想プロセッサを処理している間に仮想CPUが強制的に待機となった時間の割合。 |
デバイス・メトリック・セット
サービス時間(ミリ秒)でソートされた、すべてのディスク・デバイス/パーティションからのメトリックが含まれます。
表4-15 デバイス・メトリック・セット
メトリック名(単位) | 説明 |
---|---|
ioR [KB/s] | デバイスから読み取られたデータ量。 |
ioW [KB/s] | デバイスに書き込まれたデータ量。 |
numIOs [#/s] | 平均ディスクI/O操作。 |
qLen [#] | I/Oキューに入っている、待機状態にあるリクエストの数。 |
aWait [msec] | I/Oごとの平均待機時間。 |
svcTm [msec] | I/Oリクエストごとの平均サービス時間。 |
util [%] | デバイスの使用率(iostat -x コマンドの'%util メトリックと同じです。デバイスがアクティブだった時間の割合を表します)。
|
プロセス・メトリック・セット
すべてのシステム・プロセスにおいて計算される集計メトリック・データの複数のカテゴリが含まれます。
表4-16 プロセス・メトリック・セット
メトリック名(単位) | 説明 |
---|---|
pid | プロセスID。 |
pri | プロセス優先度(オペレーティング・システムからのraw値)。 |
psr | プロセスが現在割り当てられている、または実行されているプロセッサ。 |
pPid | 親プロセスID。 |
nice | プロセスのnice値。 |
state | プロセスの状態。たとえば、R->Running 、S->Interruptible sleep などです。
|
class | プロセスのスケジューリング・クラス。たとえば、RR->RobinRound 、FF->First in First out 、B->Batch scheduling などです。
|
fd [#] | 30秒ごとに更新される、このプロセスでオープンしているファイル記述子の数。 |
name | プロセスの名前。 |
cpu [%] | コア全体のプロセスCPU使用率。たとえば、50% => シングル・コアの50%、400% => の100%の使用率です。 |
thrds [#] | このプロセスによって作成されたスレッドの数。 |
vmem [KB] | プロセスの仮想メモリー使用量(KB)。 |
shMem [KB] | プロセスの共有メモリー使用量(KB)。 |
rss [KB] | プロセス・メモリー固有の設定サイズ(KB)。 |
ioR [KB/s] | 1秒当たりのI/O読取り(KB単位)。 |
ioW [KB/s] | 1秒当たりのI/O書込み(KB単位)。 |
ioT [KB/s] | 1秒当たりのI/O合計(KB単位)。 |
cswch [#/s] | 1秒当たりのコンテキストの切替え。いくつかの重要なOracle Databaseプロセスについてのみ収集されます。 |
nvcswch [#/s] | 1秒当たりの強制的なコンテキスト切替え。いくつかの重要なOracle Databaseプロセスについてのみ収集されます。 |
cumulativeCpu [ms] | プロセスでこれまでに使用されたCPUの量(ミリ秒)。 |
NICメトリック・セット
合計速度/秒(KB)でソートされた、すべてのネットワーク・インタフェースからのメトリックが含まれます。
表4-17 NICメトリック・セット
メトリック名(単位) | 説明 |
---|---|
name | インタフェースの名前。 |
tag | インタフェースのタグ(例: public、privateなど)。 |
mtu [B] | インタフェースでサポートされている最大転送単位のサイズ(バイト)。 |
rx [Kbps] | 平均ネットワーク受信速度。 |
tx [Kbps] | 平均ネットワーク送信速度。 |
total [Kbps] | 平均ネットワーク送信速度(rx[Kb/s] + tx[Kb/s])。 |
rxPkt [#/s] | 平均受信パケット・レート。 |
txPkt [#/s] | 平均送信パケット・レート。 |
pkt [#/s] | パケットの平均送信レート(rxPkt[#/s] + txPkt[#/s])。 |
rxDscrd [#/s] | 受信パケットの平均ドロップ/破棄レート。 |
txDscrd [#/s] | 送信パケットの平均ドロップ/破棄レート。 |
rxUnicast [#/s] | 受信ユニキャスト・パケットの平均レート。 |
rxNonUnicast [#/s] | 受信マルチキャスト・パケットの平均レート。 |
dscrd [#/s] | 合計破棄パケットの平均レート(rxDscrd + txDscrd)。 |
rxErr [#/s] | 受信パケットの平均エラー率。 |
txErr [#/s] | 送信パケットの平均エラー率。 |
Err [#/s] | 合計転送の平均エラー率(rxErr[#/s] + txErr[#/s])。 |
NFSメトリック・セット
ラウンド・トリップ時間でソートされた、上位32のNFSが含まれます。このメトリック・セットは30秒ごとに1回収集されます。
表4-18 NFSメトリック・セット
メトリック名(単位) | 説明 |
---|---|
op [#/s] | ファイルシステムに発行された、1秒当たりの読取り/書込み操作の数。 |
bytes [#/sec] | ファイルシステムからの1秒当たりの読取り/書込みバイト数。 |
rtt [s] | これは、クライアントのカーネルがRPCリクエストを送信してから応答を受信するまでの期間です。 |
exe [s] | これは、NFSクライアントがカーネルに対してRPCリクエストし、そのRPCリクエストが完了するまでの期間です。これには前述のRTT時間が含まれます。 |
retrains [%] | これは再送信の頻度(%)です。 |
プロトコル・メトリック・セット
プロトコル・グループTCP、UDPおよびIPの特定のメトリックが含まれます。メトリック値はシステムの起動からの累積です。
表4-19 TCPメトリック・セット
メトリック名(単位) | 説明 |
---|---|
failedConnErr [#] | TCP接続がSYN-SENT状態またはSYN-RCVD状態からCLOSED状態に直接遷移した回数と、TCP接続がSYN-RCVD状態からLISTEN状態に直接遷移した回数。 |
estResetErr [#] | TCP接続がESTABLISHED状態またはCLOSE-WAIT状態からCLOSED状態に直接遷移した回数。 |
segRetransErr [#] | 再送信されたTCPセグメントの合計数。 |
rxSeg [#] | TCPレイヤーで受信されたTCPセグメントの合計数。 |
txSeg [#] | TCPレイヤーから送信されたTCPセグメントの合計数。 |
表4-20 UDPメトリック・セット
メトリック名(単位) | 説明 |
---|---|
unkPortErr [#] | 宛先ポートにアプリケーションが存在しなかった受信済データグラムの合計数。 |
rxErr [#] | 宛先ポートにアプリケーションが存在しないこと以外の理由で配信できなかった受信済データグラムの数。 |
rxPkt [#] | 受信した合計パケット数。 |
txPkt [#] | 送信されたパケットの合計数。 |
表4-21 IPメトリック・セット
メトリック名(単位) | 説明 |
---|---|
ipHdrErr [#] | IPv4ヘッダー内のエラーのため破棄された入力データグラムの数。 |
addrErr [#] | IPv4ヘッダーの宛先フィールドのIPv4アドレスが、このエンティティで受信できる有効なアドレスではなかったために破棄された入力データグラムの数。 |
unkProtoErr [#] | 正常に受信されたものの、プロトコルが不明またはサポートされていないために破棄された、ローカルにアドレス指定されたデータグラムの数。 |
reasFailErr [#] | IPv4の再アセンブリ・アルゴリズムによって検出された障害の数。 |
fragFailErr [#] | フラグメンテーション・エラーのため破棄されたIPv4データグラムの数。 |
rxPkt [#] | IPレイヤーで受信したパケットの合計数。 |
txPkt [#] | IPレイヤーから送信したパケットの合計数。 |
ファイルシステム・メトリック・セット
ファイルシステム使用率のメトリックが含まれます。GRID_HOMEファイルシステムについてのみ収集されます。
表4-22 ファイルシステム・メトリック・セット
メトリック名(単位) | 説明 |
---|---|
mount | マウント・ポイント。 |
type | ファイルシステム・タイプ(例: etx4)。 |
tag | ファイルシステム・タグ(例: GRID_HOME)。 |
total [KB] | 領域の合計容量(KB)。 |
used [KB] | 使用済領域の量(KB)。 |
avbl [KB] | 使用可能な領域の量(KB)。 |
used [%] | 使用済領域の割合。 |
ifree [%] | 空きファイル・ノードの割合。 |
システム・メトリック・セット
クリティカル・システム・リソース使用率のメトリック・セットのサマリーが含まれます。
表4-23 CPUメトリック
メトリック名(単位) | 説明 |
---|---|
pCpus [#] | システム内の物理処理ユニットの数。 |
Cores [#] | システム内のすべてのCPUのコア数。 |
vCpus [#] | システム内の論理処理ユニットの数。 |
cpuHt | CPUのハイパースレッディングが有効(Y)か無効(N)か。 |
osName | オペレーティング・システムの名前。 |
chipName | 処理ユニットのチップの名前。 |
system [%] | システム・レベル(カーネル)で実行中にエラーが発生したときのCPU使用率。 |
user [%] | ユーザー・レベル(アプリケーション)で実行中にエラーが発生したときのCPU使用率。 |
usage [%] | 合計CPU使用率(system[%] + user[%])。 |
nice [%] | NICEの優先度のユーザー・レベルで実行中にエラーが発生したときのCPU使用率。 |
ioWait [%] | CPUがアイドルで、システムに未処理のディスクI/Oリクエストがあった時間の割合。 |
Steal [%] | ハイパーバイザが別の仮想プロセッサを処理している間に仮想CPUが強制的に待機となった時間の割合。 |
cpuQ [#] | 現在のサンプル間隔内で、実行キューで待機中のプロセスの数。 |
loadAvg1 | 計算された1分間のシステムの平均負荷。 |
loadAvg5 | 計算された5分間のシステムの平均負荷。 |
loadAvg15 | 計算された15分間のシステムの平均負荷。平均負荷が高いということは、システムがオーバーロードされ、多くのプロセスがCPU時間を待機していることを示します。 |
Intr [#/s] | システムで1秒間に発生した割込みの数。 |
ctxSwitch [#/s] | システムで1秒間に発生したコンテキスト切替えの数。 |
表4-24 メモリー・メトリック
メトリック名(単位) | 説明 |
---|---|
totalMem [KB] | 使用可能なRAMの合計容量(KB)。 |
freeMem [KB] | RAMの空き容量(KB)。 |
avblMem [KB] | スワップせずに新しいプロセスを開始するのに使用できるメモリーの量。 |
shMem [KB] | tmpfsによって(主に)使用されているメモリー。 |
swapTotal [KB] | 物理スワップ・メモリーの合計量(KB)。 |
swapFree [KB] | スワップ・メモリーの空き容量(KB)。 |
swpIn [KB/s] | 現在のサンプル間隔内での平均スワップ・イン率(KB/秒)。 |
swpOut [KB/s] | 現在のサンプル間隔内での平均スワップ・アウト率(KB/秒)。 |
pgIn [#/s] | 現在のサンプル間隔内での平均ページ・イン率(ページ/秒)。 |
pgOut [#/s] | 現在のサンプル間隔内での平均ページ・アウト率(ページ/秒)。 |
slabReclaim [KB] | キャッシュなど、再利用される可能性のあるスラブの部分。 |
buffer [KB] | カーネル・バッファにより使用されているメモリー。 |
Cache [KB] | ページ・キャッシュおよびスラブで使用されているメモリー。 |
bufferAndCache [KB] | バッファおよびキャッシュの合計サイズ(buffer[KB] + Cache[KB])。 |
hugePageTotal [#] | 現在のサンプル間隔でシステム内に存在するヒュージ・ページの合計数。 |
hugePageFree [KB] | 現在のサンプル間隔でシステム内に存在する空きヒュージ・ページの合計数。 |
hugePageSize [KB] | オペレーティング・システムのバージョンに応じた1つのヒュージ・ページのサイズ(KB)。通常は、特定のホストのすべてのサンプルで同じです。 |
表4-25 デバイス・メトリック
メトリック名(単位) | 説明 |
---|---|
disks [#] | システムで構成されているディスクの数。 |
ioR [KB/s] | すべてのデバイスの読取り速度集計。 |
ioW [KB/s] | すべてのデバイスの書込み速度集計。 |
numIOs [#/s] | すべてのデバイスのI/O操作速度集計。 |
表4-26 NFSメトリック
メトリック名(単位) | 説明 |
---|---|
nfs [#] | NFSデバイス合計数。 |
表4-27 プロセス・メトリック
メトリック名(単位) | 説明 |
---|---|
fds [#] | システム内のオープン・ファイル構造体の数。 |
procs [#] | プロセスの数。 |
rtProcs [#] | リアルタイム・プロセスの数。 |
procsInDState | 中断不可能なスリープ状態のプロセスの数。 |
sysFdLimit [#] | ファイル構造体の数に対するシステム制限。 |
procsOnCpu [#] | CPUで現在実行中のプロセスの数。 |
procsBlocked [#] | I/O操作の完了など、一部のイベント/リソースが使用可能になるのを待機しているプロセスの数。 |
プロセス集計メトリック・セット
プロセス・グループごとのすべてのプロセスの集計メトリックが含まれます。
表4-28 プロセス集計メトリック・セット
メトリック名(単位) | 説明 |
---|---|
DBBG | ユーザーのOracle Databaseバックグラウンド・プロセス・グループ。 |
DBFG | ユーザーのOracle Databaseフォアグラウンド・プロセス・グループ。 |
MDBBG | MGMTDBバックグラウンド・プロセス・グループ。 |
MDBFG | MGMTDBフォアグラウンド・プロセス・グループ。 |
ASMBG | ASMバックグラウンド・プロセス・グループ。 |
ASMFG | ASMフォアグラウンド・プロセス・グループ。 |
IOXBG | IOSバックグラウンド・プロセス・グループ。 |
IOXFG | IOSフォアグラウンド・プロセス・グループ。 |
APXBG | APXバックグラウンド・プロセス・グループ。 |
APXFG | APXフォアグラウンド・プロセス・グループ。 |
CLUST | Clusterwareプロセス・グループ。 |
OTHER | デフォルト・グループ。 |
次のメトリックがグループごとに集計され、グループ・サマリーがレポートされます。
メトリック名(単位) | 説明 |
---|---|
processes [#] | グループ内のプロセスの合計数。 |
cpu [%] | 集計されたCPU使用率。 |
rss [KB] | 集計された物理メモリー使用量。 |
shMem [KB] | 集計された共有メモリー使用量。 |
thrds [#] | 集計されたスレッド数。 |
fds [#] | 集計されたオープン・ファイル記述子。 |
cpuWeight [%] | マシンの全体のCPU使用率におけるグループの割合。 |
親トピック: オペレーティング・システム・リソースのメトリックの収集
4.5.4 コンポーネント障害の検出および自律的な自己修復
コンポーネントの障害を検出する機能を向上させ、自律的な自己修復によってビジネス継続性を改善します。
クラスタ状態モニターは、保留中または実際の障害を示す重要なコンポーネント・イベントを識別し、修正処理の推奨事項を提示する診断機能を導入します。このようなアクションが自律的に実行される場合があります。このようなイベントおよびアクションが取得されると、管理者はOracle Trace File Analyzerなどのコンポーネントを介して通知されます。
診断機能に関連する用語
CHMDiag: CHMDiag
はosysmond
によって管理されるpythonデーモンであり、イベントをリスニングし、アクションを実行します。CHMDiag
が様々なイベントまたはアクションを受信すると、これらのアクションが正しいかどうかを検証、フロー制御し、アクションの実行をスケジュールします。CHMDiag
は、各アクションを完了まで監視し、そのアクションに設定した固有の時間よりも時間がかかる場合にアクションを終了します。
このJSONファイルは、すべてのイベントまたはアクションと、それぞれの属性を記述します。すべてのイベントまたはアクションには、一意に識別可能なIDがあります。このファイルには、様々なアクションまたはイベントに対して構成可能な各種プロパティも含まれます。CHMDiag
は、起動時にこのファイルをロードします。
CRFE API: CRFE APIは、CHMDiag
にイベントを送信するために、すべてのCクライアントで使用されます。このAPIは、コンポーネント(RDBMS、CSS、GIPC)などの内部クライアントでイベントまたはアクションを公開するために使用されます。
また、このAPIではイベントの同期公開と非同期公開の両方をサポートできます。イベントの非同期公開は、バックグラウンド・スレッドを介して行われます。バックグラウンド・スレッドは、プロセス内のすべてのCRFE APIクライアントで共有されます。
CHMDIAG_BASE: このディレクトリはORACLEB_BASE/hostname/crf/chmdiag
にあります。このディレクトリ・パスには次のディレクトリが含まれており、CHMDiag
によって移入または管理されます。
- ActionsResults: 起動されたすべてのアクションのすべての結果と、各アクションのサブディレクトリが含まれます。
- EventsLog:
CHMDiag
で受信したすべてのイベントまたはアクションのログと、それぞれのアクション結果の場所が含まれます。これらのログ・ファイルは、固定サイズに達した後も自動ローテーションされます。 - CHMDiagLog:
CHMDiag
デーモン・ログが含まれます。ログ・ファイルは、特定のサイズに達した後に自動ローテーションされます。ログには、CHMDiag
で発生する問題を診断するための十分なデバッグ情報が記載されます。 - Config:
CHMDiag
プロセスのpid
ファイル管理の実行サブディレクトリが含まれます。
- oclumon chmdiag description:
oclumon chmdiag description
コマンドを使用して、サポートされているすべてのイベントおよびアクションの詳細な説明を取得します。 - oclumon chmdiag query:
oclumon chmdiag query
コマンドを使用して、様々なコンポーネントによって送信されたCHMDiagイベントまたはアクションを問い合せ、HTMLまたはテキスト・レポートを生成します。 - oclumon chmdiag collect:
oclumon chmdiag collect
コマンドを使用して、CHMDiag
で生成されたすべてのイベントまたはアクションのデータを、指定の出力ディレクトリの場所に収集します。
4.5.5 Enterprise Manager Cloud Controlからのクラスタ状態モニターの使用
リアルタイム・モードおよび履歴モードで表示されるヒストグラムを使用して、状態の悪化や障害の発生時に何が起こったのかを正確に理解できます。
クラスタ状態モニターからのメトリック・データは、Enterprise Manager Cloud Control内のグラフィック表示で使用できます。このデータの完全なクラスタ・ビューには、クラスタ・ターゲット・ページからアクセスできます。「Cluster」メニューから「Cluster Health Monitoring」メニュー項目を選択すると、クラスタ状態モニターの資格証明を要求するログイン画面が表示されます。固定のEMUSERがあり、パスワードはユーザーが指定します。資格証明が保存されると、クラスタ全体について、過去1日のクラスタ状態モニター・データを概要として表示できます。メトリックのカテゴリは、「CPU」、「Memory」および「Network」です。
各カテゴリは、より詳細な個別表示にして、追加のメトリックも表示できます。たとえば、「CPU」を選択すると、クラスタ・グラフに「CPU System Usage」、「CPU User Usage」および「CPU Queue Length」の詳細が表示されます。どのクラスタ・ビューからも、個々のノード・ビューを選択して、単一サーバーのパフォーマンスをより詳細に調査できます。CPUの場合は、各コアのパフォーマンスが表示されます。グラフに沿ってカーソルを動かし、そのポイントの数値およびタイムスタンプを表示するツールチップを確認します。
現在日のパフォーマンスの調査に加えて、履歴データを確認することもできます。履歴データの量は、グリッド・インフラストラクチャ管理リポジトリのクラスタ状態モニター・リポジトリに構成されている保存時間で制御され、デフォルトで72時間に設定されています。このビューは、「View Mode」ドロップダウン・メニューで「Historical」を選択すればいつでも選ぶことができます。前の日付は入力するか、データが使用可能な日が太字になっているポップアップ・カレンダから選択できます。「Show Chart」を選択すると、関連するメトリック・グラフが表示されます。
クラスタ状態モニター・データを表示するには:
親トピック: オペレーティング・システム・リソースのメトリックの収集