4.8 sosreportおよびOracle ExaWatcherによるシステム診断データの収集

sosreportユーティリティとOracle ExaWatcherを使用すると、システムの問題を診断できます。

サーバーを起動するたびに、システム全体の構成情報がsosreportユーティリティによって収集され、/var/log/cellos/sosreportsディレクトリに格納されます。新規sosreportを生成するには、rootユーザーとして次のコマンドを実行します。コマンドを入力してから30分後に、スクリプトによって情報の収集が開始されます。

/opt/oracle.cellos/vldrun -script sosreport

また、/opt/oracle.ExaWatcherディレクトリには、Oracle ExaWatcherシステム・データ収集およびレポート・ユーティリティが含まれています。収集されたデータは、アーカイブ・サブディレクトリに格納されます。次の表は、ユーティリティによって異なる間隔で収集されるデータについて説明しています。

表4-4 Oracle ExaWatcherのコレクタ名と説明

コレクタ名 説明

CellSrvStat

セル・サーバーのステータス。

Diskinfo

ディスクのI/O統計情報(正常に完了した読取り、マージされた読取り、読取りに要する時間など)。

FlashSpace

フラッシュ・カード領域のRAW値。

最小間隔許容値は300秒です。

IBCardInfo

(現在、X8Mシステムでは使用できません)

RDMAネットワーク・ファブリック・カード情報およびInfiniBandネットワーク・ファブリック・ポートのステータス。

最小間隔は300秒です。

IBprocs

RDMAネットワーク・ファブリック・カードのステータスをチェックするコマンド。

最小間隔は600秒です。

Iostat

CPU統計情報、およびデバイスとパーティションのI/O統計情報。

Lsof

現在のプロセスによって開かれたファイル数。

最小間隔許容値は120秒です。

MegaRaidFW

MegaRaidファームウェア情報(バッテリ情報など)。

最小間隔は86400秒です。

Meminfo

カーネルによるメモリー管理。

Mpstat

マイクロプロセッサ統計情報。

Netstat

現在のネットワーク接続統計情報。

Ps

アクティブ・プロセス統計情報。

RDSinfo

セル・サーバーの可用性。

間隔許容値は30秒です。

Slabinfo

カーネルで頻繁に使用されるオブジェクト用のキャッシュ。

Top

システムの動的なリアルタイム表示。

Vmstat

仮想メモリーのステータス。

Oracle ExaWatcherを使用するには、次の手順を実行します。

  1. rootユーザーとして、Oracle ExaWatcherプロセスおよびサービスを起動します。

    # systemctl start ExaWatcher
  2. rootユーザーとしてOracle ExaWatcherユーティリティを実行します。

    /opt/oracle.ExaWatcher/ExaWatcher.sh [options]
    

次のオプションは、Oracle ExaWatcherユーティリティで使用できます。

オプション 説明

オプションの指定なし

ユーティリティはデフォルトのオプション値を使用して実行されます。

-c | --command 'collector_name ;; "default_command; ... " '

現在のグループで実行されているコア・コマンドを変更します。変更できるのは次のコア・コマンドのみです。

CellSrvStat

Iostat

Mpstat

Netstat

Ps

Top

Vmstat

例: --command 'Vmstat;; "vmstat -a"'

--createconf "config_file_to_create" | null

ユーティリティは、すべてのコマンドライン入力を解析して検証し、構成ファイルを作成します。ファイルのパスと名前を指定していない場合は、ユーティリティによりデフォルトの構成ファイルが上書きされます。

-d | --disable "collector_name"

ユーティリティで無効にするコレクタの名前。

例: --disable "Vmstat"

-e | --end "end_time"

現在のグループの終了時刻。デフォルト値は、現在の時刻から10年後です。

例: --end "11/06/2013 12:01:00"

--fromconf "configuration_file" | null

Oracle ExaWatcherユーティリティで使用する構成ファイル。デフォルトの構成ファイルは次のとおりです。

Oracle Linuxの場合: /opt/oracle.ExaWatcher/ExaWatcher.conf

-g | --group

データを収集するための新しいグループを起動します。その他のオプションは、groupオプションで指定できます。

-h | --help

ヘルプ情報を表示します。

-i | --interval "interval_length"

現在のグループのサンプリング間隔(秒)。デフォルト値は5秒です。

特定の収集モジュールについては、リソースを消費するため、毎秒実行することはできません。

例: --interval 10

-l | --spacelimit

ユーティリティが使用する記憶領域の許容値を設定します。許容値はMB単位で指定します。データベース・サーバーでは、デフォルトは6 GBです。ストレージ・サーバーでは、デフォルトは600 MBです。

例: --spacelimit 900

--lastconf

ユーティリティで使用される最新の構成ファイル。

このオプションを指定すると、データは収集されません。

--listcmd "Full"|"Nameonly"|"Core"|"CMD"|"Enabled"|null

コマンド入力に関する情報。オプションは次のとおりです。

Full: コマンドおよびサンプラに関するすべての情報を表示します。

Nameonly: すべての名前および有効であるかどうかを表示します。

Core: コア・サンプラ情報のみを表示します。

CMD: 名前、有効であるかどうか、デフォルトのコマンドを表示します。

-m | --commandmode {"ALL" | "CORE" | "SELECTED"}

現在のグループで実行する収集モジュールのタイプ。オプションは次のとおりです。

ALL: すべての収集モジュールを実行します。

CORE: コア収集モジュールのみを実行します。

SELECTED: 指定した収集モジュールのみを実行します。

デフォルト値はALLです。

例: --commandmode "CORE"

-o | --count "archiving_count"

現在のグループのアーカイブ数。デフォルト値は720です。

例: --count 500

-r | --resultdir "result_directory"

データ収集の結果を格納するディレクトリのパス。

例: --r "/opt/oracle.ExaWatcher/archive"

--stop

ユーティリティとそのすべてのプロセスを停止し、データ・ファイルを圧縮します。

-t | --start "start_time"

現在のグループの開始時刻。デフォルト値は、現在の時刻から20秒後です。

例: --start "11/05/2013 12:00:00"

-u | --customcmd 'sample_name ;; "custom_command;... " '

現在のグループにカスタム収集モジュールを含めます。

例: --customcmd 'Lsl; "/bin/ls -l"'

-z | --zip "bzip2" "gzip"

収集データで使用する圧縮プログラム。デフォルトのプログラムはbzip2です。

例: --zip "gzip"