edd.emc ファイルは ASCII ファイルです。システムが特定のイベントをどのように監視するかは、このファイルによって指定されます。システムごとに必ず 1 つの EMC ファイルがあります。
EMC ファイルは、ssp_config(1M) コマンドの実行時に、テンプレートファイルに基づいて作成されます。テンプレートファイルは、$SSPVAR/.ssp_private/templates/Ultra-Enterprise-10000 に edd.emc という名前で格納されています。
EMC ファイルの各行は、それぞれ次のような形式になっています。
event_type : load_event_monit |
上記で
イベントの種類を示すニモニック (名前の文字列) です。下記の「使用例」を参照してください。
有効か無効かのキーワードです。有効 (enabled) にすると、CBE 上のイベントタイプに応じたイベント監視スクリプトが読み込まれます。無効 (disabled) にすると、イベント監視スクリプトは読み込まれません。
各フィールドはコロンで区切られます。コロンの左右にはスペースを入れても入れなくてもかまいません。ハッシュ記号 (#) で始まる行はコメントであり、構文解析の対象とはなりません。edd.emc ファイルの内容は次のように設定されています。
システムボードの温度イベント
システムボードの電圧イベント
制御ボードの温度イベント
制御ボードの電圧イベント
センタープレーンの温度イベント
センタープレーンの電圧イベント
センタープレーンサポートボードの温度イベント
センタープレーンサポートボードの電圧イベント
ホスト回復イベント
その他のイベント
sys_brd_temp_norm : enabled #ボードの温度が過熱状態から通常温度に戻りました。 sys_brd_temp_warn : enabled #システムボードの温度が警告値を超過しました。 sys_brd_temp_max : enabled #システムボードの温度の最大値を超過しました。 sys_brd_temp_911 : enabled #システムボードの温度がしきい値 911 を超過しました。 sys_brd_temp_bad : enabled #システムボードの温度を読み取ることができません。 sys_brd_temp_change : enabled #システムボードの温度があらかじめ定められた値だけ変化しました。 |
sys_brd_volt_norm : enabled #電圧の最大値・最小値・不明値が通常値に戻りました。 sys_brd_volt_max : enabled #システムボードの電圧が最大値を超過しました。 sys_brd_volt_min : enabled #システムボードの電圧が最小値を下回りました。 sys_brd_volt_bad : enabled #システムボードの電圧を読み取ることができません。 sys_brd_volt_change : enabled #システムボードの電圧があらかじめ定められた値だけ変化しました。 |
cb_temp_norm : enabled #システムボードの温度についての説明を参照。 cb_temp_warn : enabled cb_temp_max : enabled cb_temp_911 : enabled cb_temp_bad : enabled cb_temp_change : enabled |
cb_volt_norm : enabled #システムボードの電圧についての説明を参照。 cb_volt_max : enabled cb_volt_min : enabled cb_volt_bad : enabled cb_volt_change : enabled |
centerplane_temp_norm : enabled #システムボードの温度についての説明を参照。 centerplane_temp_warn : enabled centerplane_temp_max : enabled centerplane_temp_911 : enabled centerplane_temp_bad : enabled centerplane_temp_change : enabled |
centerplane_volt_norm : enabled #システムボードの電圧についての説明を参照。 centerplane_volt_max : enabled centerplane_volt_min : enabled centerplane_volt_bad : enabled centerplane_volt_change : enabled |
supp_brd_temp_norm : enabled #システムボードの温度についての説明を参照。 supp_brd_temp_warn : enabled supp_brd_temp_max : enabled supp_brd_temp_911 : enabled supp_brd_temp_bad : enabled supp_brd_temp_change : enabled |
supp_brd_volt_norm : enabled #システムボードの電圧についての説明を参照。 supp_brd_volt_max : enabled supp_brd_volt_min : enabled supp_brd_volt_bad : enabled supp_brd_volt_change : enabled |
各コンポーネントに共通のイベントタイプもあります。以下に、イベントをタイプ別に示します。
ボードの温度が過熱状態から通常温度に戻りました。
温度を読み取ることができません。
ボード上の重要なコンポーネントの温度が、あらかじめ定められた値だけ変動しました (下記の「事前に定義された値」を参照)。
ボードの電圧が最大電圧または最小電圧の状態から通常の状態に戻りました。
ボードの電圧があらかじめ定められた最大値を超えました (下記の「事前に定義された値」を参照)。
ボードの電圧があらかじめ定められた最小値を下回りました (下記の「事前に定義された値」を参照)。
電圧を読み取ることができません。
ボードの電圧があらかじめ定められた分量だけ変動しました (下記の「事前に定義された値」を参照)。
InterDomain Networks 機能は、Sun Enterprise 10000 でのみサポートされる点に注意してください。
idn_boot : enabled #cpu のシグニチャーの状態が idn_boot を示します。 idn_halt : enabled #cpu のシグニチャーの状態が idn_halt を示します。 idn_awol : enabled #cpu のシグニチャーの状態が idn_awol を示します。 cluster_arbstop : enabled #idn クラスタアービトレーション停止状態 cluster_recordstop : enabled #idn クラスタレコード停止状態 |
IDN をサポートするドメインが起動され、対応する IDN ドライバが読み込まれました。このイベントは、該当するドメインを同一の IDN 内の他のメンバーとリンクする自動 IDN リンクが必要であることを edd(1M) に示します。リンクするには、他のメンバーのドメインが起動している必要があります。
関係するドメインで IDN ドライバの読み込みが解除されました。このイベントは、ドメインの自動 IDN リンクと同期をとるために、idn_boot イベントと組み合わせて使用されます。
IDN 内に応答しないまたは状態が不明 (AWOL) なドメインが存在することをドメインが報告しました。このイベントは、AWOL ドメインのリンクを解除するよう edd(1M) に指示します。
IDN 内のドメインがアービトレーション停止 (arbstop) しました。標準のアービトレーション停止イベントでは、指定されたドメインのボードの状態のみ保存されます。ただし、cluster_arbstop イベントでは、IDN 内のすべてのドメインに含まれるすべてのボードの状態が保存されます。
IDN 内のドメインがレコード停止 (recordstop) しました。標準のレコード停止イベントでは、指定されたドメインのボードの状態のみ保存されます。ただし、cluster_recordstop イベントでは、IDN 内のすべてのドメインに含まれるすべてのボードの状態が保存されます。
arbstop : enabled #特定のドメインのシステムボードのアービトレーション停止状態
recordstop : enabled #特定のドメインのシステムボードのレコード停止状態
watchdog : enabled #特定のドメインのシステムボードのウォッチドック状態
environment_shutdown : enabled
reboot : enabled #cpu シグニチャーの状態が再起動状態を示します。
panic1 : enabled #cpu シグニチャーの状態がパニック 1 の状態を示します。
panic2 : enabled #cpu シグニチャーの状態がパニック 2 の状態を示します。
panic_reboot : enabled #cpu シグニチャーの状態がパニック再起動状態を示します。
obp_reset : enabled #cpu シグニチャーの状態が OBP リセット状態を示します。
obpbooting : enabled #cpu シグニチャーの状態が OBP 起動状態を示します。
heartbeat_failure : enabled
#cpu ハートビートビットがハートビート障害を示します。
|
特定のドメインに属するシステムボードにアービトレーション停止の状態が発生しました。
特定のドメインに属するシステムボードにレコード停止の状態が発生しました。
特定のドメインに属するプロセッサ (あるいはプロセッサのセット) に、ウォッチドッグの状態が発生しました。
特定のドメインに属するプロセッサ (あるいはプロセッサのセット) に、環境シャットダウンの状態が発生しました。
特定のドメインに属するプロセッサ (あるいはプロセッサのセット) に、再起動の状態が発生しました。
特定のドメインに属するプロセッサ (あるいはプロセッサのセット) に、パニック 1 の状態が発生しました。
特定のドメインに属するプロセッサ (あるいはプロセッサのセット) に、パニック 2 の状態が発生しました。
特定のドメインに属するプロセッサ (あるいはプロセッサのセット) に、パニック再起動の状態が発生しました。
特定のドメインに属するプロセッサ (あるいはプロセッサのセット) に、OBP リセットの状態が発生しました。
特定のドメインに属するプロセッサ (あるいはプロ セッサのセット) が、OBP 起動の状態になりました。この状態はドメインの起動中に発生します。
特定のドメインに属するすべてのプロセッサに、ハートビート障害が発生しました。
signature_change : enabled #cpu シグニチャーの状態が変更されました。 system_config_change : enabled #マシンモジュールが追加・削除されました。 sys_brd_power_on : enabled #システムボードの電源が投入されました。 sys_brd_power_off : enabled #システムボードの電源が切断されました。 supp_brd_power_on : enabled #サポートボードの電源が投入されました。 supp_brd_power_off : enabled #サポートボードの電源が切断されました。 bulk_power_norm : enabled #バルク電源が切断状態または障害状態から投入状態へ切り替わりました。 bulk_power_fail : enabled #バルク電源が投入状態から切断状態または障害状態へ切り替わりました。 fan_norm : enabled #ファンが障害状態から動作状態または非動作状態へ切り替わりました。 fan_fail : enabled #ファンが動作状態または非動作状態から障害状態へ切り替わりました。 |
プロセッサのシグニチャブロックの状態が変更されました。
システムボード、センタープレーンサポート ボード、 制御ボード、ファントレー、バルク電源装置のいずれか 1 つ、または複数の装置がシステムに取り付けられたか、取り外されました。
システムボードの電源が切断状態から投入状態に切り替わりました。
システムボードの電源が投入状態から切断状態に切り替わりました。
センタープレーンサポートボードの電源が切断状態から投入状態に切り替わりました。
センタープレーンサポートボードの電源が投入状態から切断状態に切り替わりました。
バルク電源が切断状態または障害状態から投入状態に切り替わりました。
バルク電源が投入状態から切断状態または障害状態に切り替わりました。
ファンが障害状態から動作状態または非動作状態に切り替わりました。
ファンが動作状態または非動作状態から障害状態に切り替わりました。
過熱を示す温度限界値、温度変動量、電圧変動量はあらかじめ定義されており、SSP の固定記憶領域に格納されています。ssp_resource(4) を参照してください。
# # Event Monitor Configuration File # centerplane_temp_warn : enabled centerplane_volt_max : enabled |
この例では、システムに対しセンタプレーンの 2 つのイベントタイプの監視を有効化するよう設定しています。
以下のファイルがサポートされます。
$SSPVAR/etc/platform_name/edd.emc - インスタンス化された EMC ファイルへのパス。