Sun Management Center 3.6 使用者指南

附錄 D Sun Management Center 軟體規則

本附錄列出以下模組的 Sun Management Center 規則:

規則概念

規則是一種警報檢查機制,允許在判斷受監視主機或節點的狀態時使用複雜或特殊的目的邏輯。

有兩種類型的規則:

核心讀取器

下表列出核心讀取器簡易規則。

表 D–1 核心讀取器簡易規則

特性 

說明 

avg_1min 

最近 1 分鐘的平均負荷 

avg_5min 

最近 5 分鐘的平均負荷 

avg_15min 

最近 15 分鐘的平均負荷 

cpu_delta 

先前時間與目前時間的差異 

cpu_idle 

CPU 閒置時間 

cpu_kernel 

CPU 核心時間 

cpu_user 

CPU 使用者時間 

cpu_wait 

CPU wait time 

ipctused 

已使用 i-節點的百分比 

kpctused 

已使用千位元組的百分比 

mem-inuse 

使用中的實體記憶體 (MB) 

numusers 

使用者人數 

numsessions 

使用者階段作業的數目 

swap_used 

使用的交換空間 (KB) 

wait_io 

CPU 等待時間故障 

wait_pio 

CPU 等待時間故障 

wait_swap 

CPU 等待時間故障 

下表列出核心讀取器複雜規則。

表 D–2 核心讀取器複雜規則

規則 ID 

說明 

警報類型 

rknrd100

此規則包含過渡事件。當磁碟有超過 75% 處於工作中、平均佇列長度超過 10 以及等待佇列正在增加時,此規則將會產生警示警報。警示警報會一直持續,直到磁碟有低於 70% 處於工作中且平均佇列長度低於 8。

警示(A) 

rknrd102

此規則包含過渡事件。當 90% 的交換空間處於使用中時,此規則將會產生警示警報。此事件會使警報持續,直至使用中的交換空間低於交換空間總量的 80%。

警示(A) 

rknrd103

此規則包含瞬間事件。當交換與分頁對於所指定的 CPU 而言過高時,此規則將會產生警示警報。此行為表示 CPU 可能正在過渡操作。當 CPU 每秒超過 1 次換出、10 次頁面調進及 10 次頁面調出時,便會產生警示警報。如果 CPU 每秒超過 1 次換出、8 次頁面調進及 8 次頁面調出,則此警示警報會持續。

警示(A) 

rknrd105

發生「檔案系統已滿」錯誤。此規則將在 syslog ( /var/adm/message) 中尋找檔案系統已滿的錯誤訊息。

立即關閉的警示警報 

rknrd106

無交換空間錯誤。此規則將在 syslog (/var/adm/message)中尋找無交換空間錯誤。

立即關閉的警示警報 

rknrd400

此規則將檢查持續的 CPU 負荷是否超過 6,檢查時間為每個 CPU 四個小時。 

提供資訊 

rknrd401

此規則將檢查磁碟處於工作中的狀態是否超過檔案的 90%,檢查時間為 x 小時。參數欄位保留上次 CPU 負荷低於 6,並且被初始化為 2001 年某日期的狀態。

提供資訊 

rknrd402

此規則將檢查可用交換空間是否低於 10% 達 x 小時。此參數欄位表示上次 CPU 負荷低於 6 的狀態。此欄位被初始化為 2001 年的某日期。

提供資訊 

rknrd403 

目前不支援此規則。 

提供資訊 

rknrd404

如果 rknrd401 規則被觸發 4 次,則會產生提供資訊的警報。 

提供資訊 

rknrd405

如果 rknrd402 規則被觸發 4 次,則會產生提供資訊的警報。 

提供資訊 

運作情況監視

下表列出運作情況監視複雜規則。

表 D–3 運作情況複雜規則

規則 ID 

說明 

警報類型 

rhltm000

此規則將檢查是否有足夠的交換空間。

緊急、警示、小心 

rhltm001

每當 CPU 必須等到解除鎖定時,便會浪費 CPU 的電源。發生此事件是因為,核心使用彼此專用的鎖定以使作業同步化並避免多個 CPU 同時存取緊要代碼和資料區。

緊急、警示、小心 

rhltm002

NFS 遠端程序呼叫逾時可能與再次傳送呼叫後的重複回應有關。這些逾時顯示網路正常,但伺服器的回應較慢。

緊急、警示、小心 

rhltm003

此執行佇列長度會被除以 CPU 的數目,因為各個 CPU 均會在每個時間片段中從執行佇列取出一個工作。

緊急、警示、小心 

rhltm004

工作中磁碟或是慢速磁碟會降低系統流量,增加使用者回應時間。此規則將識別負荷過大的磁碟,以便平衡負荷。

緊急、警示、小心 

rhltm005

RAM 規則基於未參照頁面的常駐時間。當系統掃描以尋找閒置頁面並回收以作它用時,虛擬記憶體系統便會指示系統需要更多記憶體。

緊急、警示、小心 

rhltm006

此規則將參照在嘗試登入或網路連線意外失敗時發生的核心記憶體分配問題。可能的原因有兩種:核心已經達到其位址空間的限度,或可用清單中沒有任何可分配的頁面。重複的故障表明可能會被忽略的問題。

緊急、警示、小心 

rhltm007

存在目錄路徑名稱組件的全域快取。此快取被稱為目錄名稱查詢快取 (DNLC)。如果此快取不存在,則必須從磁碟讀取目錄項目,並且進行掃描以找到正確的檔案。 

緊急、警示、小心