Sun Java System Messaging Server 6 2005Q4 管理指南

使用 msprobe 和 watcher 功能進行監視

Messaging Server 提供兩個程序 watchermsprobe,以監視多種系統服務。watcher 監視伺服器當機並在需要時重新啟動伺服器。msprobe 監視伺服器掛機 (未回應)。具體來說,msprobe 監視以下內容︰

watchermsprobeconfigutil 選項控制 (顯示在表 23–5 中)。詳細資訊可以在自動重新啟動失敗或無回應的服務中找到

表 23–5 msprobewatcher configutil 選項

選項 

說明 

local.autorestart

啟用伺服器自動重新啟動。自動重新啟動失敗或掛機的服務。預設:no 

local.autorestart.timeout

失敗重新嘗試逾時。如果伺服器在指定時間內失敗兩次以上,系統將停止重新啟動伺服器的嘗試。該值 (設定為秒) 應設定為長於 msprobe 間隔 (local.schedule.msprobe) 的時間段。預設:600 秒

local.probe.service.timeout

特定伺服器重新啟動之前的逾時。service 可以為 imap、pop、http、cert、job_controller、smtp、lmtp、mmp 或 ens。

預設:使用 service.readtimeout

local.probe.service.warningthreshold

警告訊息記錄至 default 記錄檔之前特定伺服器無回應的秒數。service 可以為 imap、pop、http、cert、job_controller、smtp、lmtp、mmp 或 ens。

預設:使用 local.probe.warningthreshold 

local.probe.warningthreshold

警告訊息記錄到 default 記錄檔之前伺服器無回應的秒數。

預設:5 秒 

local.queuedir

MTA 佇列目錄,用於檢查佇列大小是否超出 alarm.diskavail.msgalarmthreshold 定義的臨界值。 

預設:無 

service.readtimeout

重新啟動伺服器前伺服器無回應的時間。請參閱 local.schedule.msprobe。 

預設:10 秒 

local.schedule.msprobe

msprobe 執行排程。crontab 樣式排程字串 (請參閱表 18–10)

local.watcher.啟用

啟用監視服務失敗的 watcher。(IMAP、POP、HTTP、工作控制器、派送程式、郵件儲存 (stored)、imsched 和 MMP。)(LMTP/SMTP 伺服器由派送程式監視,LMTP/SMTP 用戶端由 job_controller 監視。)將指示特定失敗的錯誤訊息記錄到預設記錄檔中。預設:開啟

警報郵件

msprobe 可以採用電子郵件形式向 Postmaster (請參閱監視 imapd、popd 和 httpd) 發出警示,以警告指定狀況。以下是超出特定臨界值時傳送的電子郵件警報之範例:


Subject:    ALARM: server response time in seconds of “ldap_siroe.com_389” is 10
Date:    Tue, 17 Jul 2001 16:37:08 -0700 (PDT) 
From:    postmaster@siroe.com 
To:     postmaster@siroe.com 

Server instance: /opt/SUNWmsgsr
Alarmid: serverresponse 
Instance: ldap_siroe_europa.com_389 
Description: server response time in seconds 
Current measured value (17/Jul/2001:16:37:08 -0700): 10 
Lowest recorded value: 0 
Highest recorded value: 10 
Monitoring interval: 600 seconds 
Alarm condition is when over threshold of 10 
Number of times over threshold: 1

            

可以指定 msprobe 監視磁碟和伺服器效能的頻率,以及在何種情況下傳送警示。此作業可透過使用 configutil 指令設定警示參數來完成。表 23–6 顯示有用的警示參數以及其預設設定。請參閱「Sun Java System Messaging Server 6 2005Q4 Administration Reference」中的「configutil Parameters」

表 23–6 有用的警示郵件 configutil 參數

參數 

說明 (括號中為預設值) 

alarm.msgalarmnoticehost

(localhost) 您向其傳送警告郵件的機器。 

alarm.msgalarmnoticeport

(25) 傳送警報郵件時要連線至的 SMTP 連接埠。 

alarm.msgalarmnoticercpt

(Postmaster@localhost) 傳送警報通知的對象。 

alarm.msgalarmnoticesender

(Postmaster@localhost) 警報寄件者的位址。 

alarm.diskavail.msgalarmdescription

(郵件分割區磁碟可用空間百分比。)磁碟可用性警報描述欄位的文字。 

alarm.diskavail.msgalarmstatinterval

(3600) 磁碟可用性檢查之間的間隔時間 (以秒為單位)。設定為 0 可停用對磁碟使用率的檢查。 

alarm.diskavail.msgalarmthreshold

(10) 可用磁碟空間的百分比,低於該值時將傳送警報。 

alarm.diskavail.msgalarmthresholddirection

(-1) 指定當可用磁碟空間低於臨界值 (-1) 或高於臨界值 (1) 時是否發出警報。 

alarm.diskavail.msgalarmwarninginterval

(24)。後來重複發出磁碟可用性警報的間隔時間 (以小時為單位)。 

alarm.serverresponse.msgalarmdescription

(伺服器回應時間 [以秒為單位]。)伺服器回應警報描述欄位的文字。 

alarm.serverresponse.msgalarmstatinterval

(600) 伺服器回應檢查之間的間隔時間 (以秒為單位)。設定為 0 可停用對伺服器回應的檢查。 

alarm.serverresponse.msgalarmthreshold

(10) 如果伺服器回應時間 (以秒為單位) 超出該值,則發出警報。 

alarm.serverresponse.msgalarmthresholddirection

(1) 指定當伺服器回應時間大於 (1) 臨界值或小於 (-1) 臨界值時是否發出警報。 

alarm.serverresponse.msgalarmwarninginterval

(24) 後來重複發出伺服器回應警報的間隔時間 (以小時為單位)。