Sun logo      上一個      目錄      索引      下一個     

Sun ONE Messaging Server 6.0 管理員指南

第 19 章
監視 Messaging Server

在大多數情況下,規劃與配置完善的伺服器無需管理員的大量介入即可執行。但是,作為管理員,監視伺服器以發現問題徵兆是您的工作。本章描述 Messaging Server 的監視作業。包含以下各節:

疑難排解程序位於第 18 章「MTA 疑難排解」中。


自動監視和重新啟動

Messaging Server 提供的方法,可透明地監視服務並在這些服務失敗或無回應 (服務掛起或凍結) 時重新啟動它們。它可監視所有的郵件儲存、MTA 和 MMP 服務,包括 IMAP、POP、HTTP、工作主控台、派送程式和 MMP 伺服器;但無法監視其他服務,如 ENS、SMS、LMTP 或 TCP/SNMP 伺服器。(LMTP 和 TCP/SNMP 由工作主控台監視。)請參閱自動重新啟動失敗或無回應的服務,以取得詳細資訊。

此外,此功能可產生日誌檔 msg_svr_base/data/log/watcher,它記錄所有的伺服器啟動和停止,如下所示。對於監視系統運作狀態而言,這是一個非常重要的檔案。

watcher process 13425 started at Tue Oct 21 15:29:44 2003

Watched 'imapd' process 13428 exited abnormally
Received request to restart:store imap pop http
Connecting to watcher ...
Stopping http server 13440 .... done
Stopping pop server 13431 ... done
Stopping pop server 13434 ... done
Stopping pop server 13435 ... done
Stopping pop server 13433 ... done
imap server is not running
Stopping store server 13426 .... done
Starting store server .... 13457
checking store server status ...... ready
Starting imap server ..... 13459
Starting pop server ....... 13462
Starting http server ...... 13471


日常監視作業

您應在每天執行的最重要作業是檢查 Postmaster 郵件、監視日誌檔以及設定 stored 公用程式。這些作業描述如下。

檢查 Postmaster 郵件

Messaging Server 為 Postmaster 電子郵件設定了預先定義的管理郵件收件人清單。此郵件收件人清單中的所有使用者均將自動接收傳送至 Postmaster 的郵件。

Postmaster 郵件的規則在 RFC822 中定義,RFC822 要求每個電子郵件站點均接受傳送給名為 Postmaster 的使用者或郵件收件人清單的郵件,並要求將傳送至該位址的郵件遞送給實際人員。傳送至 postmaster@host.domain 的所有郵件均被傳送至 Postmaster 帳號或郵件收件人清單。

通常,Postmaster 位址是使用者應傳送有關郵件服務的電子郵件的位址。作為 Postmaster,您可能會收到來自本地使用者的關於伺服器回應時間的郵件,以及來自其他伺服器管理員 (他們在向您的伺服器傳送郵件時遇到問題) 的郵件等。您應每天檢查 Postmaster 郵件。

您還可以配置伺服器,以向 Postmaster 位址傳送某些錯誤訊息。例如,當 MTA 無法路由或遞送郵件時,您可以經由傳送至 Postmaster 位址的電子郵件獲得通知。您還可以向 Postmaster 傳送異常狀況警告 (磁碟空間偏低以及伺服器回應緩慢)。

監視和維護日誌檔

Messaging Server 可為每個主要協定或服務建立一組單獨的日誌檔,它支援:SMTP、IMAP、POP 和 HTTP。這些日誌檔位於 msg_svr_base/data/log 中。您應定期監視日誌檔 - 特別是在您的伺服器出現問題時。

請注意,記錄會影響伺服器效能。您指定的記錄冗長度越高,您的日誌檔在給定時間內佔用的磁碟空間就越大。您應為伺服器定義有效可行的日誌循環策略、過期策略和備份策略。如需有關為伺服器定義記錄策略的資訊,請參閱第 17 章「記錄和日誌分析」

設定 stored 公用程式

stored 公用程式可為伺服器執行自動監視和維護作業,如:

stored 公用程式在每天午夜十二點鐘自動執行清除和過期作業。如需進一步資訊,請參閱 stored


監視系統效能

本章重點說明 Messaging Server 監視,但是,您還需要監視伺服器常駐的系統。配置完善的伺服器無法在未調整好的系統上正常執行,並且伺服器故障徵兆可能表示硬體不足以為電子郵件負載提供服務。本章不提供有關監視系統效能的所有詳細資訊,因為許多這些程序都是針對特定平台的,並可能要求您參閱平台特定的系統說明文件。此處描述以下效能監視程序:

監視端對端郵件遞送時間

電子郵件需要準時遞送。這可能是服務合約要求,同時也是可以讓郵件儘快遞送的一個良好策略。端對端速度緩慢可以說明很多問題。可能是伺服器運作不正常,或者是一天中的某些時間內遇到過大的郵件負載,或者是超出現有硬體資源的能力範圍。

端對端郵件遞送速度緩慢的徵兆

與正常情況相比,遞送郵件需要更長的時間。

監視端對端郵件遞送時間

監視磁碟空間

磁碟空間不足是導致郵件伺服器問題和故障的最常見原因。如果沒有空間用於寫入 MTA 佇列或郵件儲存,郵件伺服器將失敗。此外,除非您監視並清除日誌檔,否則它們會無限增長,從而佔用所有磁碟空間。

如果 stored 的清除功能失敗,並且已刪除郵件無法從郵件儲存中刪去,則磁碟空間會很快耗盡。磁碟空間耗盡的其他原因包括 MTA 郵件佇列增長過大、郵件儲存超出可用磁碟空間以及未受監視的日誌檔無限增長。(請注意,這些日誌檔包括 LDAP、MTA 和郵件存取等,並且每個日誌檔均可儲存在不同磁碟上。)

磁碟空間問題的徵兆

根據空間耗盡的磁碟或分割區的不同,可能出現不同的徵兆。MTA 佇列可能溢位並拒絕 SMTP 連線,郵件可能仍保留在 ims_master 佇列中而不會遞送到郵件儲存,並且日誌檔可能溢位。

監視磁碟空間

根據系統配置的不同,您可能需要監視不同的磁碟和分割區。例如,MTA 佇列可能位於一個磁碟/分割區上,郵件儲存可能位於另一個磁碟/分割區上,並且日誌檔可能又位於其他磁碟/分割區上。每個空間均需要監視,並且監視它們的方法可能不同。

監視郵件儲存

建議郵件儲存磁碟的使用率不超過容量的 75%。您可以透過使用 configutil 公用程式配置以下警報屬性,來監視郵件儲存磁碟的使用率:

透過設定這些參數,您可以指定系統監視磁碟空間的頻率以及在何種情況下傳送警告。例如,如果您希望系統每 600 秒監視一次磁碟空間,請指定以下指令:

configutil -o alarm.diskavail.msgalarmstatinterval -v 600

如果您希望在可用磁碟空間低於 20% 時收到警告,請指定以下指令:

configutil -o alarm.diskavail.msgalarmthreshold -v 20

請參見表格 19-1,以取得有關這些參數的更多資訊。

監視 MTA 佇列和記錄空間

您將需要監視 MTA 佇列磁碟並記錄磁碟空間使用率。

監視 CPU 使用率

CPU 使用率很高可能表示沒有足夠的 CPU 容量可供使用,或表示某些程序消耗過多的 CPU 循環。

CPU 使用率問題的徵兆

系統回應時間長。使用者登入緩慢。遞送速度緩慢。

監視 CPU 使用率

監視 CPU 使用率是平台特定的作業。請參閱相關的平台說明文件。


監視 MTA

本部分包含以下小節:

監視郵件佇列的大小

郵件佇列過度增長可能表示郵件未遞送、遞送延遲或者進入速度高於系統遞送速度。導致出現該問題的原因有很多,如由大量郵件湧入系統而導致的拒絕服務攻擊,或者是工作主控台未執行。

請參閱通道郵件佇列郵件未移出佇列MTA 郵件未遞送,以取得有關郵件佇列的更多資訊。

郵件佇列問題的徵兆

監視郵件佇列的大小

監視郵件佇列的最佳方法可能是使用 imsimta qm。請參閱 imsimta qm 計數器

您還可以監視佇列目錄 (msg_svr_base/data/queue/) 中的檔案數目。檔案數目將是站點特定的,並且您需要建立基線歷程以判斷何為「太多」。您可以記錄兩週內佇列檔案的大小,以取得近似平均數。

監視遞送失敗率

遞送失敗是指向外部站點遞送郵件的嘗試失敗。遞送失敗率大幅度增長可能表示網路出現問題,如 DNS 伺服器當機或遠端伺服器回應連線逾時。

遞送失敗率的徵兆

沒有明顯徵兆。mail.log_current 中將出現大量 Q 記錄。

監視遞送失敗率

遞送失敗以記錄項目碼 Q 記錄在 MTA 日誌中。請查看檔案 msg_svr_base/data/log/mail.log_current 中的記錄。範例:

mail.log:06-Oct-2003 00:24:03.66 501d.0b.9 ims-ms    Q  5 durai.balusamy@Sun.COM rfc822;durai.balusamy@Sun.COM durai@ims-ms-daemon <00ce01c38bda$c7e2b240$6501a8c0@guindy> Mailbox is busy

監視內送 SMTP 連線

來自給定 IP 位址的內送 SMTP 連線數目反常增加表示:

未經授權的 SMTP 連線的徵兆

監視內送 SMTP 連線

監視派送程式和工作主控台程序

必須執行派送程式和工作主控台程序,MTA 才能運作。每種類型您均應擁有一個程序。

派送程式和工作主控台程序當機的徵兆

如果派送程式當機或者沒有足夠的資源,則 SMTP 連線會被拒絕。

如果工作主控台當機,則佇列大小將增加。

監視派送程式和工作主控台程序

查看名為 dispatcherjob_controller 的程序是否存在。請參閱檢查工作主控台和派送程式是否正在執行


監視郵件存取

本節包含以下小節:

監視 imapd、popd 和 httpd

這些程序提供對 IMAP、POP 和 Webmail 服務的存取。如果這些程序中有任何程序未執行或未回應,則服務將無法正確運作。如果服務在執行,但是超出負載,監視將允許您偵測到此情況並更適當地配置該服務。

imapd、popd 和 httpd 問題的徵兆

連線被拒絕或系統速度太慢而無法連線。例如,如果 IMAP 未執行並且您嘗試直接連線至 IMAP,您將看到如下訊息:

telnet 0 143
正在嘗試 0.0.0.0...
telnet:無法連線至遠端主機:連線被拒絕

如果您嘗試與用戶端連線,您將收到以下訊息:

用戶端無法連線至您指定位置上的伺服器。伺服器可能當機或忙碌。

監視 imapd、popd 和 httpd

監視 stored

stored 執行各項重要作業,如郵件資料庫的死結和異動作業、實施時效策略以及刪除磁碟上儲存的郵件。如果 stored 停止執行,郵件傳送伺服器最終將出現問題。如果 stored 未在 start-msg 執行時啟動,則其他程序均不會啟動。如需有關 stored 的更多資訊,請參閱「Sun ONE Messaging Server Reference Manual」

stored 問題的徵兆

沒有明顯徵兆。

監視 stored


監視 LDAP 目錄伺服器

本節包含以下小節:

監視 slapd

LDAP 目錄伺服器 (slapd) 為郵件傳送系統提供目錄資訊。如果 slapd 當機,則系統將無法正常運作。如果 slapd 的回應時間太長,將影響登入速度和需要 LDAP 查找的任何其他異動。

slapd 問題的徵兆

監視 slapd


監視郵件儲存

郵件儲存在資料庫中。磁碟上使用者的分布、使用者電子信箱的大小以及磁碟需求均會影響儲存效能。本節包含以下小節:

監視郵件儲存資料庫鎖定的狀態

DB 鎖定的狀態由不同的伺服器程序控制。這些資料庫鎖定會影響郵件儲存的效能。如果出現死結,郵件將無法以正常速度插入儲存,結果將導致 ims-ms 通道佇列增大。備份佇列有合理的原因,因此保留佇列長度歷程對於診斷問題非常有用。

郵件儲存資料庫鎖定問題的徵兆

大量異動累積未解決。

監視郵件儲存資料庫鎖定

使用指令 counterutil -o db_lock

監視 mboxlist 目錄中資料庫日誌檔的數目

資料庫日誌檔參考不活躍的異動檢查點日誌檔 (msg_svr_base/store/mboxlist)。日誌檔的建立是未執行資料庫檢查點的徵兆。日誌檔的建立也可能是由於 stored 問題的原因。

資料庫日誌檔問題的徵兆

應該有 2 或 3 個日誌檔。如果有多於此數目的日誌檔,則表示可能發生嚴重問題。郵件儲存將少數資料庫用於郵件和配額,但這些資料庫的問題會導致所有郵件伺服器發生問題。

監視資料庫日誌檔

查看 msg_svr_base/store/mboxlist 目錄以確定僅有 2 或 3 個檔案。


用於監視的公用程式和工具

以下工具可用於進行監視:

immonitor-access

immonitor-access 可監視以下 Messaging Server 元件/程序的狀態:郵件遞送 (SMTP 伺服器)、郵件存取和儲存 (POP 伺服器和 IMAP 伺服器)、目錄服務 (LDAP 伺服器) 和 HTTP 伺服器。此公用程式可測量各項服務的回應時間,以及傳送和擷取郵件所佔用的往返總時間。此公用程式可透過在目錄中查找指定使用者並測量回應時間來監視目錄服務;還可透過傳送郵件 (SMTP) 來監視郵件遞送,以及透過擷取郵件來監視郵件存取和儲存。監視 HTTP 伺服器僅限於確定該伺服器是否連線良好以及是否在執行中。

如需完整說明,請參閱「Sun ONE Messaging Server Reference Manual」

stored

stored 公用程式執行伺服器上的維護作業,但也可以執行監視作業。它可定期檢查伺服器狀態、磁碟空間、服務回應時間,並在指定的情況下,可使用電子郵件形式向 Postmaster 發出警報。

警報以電子郵件形式從 stored 發送給 Postmaster,以警告指定狀況。以下是超出特定臨界值時由 stored 傳送的電子郵件警報之範例:

主旨:警報:「ldap_siroe.com_389」的伺服器回應時間是 10 秒
日期:2001 年 7 月 17 日 星期二,16:37:08 -0700 (PDT)
寄件者:postmaster@siroe.com
收件者:postmaster@siroe.com

伺服器實例:/opt/SUNWmsgsr
警報 ID:serverresponse
實例:ldap_siroe_europa.com_389
描述:伺服器回應時間 (以秒為單位)
目前測量值 (17/07/2001:16:37:08 -0700): 10
記錄的最低值: 0
記錄的最高值: 10
監視間隔時間:600 秒
警報條件是超過臨界值 10
超過臨界值的次數: 1

您可以指定 stored 監視磁碟和伺服器效能的頻率,以及在何種情況下傳送警報。此作業可透過使用 configutil 指令設定警報參數來完成。表格 19-1 顯示有用的 stored 參數及其預設設定。

表格 19-1  建議的 stored 參數 

參數

描述 (括號中為預設值)

alarm.msgalarmnoticehost

(localhost) 您向其傳送警告郵件的機器。

alarm.msgalarmnoticeport

(25) 傳送警報郵件時要連線至的 SMTP 連接埠。

alarm.msgalarmnoticercpt

(Postmaster@localhost) 傳送警報通知的對象。

alarm.msgalarmnoticesender

(Postmaster@localhost) 警報寄件者的位址。

alarm.diskavail.msgalarmdescription

磁碟可用性警報的描述。

alarm.diskavail.msgalarmstatinterval

(3600) 磁碟可用性檢查之間的間隔時間 (以秒為單位)。設定為 0 可停用對磁碟使用率的檢查。

alarm.diskavail.msgalarmthreshold

(10) 可用磁碟空間的百分比,低於該值時將傳送警報。

alarm.diskavail.msgalarmthresholddirection

(-1) 指定當可用磁碟空間低於臨界值 (-1) 或高於臨界值 (1) 時是否發出警報。

alarm.diskavail.msgalarmwarninginterval

(24). 後來重複發出磁碟可用性警報的間隔時間 (以小時為單位)。

alarm.serverresponse.msgalarmdescription

伺服器回應警報的描述。

alarm.serverresponse.msgalarmstatinterval

(600) 伺服器回應檢查之間的間隔時間 (以秒為單位)。設定為 0 可停用對伺服器回應的檢查。

alarm.serverresponse.msgalarmthreshold

(10) 如果伺服器回應時間 (以秒為單位) 超出該值,則發出警報。

alarm.serverresponse.msgalarmthresholddirection

(1) 指定當伺服器回應時間大於 (1) 臨界值或小於 (-1) 臨界值時是否發出警報。

alarm.serverresponse.msgalarmwarninginterval

(24) 後來重複發出伺服器回應警報的間隔時間 (以小時為單位)。

counterutil

此公用程式可提供從各種系統計數器獲得的統計資料。以下是目前可用計數器物件的清單:

# /opt/SUNWmsgsr/sbin/counterutil -l
Listing registry (/opt/SUNWmsgsr/data/counter/counter)
numobjects = 11
refcount = 1
created = 25/Sep/2003:02:04:55 -0700
modified = 02/Oct/2003:22:48:55 -0700
entry = alarm
entry = diskusage
entry = serverresponse
entry = db_lock
entry = db_log
entry = db_mpool
entry = db_txn
entry = imapstat
entry = httpstat
entry = popstat
entry = cgimsg

每個項目代表一個計數器物件,並提供此物件的各種有用計數。在本節中,我們將僅說明 alarmdiskusageserverresponsedb_lockpopstatimapstathttpstat 計數器物件。如需有關 counterutil 指令用法的詳細資訊,請參閱「Sun ONE Messaging Server Reference Manual」

counterutil 輸出

counterutil 具有各種旗標。此公用程式的指令格式可能如下所示:

counterutil 用法的範例如下:

# counterutil -o imapstat -i 5 -n 10
Monitor counteroobject (imapstat)
registry /gotmail/iplanet/server5/msg-gotmail/counter/counter opened
counterobject imapstat opened

count = 1 at 972082466 rh = 0xc0990 oh = 0xc0968

global.currentStartTime [4 bytes]:17/Oct/2000:12:44:23 -0700
global.lastConnectionTime [4 bytes]:20/Oct/2000:15:53:37 -0700
global.maxConnections [4 bytes]: 69
global.numConnections [4 bytes]: 12480
global.numCurrentConnections [4 bytes]: 48
global.numFailedConnections [4 bytes]: 0
global.numFailedLogins [4 bytes]: 15
global.numGoodLogins [4 bytes]: 10446
...

使用 counterutil 提供警報統計資料

這些警報統計資料參考 stored 傳送的警報。警報計數器可提供以下統計資料:

表格 19-2  counterutil alarm 統計資料

字尾

描述

alarm.countoverthreshold

超過臨界值的次數。

alarm.countwarningsent

傳送的警告數目。

alarm.current

目前監視的值。

alarm.high

記錄的最高值。

alarm.low

記錄的最低值。

alarm.timelastset

上次設定目前值的時間。

alarm.timelastwarning

上次傳送警告的時間。

alarm.timereset

上次執行重設的時間。

alarm.timestatechanged

上次變更警報狀態的時間。

alarm.warningstate

警告狀態 (yes[1] 或 no[0])。

使用 counterutil 提供 IMAP、POP 和 HTTP 連線統計資料

若要取得有關目前 IMAP、POP 和 HTTP 連線的數目、失敗登入的次數以及從起始時間算起的連線總數等資訊,您可以使用指令 counterutil -o CounterObject -i 5 -n 10。其中,CounterObject 代表計數器物件 popstatimapstathttpstatimapstat 字尾的含義在表格 19-3 中說明。popstathttpstat 物件可以使用相同的格式和結構提供相同的資訊。

表格 19-3  counterutil imapstat 統計資料

字尾

描述

currentStartTime

目前 IMAP 伺服器程序的起始時間。

lastConnectionTime

上次接受新用戶端的時間。

maxConnections

IMAP 伺服器處理的並行運作連線的最大數目。

numConnections

目前 IMAP 伺服器服務的連線總數。

numCurrentConnections

目前作用中連線的數目。

numFailedConnections

目前 IMAP 伺服器服務的失敗連線數目。

numFailedLogins

目前 IMAP 伺服器服務的失敗登入次數。

numGoodLogins

目前 IMAP 伺服器服務的成功登入次數。

使用 counterutil 提供磁碟使用率統計資料

指令:counterutil -o diskusage 可產生以下資訊:

表格 19-4  counterutil diskstat 統計資料

字尾

描述

diskusage.availSpace

磁碟分割區中的可用空間總量。

diskusage.lastStatTime

上次取得統計資料的時間。

diskusage.mailPartitionPath

郵件分割區路徑。

diskusage.percentAvail

磁碟分割區可用空間百分比。

diskusage.totalSpace

磁碟分割區中的空間總量。

伺服器回應統計資料

指令:counterutil -o serverresponse 可產生以下資訊。此資訊對於檢查伺服器是否在執行中以及伺服器的回應速度非常有用。

表格 19-5  counterutil serverresponse 統計資料

字尾

描述

http.laststattime

上次檢查 http 伺服器回應的時間。

http.responsetime

http 的回應時間。

imap.laststattime

上次檢查 imap 伺服器回應的時間。

imap.responsetime

imap 的回應時間。

pop.laststattime

上次檢查 pop 伺服器回應的時間。

pop.responsetime

pop 的回應時間。

ldap_host1_389.laststattime

上次檢查 ldap_host1_389 伺服器回應的時間。

ldap_host1_389.responsetime

ldap_host1_389 的回應時間。

ugldap_host2_389.laststattime

上次檢查 ugldap_host2_389 伺服器回應的時間。

ugldap_host2_389.responsetime

ugldap_host2_389 的回應時間。

日誌檔

郵件傳送伺服器記錄 SMTP、IMAP、POP 和 HTTP 的事件記錄。您可以自訂建立和管理 Messaging Server 日誌檔的策略。

由於記錄可影響伺服器效能,因此在要求伺服器承擔這項重任以前應仔細考量是否需要記錄。請參閱第 17 章「記錄和日誌分析」,以取得更多資訊。

imsimta 計數器

MTA 根據郵件監視 MIB 和 RFC 1566 為每個作用中的通道累積郵件通訊量計數器。通道計數器旨在為您指示電子郵件系統的趨勢和運作狀況。通道計數器並不用於提供精確的郵件通訊量計數。如需精確計數,另請參閱第 17 章「記錄和日誌分析」中說明的 MTA 記錄。

MTA 通道計數器使用最輕的可用機制實施,因此它們在實際作業中產生的影響非常小。通道計數器不難嘗試:如果嘗試對映區段失敗,則不會記錄任何資訊;如果區段中的其中一個鎖定無法立即獲得,則不會記錄任何資訊;系統關閉時,內部記憶體區段中包含的資訊將永遠遺失。

imsimta counters -show 指令可提供 MTA 通道郵件統計資料 (請參閱以下內容)。需要再次檢查這些計數器,同時請注意顯示的最小值。某些通道的最小值實際上可能為負數。負值表示在通道計數器設定為零時 (例如,建立了計數器的叢集寬度資料庫) 為該通道形成了郵件佇列。當這些郵件被移出佇列時,該通道的相關計數器便會減少,因而導致出現負的最小值。對於此類計數器,正確的「絕對」值是目前值減去計數器自起始化以來所具有的最小值。

Channel          Messages    Recipients    Blocks
-------          --------    ----------    -------
tcp_local
   Received       29379       79714      982252                      (1)
   Stored            61         113       -2004                      (2)
   Delivered      29369       79723      983903 (29369 first time)    (3)
   Submitted      13698       13699       18261                      (4)
   Attempted          0           0           0                      (5)
   Rejected           1          10           0                      (6)
   Failed           104         104        4681                      (7)

   Queue time/count        16425/29440 = 0.56                        (8)
   Queue first time/count  16425/29440 = 0.56                        (9)

   Total In Assocs           297637
   Total Out Assocs           28306

1) Received 是在名為 tcp_local 的通道中形成佇列的郵件數目。即由任何其他通道在 tcp_local 通道中形成佇列的郵件 (mail.log* 檔案中的 E 記錄)。

2) Stored 是儲存在通道佇列中要遞送的郵件數目。

3) Delivered 是已由通道 tcp_local 處理過 (移出佇列) 的郵件數目。(即 mail.log* 檔案中的 D 記錄。) 移出佇列作業可能表示成功遞送 (即在其他通道中形成佇列),也可能是由於郵件被返回至寄件者而導致的移出佇列。這通常相當於 Received 的數目減去 Stored 的數目。

MTA 還記錄初次嘗試將多少個郵件移出佇列;此數目顯示在括號中。

4) Submitted 是由通道 tcp_local 在其他通道中形成佇列的郵件 (mail.log 檔案中的 E 記錄) 的數目。

5) Attempted 是在移出佇列中遇到暫時問題的郵件數目,即 mail.log* 檔案中的 Q 或 Z 記錄。

6) Rejected 是被拒絕的形成佇列的嘗試次數,即 mail.log* 檔案中的 J 記錄。

7) Failed 是移出佇列的失敗嘗試次數,即 mail.log* 檔案中的 R 記錄。

8) Queue time/count 是遞送郵件在佇列中花費的平均時間。這包括初次嘗試中遞送的郵件 (請參閱 [9]) 以及需要額外遞送嘗試的郵件 (因此通常會在佇列中花很長的時間等待)。

9) Queue first time/count 是初次嘗試中遞送的郵件在佇列中花費的平均時間。

請注意,所提交的郵件數目可能大於遞送的郵件數目。這是通常情況,因為由通道移出佇列 (遞送) 的每個郵件將導致至少一個新郵件形成佇列 (提交),但也可能是多個。例如,如果郵件有兩個分別經由不同通道到達的收件者,則將需要形成兩個佇列。或者,如果郵件被退回,系統會將一個副本傳回給寄件者,將另一個副本傳送給 Postmaster。通常,這將是兩次提交 (除非兩者都透過同一個通道到達)。

一般來說,SubmittedDelivered 之間的連線視通道的類型而定。例如,在轉換通道中,郵件將由其他任意通道形成佇列,然後轉換通道將處理該郵件並使其在第三個通道中形成佇列,並在該郵件的自身佇列中將其標記為移出佇列。每個單獨的郵件均佔用一個路徑:

elsewhere -> conversion   E record   Received
conversion -> elsewhere   E record   Submitted
conversion                 D record   Delivered

但是,對於 tcp_local 之類的通道,它不是「通道」,而是具有兩個單獨的部分 (從屬部分與主要部分),並且 SubmittedDelivered 之間沒有關係。Submitted 計數器與 tcp_local 通道的 SMTP 伺服器部分有關,而 Delivered 計數器與 tcp_local 通道的 SMTP 用戶端部分有關。這是兩個完全獨立的程式,通過它們的郵件可以是完全獨立的。

提交給 SMTP 伺服器的郵件:

tcp_local -> elsewhere  E record    Submitted

經由 SMTP 用戶端傳送給其他 SMTP 主機的郵件:

elsewhere -> tcp_local  E record    Received
tcp_local               D record    Delivered

通道移出佇列 (遞送) 將導致至少一個新郵件形成佇列 (提交),但也可能是多個。例如,如果郵件有兩個分別經由不同通道到達的收件者,則將需要形成兩個佇列。或者,如果郵件被退回,系統會將一個副本傳回給寄件者,將另一個副本傳送給 Postmaster。通常將透過同一個通道到達。

在 UNIX 和 NT 上實施

由於效能原因,執行 MTA 的節點使用共用記憶體區段 (UNIX) 或共用檔案對映物件 (NT) 將通道計數器的快取保留在記憶體中。當節點上的程序將郵件形成佇列和移出佇列時,它們將更新此內部記憶體快取中的計數器。如果在通道執行時內部記憶體區段不存在,則系統將自動建立此區段。(如果內部記憶體區段不存在,imta start 指令亦可建立此區段)。

指令 imta counters -clearimta qm 的指令 counters clear 可用於將計數器重設為零。

imsimta qm 計數器

imsimta qm counters 公用程式可顯示 MTA 通道佇列郵件計數器。您必須是超級使用者或 inetuser 才能執行此公用程式。輸出欄位與 imsimta 計數器中所述的輸出欄位一樣。另請參閱「Sun ONE Messaging Server Reference Manual」,以取得詳細使用資訊。

範例:

# imsimta counters -create
# imsimta qm counters show

Channel                 Messages     Recipients    Blocks
----------------------  ----------  ----------    ----------
tcp_intranet
   Received              13077        13859         264616
   Stored                   92           91           -362
   Delivered             12985        13768         264978
   Submitted              2594         2594           3641
...

每次重新啟動 MTA 時,您必須執行:# imsimta counters -create

使用 SNMP 進行 MTA 監視

Messaging Server 支援透過簡易網路管理協定 (SNMP) 進行系統監視。使用 SNMP 用戶端 (有時稱為網路管理員),如 Sun Net Manager 或 HP OpenView (未提供此產品),您可以監視 Messaging Server 的某些部分。請參閱附錄 A「SNMP 支援」,以取得詳細資訊。

用於電子信箱配額檢查的 mboxutil

您可以使用 mboxutil 公用程式監視電子信箱配額的使用率和限制。mboxutil 公用程式將產生一個報告,列出定義的配額和限制,並提供有關配額使用率的資訊。請注意,您不應在執行過程中終止 mboxutil 程序。配額和使用率圖表以千位元組為單位報告。請勿使用 SIGKILL (kill -9) 終止此程序。如果此程序掛起,系統將自動為您終止它。

例如,以下指令將列出所有使用者配額資訊:

% mboxutil -a
-------------------------------------------------------------------------
Domain red.siroe.com (diskquota = not set msgquota = not set) quota usage
-------------------------------------------------------------------------
diskquota        size(K)    %use    msgquota      msgs    %use    user
# of domains = 1
# of users = 705

no quota         50418              no quota      4392            ajonkish
no quota         5                  no quota      2               andrewt
no quota         355518             no quota      2500            aniksri
...

以下範例將顯示使用者 sorook 的配額使用率:

% mboxutil -u sorook
-------------------------------------------------------------------------
quota usage for user sorook
-------------------------------------------------------------------------
diskquota      size(K)    %use    msgquota      msgs    %use    user

no quota       1487              no quota      305              sorook



上一個      目錄      索引      下一個     


Copyright 2003 Sun Microsystems, Inc.。版權所有。