Sun Java System Messaging Server 6 2005Q4 管理指南

监视系统性能

虽然本章重点介绍的是 Messaging Server 监视,但是还需要监视服务器所在的系统。很好配置的服务器在未经过很好优化的系统上无法获得很好的性能,服务器的故障症状可能表明硬件不足以支持电子邮件负载。本章未提供有关监视系统性能的所有详细信息,因为其中的许多过程都是特定于平台的,并且可能要求您参考特定于平台的系统文档。下面介绍了性能监视的过程:

监视端对端邮件传送时间

电子邮件需要按时传送。这可能是一项服务协议要求,但尽快传送邮件也是一个很好的策略。较长的端对端时间可能预示着许多问题。可能是服务器运行不正常,或者是在一天中的特定时间内发生了邮件超负荷的情况,或者是对现有硬件资源的使用已经超出了它们的能力。

低效的端对端邮件传送时间的症状

邮件的传送时间比正常情况下要长。

监视端对端邮件传送时间

监视磁盘空间

磁盘空间不足是导致邮件服务器出现问题和故障的最常见原因之一。如果没有用于写入到 MTA 队列或写入到邮件存储的空间,邮件服务器将会失败。此外,除非监视并清除日志文件,否则它们会无节制地增长并填满所有磁盘空间。

邮件存储分区将随着新邮件传送到邮箱而增长;例如,如果不强制邮件存储配额,邮件存储可能会超出分区的可用磁盘空间。导致磁盘空间耗尽的另一个原因是 MTA 邮件队列增长得过大。涉及的第三个方面为问题是否因日志文件监视工具和日志文件增长失控而发生。(请注意,有许多日志文件,例如 LDAP、MTA 和邮件访问,其中的每个日志文件都可以存储在不同的磁盘上。)

磁盘空间问题的症状

根据耗尽空间的磁盘或分区不同,所出现的症状会有所不同。MTA 队列会溢出并拒绝 SMTP 连接,邮件可能保留在 ims_master 队列中而没有传送到邮件存储,并且日志文件会溢出。

如果邮件存储分区填满,则邮件访问守护进程可能会失败,邮件存储数据可能会被破坏。邮件存储维护实用程序(例如 imexpirereconstruct)可以修复损坏并减少磁盘使用量。但是,这些实用程序需要其他磁盘空间,而且修复填满整个磁盘的分区可能会导致停机。

监视磁盘空间

根据系统配置,您可能需要监视各种磁盘和分区。例如,MTA 队列、邮件存储和日志文件可能分别位于不同的磁盘/分区上。其中的每个空间都需要监视,并且监视这些空间的方法也可能不同。

Messaging Server 提供特定的方法,以监视邮件存储磁盘空间的使用并防止分区填满所有可用磁盘空间。

您可以执行以下步骤来监视邮件存储的磁盘空间使用情况:

有关详细信息,请参见以下内容:监视邮件存储监视邮件存储分区

监视邮件存储

建议邮件存储的磁盘使用量不要超过磁盘容量的 75%。您可以通过配置以下警报属性(使用 configutil 实用程序)来监视邮件存储的磁盘使用量:

通过设置这些参数,您可以指定系统应监视磁盘空间的频率以及系统应在什么情况下发送警告。例如,如果您希望系统每 600 秒监视磁盘空间一次,请指定以下命令:

configutil -o alarm.diskavail.msgalarmstatinterval -v 600

如果您希望无论何时当可用磁盘空间低于 20% 时都接收到警告,请指定以下命令:

configutil -o alarm.diskavail.msgalarmthreshold -v 20

有关这些参数的更多信息,请参见表 23–6

监视邮件存储分区

当邮件分区填充超过可用磁盘空间的指定百分比时,您可以停止向邮件存储分区传送邮件。设置两个 configutil 参数以启用此功能并指定磁盘使用量阈值,即可完成此设置。

邮件存储守护进程可以使用此功能来监视分区磁盘使用量。随着磁盘使用量的增加,存储守护进程将更加频繁地动态检查分区(从每 100 分钟一次到每 1 分钟一次)。

如果磁盘使用量超过指定的阈值,存储守护进程将:

磁盘使用量降至阈值以下时,分区将取消锁定,邮件将再次传送到存储。

configutil 参数如下所示:

应将磁盘使用量阈值设置为一个足够低的百分比,以便有时间重新进行分区或为本地邮件存储指定更多的磁盘空间。

例如,假设分区以每小时 2% 的速率填充磁盘空间,并且需要一个小时的时间为本地邮件存储分配其他磁盘空间。在这种情况下,应将磁盘使用量阈值设置为低于 98% 的值。

监视 MTA 队列和日志记录空间

您需要监视 MTA 队列和日志记录空间的磁盘使用量。

有关管理日志记录空间的信息,请参见第 21 章,管理日志记录。例如,要了解如何监视 mail.log 文件,请参见管理 MTA 邮件和连接日志

监视 CPU 使用情况

CPU 使用情况表明针对该使用级别没有足够的 CPU 容量,或者某些进程使用的 CPU 周期数超出了正常范围。

CPU 使用情况问题的症状

系统响应时间长。用户的登录缓慢。传送率低。

监视 CPU 使用情况

监视 CPU 使用情况是一个特定于平台的任务。请参见相关的平台文档。