Sun Management Center 3.6.1 用户指南

附录 D Sun Management Center 软件规则

本附录列出了以下模块在 Sun Management Center 中使用的规则:

规则的概念

规则是一种报警检查机制,它通过使用复杂或特定的逻辑确定所监视的主机或节点的状态。

规则可以分为两种类型:

内核读取器

下表列出了内核读取器的简单规则。

表 D–1 内核读取器简单规则

属性 

说明 

avg_1min 

最近 1 分钟的平均负荷值 

avg_5min 

最近 5 分钟的平均负荷值 

avg_15min 

最近 15 分钟的平均负荷值 

cpu_delta 

以前和当前时间之间的差异 

cpu_idle 

CPU 空闲时间 

cpu_kernel 

CPU 内核时间 

cpu_user 

CPU 用户时间 

cpu_wait 

CPU wait time 

ipctused 

使用的索引节点百分比 

kpctused 

已使用的空间大小百分比 

mem-inuse 

正使用的物理内存 (MB) 

numusers 

用户数 

numsessions 

用户会话数 

swap_used 

已使用的交换空间 (KB) 

wait_io 

CPU 等待时间故障 

wait_pio 

CPU 等待时间故障 

wait_swap 

CPU 等待时间故障 

下表列出了内核读取器的复杂规则。

表 D–2 内核读取器复杂规则

规则 ID 

说明 

报警类型 

rknrd100

此规则涵盖一个短暂事件。当磁盘忙的百分比超过 75%,平均队列长度大于 10 且等待队列仍在继续增长时,将产生警报报警。该警报报警会一直存在,直到磁盘忙的百分比低于 70%,且平均队列长度小于 8 为止。

警报 

rknrd102

此规则涵盖一个短暂事件。当交换空间使用率为 90% 时,此规则将生成警报报警。引起警报的事件将一直存在,直到使用的交换空间低于 80% 为止。

警报 

rknrd103

此规则涵盖一个短暂事件。当某个给定的 CPU 进行频繁的交换和页面调用时,将生成警报报警。这表明 CPU 可能正在抖动。当 CPU 每秒的换出超过 1 次,且页面的调进和调出都超过 10 次时,将生成警报报警。如果 CPU 每秒的换出仍超过 1 次,且页面的调进和调出都超过8 次,此警报报警并不会消除。

警报 

rknrd105

文件系统已满错误。此规则在 syslog (/var/adm/message) 中查找文件系统满错误信息。

立即关闭的警报报警 

rknrd106

无交换空间错误。此规则在 syslog (/var/adm/message) 中查找无交换空间错误信息。

立即关闭的警报报警 

rknrd400

此规则检查一个 CPU 连续 4 小时负荷超过 6 的情况。 

信息 

rknrd401

此规则检查连续 x 小时 90% 以上的文件忙的磁盘。其参数字段保留了最近一次 CPU 负载低于 6 的时间,然后会初始化为 2001 年的某个日期。

信息 

rknrd402

此规则检查可用交换空间是否连续 x 小时低于 10%。其参数字段显示了最近一次 CPU 负载低于 6 的时间。此字段将初始化为 2001 年的某个日期。

信息 

rknrd403 

当前不支持此规则。 

信息 

rknrd404

如果规则 rknrd401 被触发 4 次,将生成信息报警。 

信息 

rknrd405

如果规则 rknrd402 被触发 4 次,将生成信息报警。 

信息 

运行状况监视

下表列出了运行状况监视复杂规则。

表 D–3 运作情况监视复杂规则

规则 ID 

说明 

报警类型 

rhltm000

此规则检查是否有足够的交换空间。

紧急、警报、注意 

rhltm001

每当 CPU 等待解除锁定时,都会造成 CPU 电源浪费。之所以计数此事件是因为内核使用了互斥的锁定来同步其操作,并且还要防止多个 CPU 同时访问重要的代码和数据区。

紧急、警报、注意 

rhltm002

NFS 远程过程调用超时可能会导致重新传送调用后产生重复的响应。这些超时表明网络是正常的,但服务器响应很慢。

紧急、警报、注意 

rhltm003

由于每个 CPU 要在每一时间片内从运行队列中获取一个作业,因此,运行队列长度是 CPU 数量的倍数。

紧急、警报、注意 

rhltm004

磁盘忙或磁盘速度慢均会降低系统吞吐量,并增加用户响应时间。此规则可识别已加载的磁盘,以便重新平衡负荷。

紧急、警报、注意 

rhltm005

基于未被引用页面的驻留时间的 RAM 规则。当系统扫描空闲页面以将其回收并另作它用时,虚拟内存系统会表明系统需要更多内存。

紧急、警报、注意 

rhltm006

此规则涉及内核内存分配问题,在登录尝试或网络连接意外失败时发生。可能的原因有两个:内核可能已达到其地址空间的极限,或可用列表中没有任何可分配的页面。重复出现的失败是为了突出此问题,以免它被忽略。

紧急、警报、注意 

rhltm007

存在一个目录路径名组件的全局高速缓存,称为目录名查阅高速缓存 (DNLC)。如果不存在此缓存,就必须从磁盘读取并扫描目录项以定位正确的文件。 

紧急、警报、注意