高级系统监视 (ASM) 是授权使用的增值了的软件产品。安装 Sun Management Center 3.6 软件时可以选择安装它。ASM 提供了多个附加模块,可支持更全面的系统监视功能。ASM 包括本节中描述的以下模块:
此模块用于分离并监视安装了代理的主机上的任何目录及其子目录的大小。通过该模块的弹出菜单可以访问一个窗口,从中可以对子目录和链接进行逐层查看。
要分别监视多个目录,可以加载多个目录大小监视模块实例,也可以向特性表中添加附加目录行。有关更多信息,请参见监视目录大小。
下表简要说明了“目录大小监视”的特性。
表 C–119 目录大小监视属性
属性 |
说明 |
---|---|
实例名 |
单个单词或字母字符串,在 Sun Management Center 代理内部用于唯一标识特定的模块或模块中的一行 |
目录名 |
被监视的目录的名称 |
目录 |
正在检查的目录 |
目录大小 (KB) |
当前目录大小 (KB) |
Rate (KB/sec) |
目录大小更改的速度(KB/秒) |
故障管理器模块可帮助您高效地处理硬件和软件故障。对于选择的故障,该模块还会显示详细的故障报告或消息文章。
故障管理器模块可以管理以下对象:
故障管理守护进程表
FMD 配置表
FMD 故障事件表
下表简要说明了故障管理器的属性。
表 C–120 故障管理器属性
属性 |
说明 |
---|---|
故障管理守护进程 |
显示故障管理守护进程的详细信息。 |
FMD 配置 |
显示已加载模块的详细信息。 |
FMD 故障事件 |
显示最近的 20 个故障,同时显示它们的消息 ID。将对每个新故障生成一个报警。 |
下表简要说明了故障管理守护进程的属性。
表 C–121 故障管理守护进程属性
属性 |
说明 |
---|---|
属性 |
故障管理守护进程的属性这些属性有:FMD 程序路径、FMD 程序版本以及 FMD 进程 ID。 |
值 |
故障管理守护进程的属性值。 |
下表简要说明了 FMD 配置的属性。
表 C–122 FMD 配置属性
属性 |
说明 |
---|---|
模块名 |
FMD 模块的名称。FMD 模块的示例有:cpumem-diagnosis、cpumem-retire 和 fmd-self-diagnosis。 |
版本 |
模块的版本。 |
状态 |
模块的状态。状态包括“活动”或“失败”。如果该属性的值从“活动”变为“失败”,则将为该属性生成一个报警。 |
说明 |
模块的说明。 |
下表简要说明了 FMD 故障事件的属性。
表 C–123 FMD 故障事件属性
属性 |
说明 |
---|---|
时间 |
对故障进行诊断的时间 |
UUID |
故障事件的唯一 ID |
SUNW-MSG-ID |
用于访问相应技术文章的消息标识符,该技术文章的网址为:http://www.sun.com/msg/ |
在拓扑视图或分层结构视图中导航,直到出现故障管理器模块的 FMD 故障事件表。
选择您要查看其故障报告的故障。
按下鼠标按钮 3,从弹出菜单中选择“显示故障报告”。
探测浏览器将显示所选故障的详细故障报告。
消息文章中包含以下信息:故障类型、严重性、故障描述、故障影响以及建议的操作。该文章可帮助用户对具体故障采取适当的操作。
在拓扑视图或分层结构视图中导航,直到出现故障管理器模块的 FMD 故障事件表。
选择您要查看其消息文章的故障。
按下鼠标按钮 3,从弹出的菜单中选择“显示 http://www.sun.com/msg 处有关消息的文章”。
浏览器随后将打开位于以下网址处的消息文章:
http://www.sun.com/msg/ <SUNW-MSG-ID>
其中,<SUNW-MSG-ID> 是消息标识符,它是 FMD 故障表的最后一列。
如果系统中没有安装 Java 控制台,浏览器将无法打开消息文章。
文件扫描模块根据用户指定的模式在主机上扫描文件。可以加载多个文件扫描模块实例,以便扫描多个文件。此模块要求在数据特性表中添加行。有关更多信息,请参见向数据属性表中添加行。
文件扫描模块可以管理以下对象:
文件 ID 表
文件统计表
扫描表
下表简要说明了文件扫描的特性。
表 C–124 文件扫描属性
属性 |
说明 |
---|---|
File ID |
文件扫描中所用模式的名称 |
文件统计 |
所列模式的状态 |
扫描表 |
文件扫描中所用模式的名称 |
下表简要说明了文件 ID 的特性。
表 C–125 文件 ID 属性
属性 |
说明 |
---|---|
文件名 |
要扫描的文件的完整路径名 |
扫描方式 |
文件的扫描方式 |
开始时间 |
首次进行文件扫描的时间 |
“文件统计”表显示要扫描的文件的摘要信息。下表简要说明了文件统计的特性。
表 C–126 文件统计属性
属性 |
说明 |
---|---|
修改时间 |
上次修改文件的日期和时间 |
文件大小 |
文件大小,以字节为单位。 |
Number of Lines |
文件的行数 |
Lines Per Second |
每秒更改的文件行数 |
下表简要说明了扫描的特性。
表 C–127 扫描表属性
属性 |
说明 |
---|---|
行状态 |
行的状态 |
模式名 |
文件扫描中所用模式的名称 |
模式说明 |
在“扫描结果”部分的“名称”字段中显示的模式项名称。要在 syslog 文件中扫描故障消息,请为说明部分加上 FMA 前缀: |
Regexp Pattern |
扫描文件项时使用的正则表达式模式。要在 syslog 文件中扫描故障消息,请指定以下格式的模式:<token>:<value>,其中:<token> 是故障参数,而<value> 是故障参数的值。 |
模式状态 |
所列模式的状态(开/关)“关”状态表明所列模式未用于文件扫描 |
匹配项 |
包含该模式的行数 |
Hardware Diagnostic Suite 用于检测系统的硬件故障。当加载了此模块并安装了 Hardware Diagnostic Suite 软件后,便可以在“细节”窗口的“应用程序”选项卡中启动检测。有关 Hardware Diagnostic Suite 的详细信息,请参见《《Sun Management Center Hardware Diagnostic Suite 2.0 用户指南》》。
运行状况监视器模块用于监视主机的运行情况。出现警报情况时,此模块将在必要时提供有关提高系统性能方面的建议。
例如,此模块可监视可用的、保留的、已分配的和已使用的交换空间。以下是按严重程度从低到高排列的警报信息的示例:
不用担心: 有足够的交换空间可用
存在许多未使用的交换空间
剩余的交换空间不多: 也许需要添加更多交换空间
交换空间不足: 现在添加更多交换空间
交换空间严重不足: 立即添加更多交换空间
本节描述了以下由运行状况监视模块管理的对象的属性:
交换表
内核争用表
NFS 表
CPU 表
磁盘表
RAM 表
内核内存表
目录高速缓存表
运行状况监视模块将跟踪上述各项的系统属性,如下表所示。
表 C–128 运行状况监视器属性
属性 |
说明 |
---|---|
交换 |
详述交换空间 |
内核争用 |
监视内核争用(互斥)特性 |
NFS |
提供 NFS 客户机信息 |
CPU |
提供 CPU 电源信息 |
磁盘 |
显示磁盘 I/O 信息 |
RAM |
随机存取存储器 (RAM) 信息 |
内核内存 |
内核内存信息 |
Directory Cache |
目录的高速缓存 |
下表简要说明了“交换”的特性。
表 C–129 交换属性
属性 |
说明 |
---|---|
Swap Available KB |
可用的交换空间值 |
Swap Reserved KB |
保留的交换空间值 |
分配的交换空间(KB) |
已分配的交换空间值 |
Swap Used KB |
已使用的交换空间值 |
交换规则 |
交换规则 |
下表简要说明了“内核争用”(互斥)的特性。
表 C–130 内核争用属性
属性 |
说明 |
---|---|
互斥的 Spin 数 |
互斥的 Spin 数(第一次尝试时未获得锁定) - 所有 CPU 上的总数 |
CPU 数目 |
数量 |
Spins On Mutexes Rule |
互斥的 Spin 数(第一次尝试时未获得锁定) - 所有 CPU 上的总数 |
下表简要说明了 NFS 客户机信息的特性。
表 C–131 NFS 客户机信息属性
属性 |
说明 |
---|---|
Calls |
接收的 RPC 调用总数 |
拒绝调用的次数 |
RPC 层拒绝的调用总数 |
Retrans |
由于超时而重新发送的调用 |
Badxids |
来自服务器的与任何外部调用都不对应的回复 |
Timeouts |
等待服务器回复时调用超时 |
Newcreds |
刷新鉴别信息的次数 |
Badverfs |
由于响应时验证程序出错而失败的调用 |
计时器 |
计算出的超出调用的最小指定超时值的超时次数 |
无法分配内存 |
分配内存失败 |
Can't Send |
发送 NFS/RPC 规则失败 |
NFS/RPC 规则 |
NFS/RPC 规则的值 |
下表简要说明了中央处理器 (CPU) 的特性。
表 C–132 CPU 属性
属性 |
说明 |
---|---|
运行队列中的进程数 |
运行队列中的进程数 |
正等待的进程数 |
等待资源的进程数 |
Processes Swapped |
可以运行但需交换的进程数 |
CPU Power Rule |
CPU 电源规则 |
下表简要说明了磁盘的特性。
表 C–133 磁盘属性
属性 |
说明 |
---|---|
磁盘名 |
磁盘的名称 |
磁盘别名 |
磁盘的名称,如 c0t0d0 |
磁盘等待百分比 |
等待服务的平均事务数 |
Percent Disk Busy |
磁盘处于忙状态的时间百分比 |
服务时间(毫秒) |
平均服务时间(毫秒) |
Disk Rule |
磁盘规则 |
下表简要说明了随机存取存储器 (RAM) 的特性。
表 C–134 RAM 属性
属性 |
说明 |
---|---|
Handspread |
Hand spread(内核参数之一)页面的值 |
Scan rate |
页面扫描速度 |
Real Memory rule |
实际内存规则 |
下表简要说明了“内核内存”的特性。
表 C–135 内核内存属性
属性 |
说明 |
---|---|
Total Kernel Allocation Fails |
内核分配失败的次数 |
可用物理内存 |
可用物理内存的值 |
内核内存规则 |
内核内存规则的值 |
下表简要说明了“目录高速缓存”的特性。
表 C–136 名称高速缓存统计属性
属性 |
说明 |
---|---|
高速缓存命中次数 |
找到以前访问过的页面的次数 |
高速缓存未命中次数 |
未找到以前访问过的页面的次数 |
DNLC 规则 |
目录名查阅高速缓存规则 |
内核读取器模块用于监视内核统计信息以及所有内核信息,包括 CPU 统计、系统负荷统计、磁盘统计、文件系统使用情况等。本节包括了所有内核读取器管理的对象的特性及其说明:
用户统计表
进程间通信表
磁盘统计管理的对象表
I/O 错误统计表
文件系统使用情况表
CPU 统计管理的对象表
内存使用情况统计表
本节描述了进程监视模块参数及其属性说明。此模块要求在数据特性表中添加行。有关更多信息,请参见向数据属性表中添加行。
当发现匹配进程时,将显示 CPU 百分比和匹配的进程计数。如果需要更改模块的参数,可以使用弹出菜单对这些参数进行编辑,但不能更改条目名称。有关更多信息,请参见访问弹出菜单。
下表简要说明了“进程统计”的特性。
在向进程统计表添加行时,必须提供下表中的前五行信息。有关更多信息,请参见向数据属性表中添加行。
属性 |
说明 |
---|---|
项目名 |
进程统计表条目名称(名称必须唯一)。 |
名称模式 |
与要监视的进程二进制名称相匹配的模式。 |
Argv Pattern |
与执行进程的命令参数相匹配的模式。 |
用户说明 |
执行进程的用户名。 |
Entry Description |
条目的说明(必需字段)。 |
进程命令 |
用于启动进程的命令(如果适用)。 |
Process Count |
与模式匹配的当前运行的进程数。 |
% 系统 CPU 使用情况 |
系统进程占用的 CPU 百分比。这是根据不同的时间间隔所得的平均值。不要将其与输入 Unix ps 命令后所得的值相混淆。 |
% User CPU Usage |
用户进程占用的 CPU 百分比。 |
Virtual Size |
进程的总大小 (KB)。 |
Resident Set Size |
进程的驻留大小 (KB)。 |
Monitoring State |
在打开(启用行)和关闭(禁用行)之间切换。当行被禁用时,所有条目均显示为 0(零)。 |
下表简要说明了“Microstate 信息”的特性。
表 C–138 Microstate 信息属性
属性 |
说明 |
---|---|
项目名 |
条目名称(名称必须唯一)。 |
CPU wait time |
CPU 用于等待的时间百分比。 |
Text page fault time |
文字页面故障的时间百分比。 |
Data page fault time |
数据页面故障的时间百分比。 |
Major page faults |
每秒出现的主页面故障数目(文字和数据故障)。 |
Characters in I/O |
每秒读取和写入的字符数。 |
Involuntary context switches |
偶然环境每秒切换次数。 |
CPU time for reaped children |
与父进程分离的子进程使用 CPU 的时间百分比。 |
User lock time |
用户锁定消耗的时间百分比。 |
System trap time |
系统陷阱消耗的时间百分比。 |
Total swaps |
交换消耗的时间百分比。 |
Entry Description |
条目的说明(必需字段)。 |
Executable code Rule |
应用于可执行代码的规则。 |
File access rule |
应用于文件访问的规则。 |
如果出现以下情况,其对应的 CPU 上可能会出现非常高的 CPU 占用百分比:
某个特定进程有 n 个线程正等待激活。
“用户锁定时间”为 100% 乘以 n 个线程数。