2


SMS 1.5 错误

本章介绍了有关 SMS 1.5 的已知错误的信息。包括:


SMS 1.5 软件中的错误

本节概述了对 SMS 1.5 有重要影响的错误。

备份 cpio 中的文件超过 4095 个时会导致 smsrestore 中断 (CR ID 6295142)

如果 cpio 归档中的文件数目超过 4095 个,smsrestore 命令将失败。

解决方法是:删除没用的文件,然后使用 smsbackup 重建 cpio 归档。没用的文件通常包括开机自检日志和转储文件。每个域上的开机自检日志和转储文件分别可多达 1000 个。

发往 NetConnect 的 FMA 事件报告不显示修改过的底盘序列号 (CR ID 5052078)

如果运行 Sun Fire 高端服务器时,没有使用 setcsn 命令在 SC 上设置底盘序列号 (CSN);则在发生域停止 (Dstop) 事件后,发往 NetConnect 的所有故障管理体系结构 (FMA) 报告会在其事件报告中将该序列号显示为空。

解决方法:使用 setcsn 命令设置底盘序列号,然后重新启动 SMS。您必须重新启动 SMS,CSN 才会显示在事件报告中。

有关如何在 SC 上设置底盘序列号的详细信息,请参阅《System Management Services (SMS) 1.5 安装指南》

ndd/dev/scman man_pathgroups_report 输出内容需要辨别 (CR ID 6252771)

为了读取和写入特定设备驱动程序参数,可以用超级用户身份执行 ndd(1M) 命令。 scman(7D) (ndd/dev/scman) 命令可用来对管理 (MAN) 网络的 Starcat SC 端进行管理,它支持使用 ndd(1M) 命令。

如果未正确解释 scman(7D) 的 man_pathgroups_report 参数,当实际发生了由软件引起的错误时,系统可能会报告发生了严重的硬件错误。并因此得出错误的结论:需要更换硬件以便从根本上解决问题。

当指定了 man_pathgroups_report 参数时,您可以得到类似如下的输出:


# ndd /dev/scman man_pathgroups_report
MAN Pathgroup report: (* == error)
Interface       Destination             Active Path     Alternate Paths
----------------------------------------------------------------
scman1          Other SSC               eri0 eri0 exp 0, hme1 exp 0 *

 

最后一行中的星号 (*) 表示“上一次使用 hme1 物理端口时,发生了错误”。从历史经验判断,此类错误多数是由软件而非硬件问题所致。

当 MAN 网络中的对等设备不再对“心跳”消息作出响应,或者存在错误的 dlpi(7P) 状态过渡时,会因软件问题而发生错误。以超级用户身份运行以下命令可重复再现前一种情形(假定确切的输出内容如上所示):


# ndd -set /dev/scman man_set_active_path '1 0 1'

 

对于执行命令的 SC(如 SC0)来说,其活动路径已由 eri0 切换至 hme1。在一段时间内,SC1 会继续通过 eri0 物理接口发送数据包,SC0 则会继续通过 hme1 发送数据包。稍后,SC1 和 SC0 将使用同一个接口进行同步和通信。然而,每台 SC 上却会显示一个星号,以表示上一个端口发生了错误。这种情况下,该错误确实是由软件问题导致的(即错误的确是因未响应“心跳”消息序列而致)。该错误不是致命的硬件错误。

如果确实存在持久而致命的硬件错误,上面的输出中也会显示星号。但却不应假定硬件问题是导致显示星号的唯一原因。

showenvironment 命令报告没有为域 A 分配任何板,然后将报告输出 (CR ID 6299795)

如果您已在 Sun Fire 系统的域 A 上删除、安装或分配了板,但随后使用了带有 -d A 选项的 showenvironment 命令,该命令将返回以下错误消息:

No board assigned to Domain A.

该错误消息没有反映实际情况,可将其忽略。此问题仅会在域 A 上发生。


SMS 1.5 文档勘误

本节概述了 SMS 1.5 手册页以及文档中的错误。

rcfgadm(1M)

CR ID 4945049

rcfgadm(1M) 手册页中的注释应为:

If the rcfgadm command fails, a board does not return to its original state. A dxs or dcs error message is logged to the domain. If the error is recoverable, you can retry the command.
(如果 rcfgadm 命令失败,板不会恢复其最初的状态。dxs 或 dcs 错误消息将被记录到域中。如果错误可恢复,您可以重试该命令。)

Before you retry the command, ensure that the following dcs entries exist in /etc/inetd.conf on the domain, and that they have not been disabled:
(重试该命令之前,应确保域内的 /etc/inetd.conf 文件中包含以下 dcs 条目,且尚未禁用:)


sun-dr stream tcp wait root /usr/lib/dcs dcs
sun-dr stream tcp6 wait root /usr/lib/dcs dcs

 

If the error is unrecoverable, you must reboot the domain in order to use that board.
(如果错误不可恢复,则必须重新引导域以便使用该板。)

testemail(1M)

CR ID 5047803

testemail(1M) 手册页中有关 -c 选项的描述应为:

The fault class or comma-separated list of fault classes that testemail uses to generate an event.
(testemail 用于生成事件的错误类或以逗号分隔的错误类列表。)

-c fault_class, fault_class, fault_class

Examples of valid fault classes are in the file /etc/opt/SUNWSMS/config/SF15000.dict .
(/etc/opt/SUNWSMS/config/SF15000.dict
文件中提供了有效的错误类实例。)

CR ID 6221370

描述部分的注释应为:

When invoking testemail using an ecache resource, make sure that the system board containing the ecache is powered on. Otherwise, the testemail invocation will fail and no email will be generated.
(使用 ecache 资源调用 testemail 之前,应接通包含 ecache 的系统板的电源。否则,对 testemail 的调用将失败,也不会生成电子邮件。)

《System Management Services (SMS) 1.5 Administrator Guide》

第 1 章的第 5 页:

有关 Sun Fire 高端系统的 VCMON 的描述是错误的。正确的描述,可参见本文档中 VCMON

第 10 章的第 190 页:

在有关 showboards 命令的描述中,-a 选项应为 -v

在有关 showenvironment 命令的描述中,应删除类别 "Devide"。

第 11 章的第 201 页:

第一个实例应为:

showlogs -d domain_indicator -p s

第二个实例应为:

showlogs -d domain_indicator -p c

附录 A 的第 247 页。

应添加以下命令:

smsinstall:安装 SMS 软件。

smsupgrade:升级安装在系统中的现有 SMS 软件。

附录 B (CR 6227544, 4943474):

应在错误代码 11300 与 50000 之间添加以下错误消息类别:

11500-11699:保留用于 EFHD 消息

11700-11899:保留用于 ELAD 消息

11900-12099:保留用于 ERD 消息

12100-12299:保留用于事件实用程序消息

12300-12499:保留用于 Wcapp 消息

12500-12699:保留用于与 FRUID 相关的消息

12700-12799:保留用于 EBD 消息

《System Management Services (SMS) 1.5 安装指南》

第 31 页:

第 3 步应为:

运行 smsupgrade 命令以便重新安装 SMS。

第 42 页:

第 2 步之后应有如下的第 3 步:

升级 Solaris OS。请参见第 31 页的“升级 SC 上的 Solaris OS”。

第 3 步之后应有如下的第 4 步:

执行完主 OS 升级(请参见第 32 页)后,请运行 smsupgrade 以重新安装 SMS。否则,请继续执行下一步,以恢复 SMS 配置。

标题“重新安装 SMS 1.5 软件”应为“恢复 SMS 1.5 配置”。