第 2 章 |
|
如果 cpio 归档中的文件数目超过 4095 个,smsrestore 命令将失败。
解决方法是:删除没用的文件,然后使用 smsbackup 重建 cpio 归档。没用的文件通常包括开机自检日志和转储文件。每个域上的开机自检日志和转储文件分别可多达 1000 个。
如果运行 Sun Fire 高端服务器时,没有使用 setcsn 命令在 SC 上设置底盘序列号 (CSN);则在发生域停止 (Dstop) 事件后,发往 NetConnect 的所有故障管理体系结构 (FMA) 报告会在其事件报告中将该序列号显示为空。
解决方法:使用 setcsn 命令设置底盘序列号,然后重新启动 SMS。您必须重新启动 SMS,CSN 才会显示在事件报告中。
有关如何在 SC 上设置底盘序列号的详细信息,请参阅《System Management Services (SMS) 1.5 安装指南》。
为了读取和写入特定设备驱动程序参数,可以用超级用户身份执行 ndd(1M) 命令。 scman(7D) (ndd/dev/scman) 命令可用来对管理 (MAN) 网络的 Starcat SC 端进行管理,它支持使用 ndd(1M) 命令。
如果未正确解释 scman(7D) 的 man_pathgroups_report 参数,当实际发生了由软件引起的错误时,系统可能会报告发生了严重的硬件错误。并因此得出错误的结论:需要更换硬件以便从根本上解决问题。
当指定了 man_pathgroups_report 参数时,您可以得到类似如下的输出:
最后一行中的星号 (*) 表示“上一次使用 hme1 物理端口时,发生了错误”。从历史经验判断,此类错误多数是由软件而非硬件问题所致。
当 MAN 网络中的对等设备不再对“心跳”消息作出响应,或者存在错误的 dlpi(7P) 状态过渡时,会因软件问题而发生错误。以超级用户身份运行以下命令可重复再现前一种情形(假定确切的输出内容如上所示):
对于执行命令的 SC(如 SC0)来说,其活动路径已由 eri0 切换至 hme1。在一段时间内,SC1 会继续通过 eri0 物理接口发送数据包,SC0 则会继续通过 hme1 发送数据包。稍后,SC1 和 SC0 将使用同一个接口进行同步和通信。然而,每台 SC 上却会显示一个星号,以表示上一个端口发生了错误。这种情况下,该错误确实是由软件问题导致的(即错误的确是因未响应“心跳”消息序列而致)。该错误不是致命的硬件错误。
如果确实存在持久而致命的硬件错误,上面的输出中也会显示星号。但却不应假定硬件问题是导致显示星号的唯一原因。
如果您已在 Sun Fire 系统的域 A 上删除、安装或分配了板,但随后使用了带有 -d A 选项的 showenvironment 命令,该命令将返回以下错误消息:
No board assigned to Domain A.
该错误消息没有反映实际情况,可将其忽略。此问题仅会在域 A 上发生。
If the rcfgadm command fails, a board does not return to its original state. A dxs or dcs error message is logged to the domain. If the error is recoverable, you can retry the command.
(如果 rcfgadm 命令失败,板不会恢复其最初的状态。dxs 或 dcs 错误消息将被记录到域中。如果错误可恢复,您可以重试该命令。)
Before you retry the command, ensure that the following dcs entries exist in /etc/inetd.conf on the domain, and that they have not been disabled:
(重试该命令之前,应确保域内的 /etc/inetd.conf 文件中包含以下 dcs 条目,且尚未禁用:)
If the error is unrecoverable, you must reboot the domain in order to use that board.
(如果错误不可恢复,则必须重新引导域以便使用该板。)
testemail(1M) 手册页中有关 -c 选项的描述应为:
The fault class or comma-separated list of fault classes that testemail uses to generate an event.
(testemail 用于生成事件的错误类或以逗号分隔的错误类列表。)
-c fault_class, fault_class, fault_class
Examples of valid fault classes are in the file /etc/opt/SUNWSMS/config/SF15000.dict .
(/etc/opt/SUNWSMS/config/SF15000.dict 文件中提供了有效的错误类实例。)
When invoking testemail using an ecache resource, make sure that the system board containing the ecache is powered on. Otherwise, the testemail invocation will fail and no email will be generated.
(使用 ecache 资源调用 testemail 之前,应接通包含 ecache 的系统板的电源。否则,对 testemail 的调用将失败,也不会生成电子邮件。)
有关 Sun Fire 高端系统的 VCMON 的描述是错误的。正确的描述,可参见本文档中 VCMON。
在有关 showboards 命令的描述中,-a 选项应为 -v。
在有关 showenvironment 命令的描述中,应删除类别 "Devide"。
showlogs -d domain_indicator -p s
showlogs -d domain_indicator -p c
smsupgrade:升级安装在系统中的现有 SMS 软件。
应在错误代码 11300 与 50000 之间添加以下错误消息类别:
升级 Solaris OS。请参见第 31 页的“升级 SC 上的 Solaris OS”。
执行完主 OS 升级(请参见第 32 页)后,请运行 smsupgrade 以重新安装 SMS。否则,请继续执行下一步,以恢复 SMS 配置。
标题“重新安装 SMS 1.5 软件”应为“恢复 SMS 1.5 配置”。
版权所有 © 2005, Sun Microsystems, Inc. 保留所有权利