这些问题包括您应该了解的信息,例如,先决条件、提示、错误诊断提示和错误。错误是问题的一部分。错误的跟踪号码显示在括号内。有关错误的更新和修补程序,请访问 SunSolveSM Web 站点,网址为 http://sunsolve.sun.com。
解决方法:使用 es-config 命令来更改代理的 SNMP 端口。
单击 Java 控制台中的“帮助”按钮时,它将指向 Sun Management Center 3.6 的文档集,而不是 Sun Management Center 3.6.1 的文档集。
解决方法:要获得 Java 控制台帮助信息,请对 /var/opt/SUNWsymon/cfg/javaconsole.properties 文件中的 sunmc.docs.path 条目进行如下编辑:
sunmc.docs.path=docs.sun.com/app/docs/coll/810.8?
要获得 Web Console 帮助信息,请对 /opt/SUNWsymon/web/console/smwebconf/smwebconf.properties 文件中的 sunmc.docs.path 条目进行如下编辑:
sunmc.docs.path=docs.sun.com/app/docs/coll/810.8?
解决方法:关闭“主机详细信息”窗口,然后重新打开该窗口。屏幕上将显示“硬件汇总”表。
在“详细信息”窗口的“硬件”选项卡中,不管当前视图如何,系统的物理视图总被设置为前视图。同样,历史记录也只显示前视图。
解决方法:无。
通过 CLI/GUI 安装程序或“代理更新”过程对 Solaris x86 或 Linux 代理进行升级后,拓扑中不能自动反映出更新后的信息。
解决方法:代理升级之后,手动修改拓扑对象。
在 Solaris SPARC 系统上,可通过“代理更新”过程来创建包含 X86/X64 配置读取器附加软件的映像。但是,该附加软件不会安装在 Solaris SPARC 系统上。
解决方法:为 Solaris SPARC 系统创建映像时,应只选择适用的附加软件。
重新引导系统后,当 Sun Management Center 服务尝试启动时会妨碍 cryptosvc 服务的启动和 kcfd 守护进程的运行,由此导致后两者在 /var/adm/messages 中记录错误。
可能显示以下错误消息:
Oct 3 18:16:09 atqa32 lomv: 10/3/2005 23:16:9 GMT LOM time reference |
Oct 3 18:16:13 atqa32 kcfd[106]: kcfd: elfsign_hash_mem_resident failed to hash for /usr/lib/security/pkcs11_softtoken.so: sign or verify of ELF object failed |
Oct 3 18:16:13 atqa32 kcfd[106]: kcfd: elfsign_hash_mem_resident failed to hash for /usr/lib/security/pkcs11_softtoken.so: sign or verify of ELF object failed |
Oct 3 18:16:13 atqa32 esd[1949]: libpkcs11: /usr/lib/security/pkcs11_softtoken.so signature verification failed. See cryptoadm(1M). Skipping this plug-in. |
Oct 3 18:16:13 atqa32 esd[1949]: libpkcs11: /usr/lib/security/pkcs11_softtoken.so signature verification failed. See cryptoadm(1M). Skipping this plug-in. |
Oct 3 18:16:13 atqa32 cfgserver[1949]: syslog Oct 03 18:16:13 cfgserver Unable to get pkcs session. Can not initialize snmp engine |
Oct 3 18:16:13 atqa32 cfgserver[1949]: syslog Oct 03 18:16:13 cfgserver *** terminating execution *** |
解决方法:重新引导系统之前,使用 es-stop -A 停止所有 Sun Management Center 服务。重新引导系统后,所有服务都将自动启动,并且不出现任何错误。
在 Solaris 10 系统上,Sun Management Center 代理服务会在引导过程中被停止。
可能显示以下错误消息:
Oct 12 09:19:59 atqa33 metadata[6245]: [ID 985908 daemon.alert] syslog |
Oct 12 09:19:59 metadata {received software termination signal}
|
Oct 12 09:19:59 atqa33 metadata[6245]: [ID 122441 daemon.alert] syslog |
Oct 12 09:19:59 metadata *** terminating execution *** |
Oct 12 09:19:59 atqa33 event[27957]: [ID 652029 daemon.alert] syslog |
Oct 12 09:19:59 event {received software termination signal}
|
Oct 12 09:19:59 atqa33 event[27957]: [ID 721961 daemon.alert] syslog |
Oct 12 09:19:59 event *** terminating execution *** |
Oct 12 09:19:59 atqa33 agent[28990]: [ID 651061 daemon.alert] syslog |
Oct 12 09:19:59 agent {received software termination signal}
|
Oct 12 09:19:59 atqa33 agent[28990]: [ID 891934 daemon.alert] syslog |
Oct 12 09:19:59 agent *** terminating execution *** |
解决方法:重新引导系统之前,使用 es-stop -A 停止这些服务。在这种情况下,系统不会将错误消息记录到 syslog 文件中。
出现以下某种情况时,Sun Management Center 数据库会包含重复的主机条目:
安装后更改了主机的 IP 地址。
安装后更改了主机的名称。
主机名具有多个主机别名。
解决方法:
请遵循以下建议,以免数据库中包含重复的条目:
不要使用组合对象。
不要使用子网或 IP 地址范围搜索。
在将主机添加到拓扑之前,确保代理计算机上的 /var/opt/SUNWsymon/cfg/domain-config.x 文件中包含其主机名。
如果从代理的 ACL 中删除 esadm 组,然后再将各个用户添加到该代理的 ACL 中,则这些用户不会自动添加到服务器支持模块的 ACL 中。由于服务器支持模块无法取得更新后的用户信息,因此服务器支持模块不允许启用或禁用性能报告管理器。将显示以下消息:
Unable to enable/disable PRM data collection on an agent with new user |
解决方法:将 esadm 组添加到代理的 ACL 中,然后将各个用户添加到 esadm 组中。
解决方法 1:执行以下操作:
最小化登录屏幕,然后重新显示它。
在具有活动光标的字段中键入要输入的内容。
将光标定位到下一个字段中。
最小化登录屏幕,然后重新显示它。
在该字段中键入要输入的内容。
解决方法 2:使用 JDK 1.4 或其他兼容版本。
如果将区域代理用作基本代理,则无法在区域代理中使用模块配置传播 (Module Configuration Propagation, MCP),同时也无法将配置数据从 MCP 传播到区域代理。
在区域代理作为基本代理的情况下,当 MCP 传播失败后,taskreq.log 中将记录以下错误消息。
Http error : HTTP/1.1 404 File not found: /var/opt/SUNWsymon/mcp/procmon-zoneagentbase/index.xml |
向区域代理进行 MCP 传播失败后,taskreq.log 中将记录以下错误消息。
Operation mcp has failed on target:hostname:1161 Exception was thrown: /usr/bin/nawk: can't open file /var/opt/SUNWsymon/cfg/base-modules-d.dat.MCP |
解决方法:编辑区域代理的 /var/opt/SUNWsymon/zone-scripts-d.dat 文件,在其中添加 es-mcp-get 和 es-mcp-put 脚本名称。
解决方法:无。
解决方法:无。
通过指定一个 IP 范围并选择特定的平台类型来执行“搜索”请求时,如果以下所有条件都为真,则该请求不会搜索到任何对象。
在“搜索”请求中选择了默认端口选项。
同时还指定了要对其进行搜索的附加端口。
在要对其进行搜索的主机上,默认端口和附加端口均已被占用。
解决方法:如果希望检查被搜索对象上的默认端口和附加端口,请为默认端口和附加端口分别创建单独的“搜索”请求。
解决方法:无。
解决方法:CST 服务运行过程中无法创建任务。请使用 es-stop -x 停止 CST 服务。
解决方法:编辑被调用的脚本,在其中添加两到三秒的休眠时间。
在命令行界面中使用 help 命令的 about 参数和 legal 参数时显示错误的产品版本。
解决方法:无。
在安装性能报告管理器数据库的过程中单击“下一步”按钮可能会导致错误。
解决方法:不要在配置性能报告管理器数据库的过程中单击“下一步”按钮。
在 NetscapeTM 版本 4.7.x 浏览器中查看简体中文语言环境(zh_CH.GBK 和 zh_CN.BG18030)的页面文本时出现乱码。
解决方法:指定其他浏览器作为默认浏览器。已知以下浏览器可以在这些语言环境中正常运行:
NetscapeTM 6.2.2
Netscape 7.x
MozillaTM
Microsoft Internet Explorer
如果 OS 表中的 OS 版本包含空格,则该空格无法正确显示在“规则”窗口中。
解决方法:使用 ASCII 字符来定义 OS 版本。
如果没有对 OS 对象进行初始化,则 Web 控制台将显示错误页面。
解决方法:使用 Java 控制台来显示数据。
假定使用 Sun N1TM System Manager (N1SM) GUI 创建的容器名称中使用了多字节字符串。这种情况下,在 Sun Management Center 控制台的“主机详细信息”窗口的以下位置,将无法正确显示容器名称:
1. “模块浏览器”选项卡 -> 硬件 -> VSM 模块 -> VSM 对象 -> 容器对象 -> 容器表中的容器名称
2. “模块管理器”选项卡 -> VSM 模块 -> 规则 ->“属性名称”列表
解决方法:Sun Management Center 不支持在数据字段中使用多字节字符串。因此,应使用 ASCII 字符来表示容器名称,以便将 Sun Management Center 与 N1SM 进行集成。
即使问题已经解决,但在 Sun StorEdge D1000 的附件上进行完整的硬件诊断套件测试时可能仍会报告非关键性错误,如电源电缆被拔下。
解决方法:重新启动与 Sun StorEdge D1000 系统连接的 Sun Management Center 代理。
如果将 JAVA_HOME 路径设置为一个长度超过 80 个字符的值,屏幕将显示以下不正确的错误信息:
无法启动硬件服务 |
可以键入以下命令,检查硬件诊断套件是否正在运行:
% ps -ef | grep HWDS |
解决方法:忽略此错误消息。硬件诊断套件能够正确启动。
硬件诊断套件只能在全局区域内运行。由于 Sun Management Center 的设置脚本中存在一个错误,因此硬件诊断套件无法在本地区域中正确运行。
解决方法:不要在本地区域内运行硬件诊断套件。
如果安排 15 个或更多个性能报告管理器报告请求同时运行,则在软件运行一段时间后,可能会遇到以下一个或几个问题:
未从代理计算机收集数据
某些报告请求一直处于不确定的运行状态
无法按要求安排报告请求
无法按要求安排编组任务请求
无法启动“报告管理器”GUI
无法启动“管理作业”GUI
对于上面提到的某些问题,在启动“管理作业”GUI 时,控制台可能显示以下错误信息:
任务服务不可用 |
与此类似,对于其中的某些问题,在启动“报告管理器”GUI 时,控制台可能显示以下错误信息:
报告服务不可用 |
解决方法:遇到此问题后,请停止并重新启动服务器组件。键入以下命令:
# es-stop -A |
# es-start -A |
要避免出现此问题,请不要安排 15 个以上的报告请求同时运行。将安排的请求的运行时隔开一段时间。例如,如果每小时要运行 20 个请求,可以将这些请求分为两批,每批包含 10 个请求。安排这两批请求相隔 15 分钟运行,而不要安排这两批请求同时运行。
选择“所有主机”选项并指定过滤器后,警报报告中未能正确过滤出代理计算机的警报记录。
指定过滤器并选择“所有主机”选项后,指定的过滤标准将应用于所有主机的所有警报记录。报告输出中将返回过滤后的警报。此外,报告还包括了来自所有被监视主机的任何“代理无响应”警报和“主机无响应”警报。指定的过滤标准未应用于此类警报。
解决方法:可以通过为警报报告明确指定主机名来避免此问题。请选择以下解决方法之一:
在为单台主机生成警报报告时,通过提供 hostname:port 来选择主机名,或者从 Sun Management Center 拓扑视图中选择主机名。
在为多台主机生成警报报告时,以 hostname:port 的格式列出各个主机名,主机名之间用逗号隔开;或者从 Sun Management Center 拓扑视图中选择多个主机名。
在 IMAP4 的服务元素模块和 IMAP4 的合成事务模块的服务测量表中添加的行具有空 (0) 单元值。如果在卸载并重新加载这些模块后添加行,将导致失败并显示以下消息:
存在具有以下索引的行:nnn |
此错误可能导致 IMAP4 服务元素模块和 IMAP4 合成事务模块无法在 x86 系统上正常工作。
解决方法:确保在 SPARC 代理主机上加载了 IMAP4 合成事务模块,以监视 x86 系统上运行的 IMAP 服务。此外,还需要对加载的模块进行配置,使之能够探测到 x86 系统上的 IMAP 服务。
在 Microsoft Windows 2000 系统上,如果运行的 Java 运行时环境的版本是 1.3.1 到 1.4.0,“修改服务对象”对话框的某些文本字段可能不接受字符输入。当试图将服务类型从缺省的 HTTP 更改为其他值时,不接受为“主机名”字段和“实例”字段提供的字符。
如果运行的是 Java 运行时环境 1.4.1 版,则不会出现此问题。
解决方法:在使用“修改服务对象”对话框之前,在 Microsoft Windows 2000 系统上安装 Java 运行时环境 1.4.1 版。
如果使用命令行界面 (Command Line Interface, CLI) 来安装 Sun Management Center,则只能安装该软件的英文版。此版本中的 CLI 没有本地化。其英文界面不会影响安装进程或功能。
解决方法:要在本地语言环境下执行安装,请使用 GUI 进行安装 (es-guiinst) 和设置 (es-guisetup)。
如果您选择了某个非英文语言环境,则“使用情况图”的图像名称和标题将会显示为英文。这些值没有本地化。
在运行 Solaris 8 OS 的系统中,Container Manager 的扩展记帐特性被禁用。因而,Solaris 8 系统中容器的 CSV 文件的“扩展记帐数据 (Exacct)” 栏将为空。
如果代理主机的 /etc/project 数据库中的某个项目与 Sun Management Center 数据库中的某个项目具有相同的项目 ID,但具有不同的项目名称,则 Container Manager 将无法搜索到该项目。Container Manager 要求项目的 ID 在同一服务器环境的所有主机间是唯一的。
不应使用 projadd 命令来创建项目。只能使用 Container Manager 来管理项目。
解决方法:将使用 projadd 命令创建的非默认项目从代理主机的 /etc/project 数据库中删除,然后使用 Container Manager 中的“新建容器”向导创建容器。
在创建、修改或删除区域、池或项目的过程中显示的错误消息不完整,无法提供足够的详细信息。下面是您可能会遇到的错误消息:
无法创建资源池
无法创建区域
无法更新项目、区域或池
无法为有效用户激活容器
无法将容器与主机相关联
解决方法:如果您遇到上述错误中的任何一个,请参阅以下有关配置文件的建议。在此之前,应确保用户是有效的 Sun Management Center 用户,并具有必要的管理权限(属于 esadm、esdomadm 组)。
运行以下命令,确保用户已与必需的配置文件关联:
$ profiles <username>
以下是必需的配置文件:
在 Solaris 10 上 - 区域管理、池管理、项目管理
在 Solaris 9 上 - 池管理、项目管理
在 Solaris 8 上 - 池管理、项目管理
如果发现缺少必需的配置文件,请运行以下命令(以超级用户身份)并修改与用户关联的配置文件:
# usermod -P "<comma separated list of necessary profiles>" <username>
如果系统中不存在某个配置文件,请按以下格式将缺少的条目添加到 /etc/security 目录下的 prof_attr 文件中。
Pool Management:::Resource pool management profile:help=RtPoolMgmt.html
Project Management:::Manage Solaris projects:auths=solaris.project.read,solaris.project.write; help=RtProjManagement.html
运行以下命令检查用户是否位于 SCM 模块的本地访问用户列表中。
<BASEDIR>/SUNWsymon/sbin/es-config -M scm-container -s
如果用户不在此访问列表中,请运行以下命令:
<BASEDIR>/SUNWsymon/sbin/es-config -M scm-container -l <user_name>
代理发生崩溃后,/var/opt/SUNWsymon/cfg/ 目录下会残留有名如 scm-container* 的文件。当代理重新启动时,它可能不会以最佳方式执行。当代理重新启动时可能不会以最佳方式运行。这种情况可通过以下错误消息得以体现:
Insufficient security privilege to complete the operation.
您可以键入以下命令来确定代理上进程的状态:
% ps -eaf | grep esd
解决方法:要提高性能,请键入以下命令:
成为超级用户。
% su -
停止该代理。
# /opt/SUNWsymon/sbin es-stop -a
删除状态文件。
# rm /var/opt/SUNWsymon/cfg/scm-container*
重新启动代理。
#/opt/SUNWsymon/sbin/es-start -a
服务器重新引导后,Java Web Console 不能自动启动。
要启动 Java Web Console,请键入以下命令:
成为超级用户。
% su -
键入超级用户密码。
重新启动 Java Web Console。
# /usr/sbin/smcwebserver restart
确保 Java Web Console 将来会重新启动。
# /usr/sbin/smcwebserver enable
解决方法:无。
如果从“新建区域”向导的“语言环境”下拉菜单中选择了某个无效的语言环境,则区域创建操作会失败。“语言环境”下拉菜单中可能包含无效的语言环境值。
要确定有效的语言环境,请参阅《International Language Environments Guide》中的 "Supported Locales"。
解决方法:从“新建区域”向导的“语言环境”下拉菜单中选择一个有效的语言环境。如果对某个语言环境值不太确定,请选择 C(代表英文语言环境)。
报警情况发生时,可能会显示报警标记的工具提示而不是报警标记本身。
如果您导航至另外的窗格,然后再返回到报警对象的图标,则图标上的标记会正确显示。
解决方法:无。
单击浏览器的“后退”按钮时,Container Manager 可能会抛出异常。此发行版不支持使用浏览器的“后退”按钮。
要从此异常恢复,请转至 https://服务器名:6789/containers 并导航到相应的页面。
解决方法:无。
在 Solaris 9 操作系统中,某些进程(比如用户 nobody 运行的 JavaTM 应用程序)由于 newtask 命令中的一个错误而没有被移入到容器内。
解决方法:使用 newtask 命令在适当的容器中启动由用户 nobody 运行的应用程序。
# /usr/bin/newtask -p 项目名称 命令 |
其中,项目名称是指要在其中启动应用程序的项目,命令是指用来启动应用程序的命令。
有关更多信息,请参见 newtask(1) 手册页。
如果您在创建容器定义时使用了以下四个匹配表达式之一,并随后激活了容器,则代理主机将会挂起:
n
ns
nsc
nscd
解决方法:使用 newtask 命令在适当的项目中启动 nscd 进程:
# /usr/bin/newtask -p 项目名称 命令 |
其中,项目名称是指要在其中启动应用程序的项目,命令是指用来启动应用程序的命令。
有关更多信息,请参见 newtask(1) 手册页。
如果您计划在服务器层重新安装 Sun Management Center 软件,请确保在执行卸载操作时保存数据。同样,如果要再次在服务器层运行设置,当系统问及是否要重新创建数据库时,请务必回答 "No"。否则,如果您在没有保存数据的情况下在服务器层重新安装或设置,则以前搜索到的代理主机可能会从数据库丢失。
解决方法:如果重新安装或重新设置之后主机丢失,请执行以下过程,在主机上重新启动 Sun Management Center 代理:
登录到代理系统。
成为超级用户。
% su -
键入以下命令,停止 Sun Management Center 代理:
# /opt/SUNWsymon/sbin/es-stop -a |
键入以下命令,启动 Sun Management Center 代理:
# /opt/SUNWsymon/sbin/es-start -a |
要访问其他物理计算机上的某个区域,请从全局区域键入 zlogin -C <zone-name>,然后对该区域进行设置。
创建区域时,应在“名称服务器”字段中键入名称服务器的值,并在其后键入 IP 地址。例如,“名称服务器”字段中的值可以是 ns1.sun.com (10.255.255.255)。
本发行版中未更新入门级平台 (Entry-Level Platform, ELP)、Netra、桌面/工作站和工作组服务器附加软件的本地化软件包,原因是不需要对其前两个发行版进行任何更改。
解决方法:无。
ELP、Netra 和桌面/工作站的配置读取器中存在此问题。
在使用 Solaris10 软件的 Netra 240/440/T4、Sun Blade 100 和 Sun Fire V240 服务器上,平台信息和控制库 (Platform Information and Control Library, PICL) 可能无法说明初始化后的某些系统配置更改,如 bge1-bge3 驱动程序。这些驱动程序的实例反映在 prtconf -v 命令的输出中,但没有反映在 prtpicl -v 命令的输出中。
解决方法:通过执行 svcadm restart picl 命令,使 PICL 的输出与 prtconf 实用程序的输出相同。
使用 cfgadm 命令在运行 Solaris 10 的系统板上完成动态重新配置 (Dynamic Reconfiguration, DR) 操作后,配置读取器表中的若干值要么未显示,要么显示为 "--"。受影响的配置读取器表条目如下:
系统
网络设备
LOM
ASR
LOM 事件
LOM 警报
故障指示器
“硬件汇总”和“物理视图”也会受到影响。“硬件汇总”的值将显示为 "--",而“物理视图”无法显示该系统的图形。
解决方法:
在完成 DR 操作后,使用以下命令重新启动 PICL 守护进程:
对于 Solaris 8 和 Solaris 9 系统:
% /etc/init.d/picld stop
% /etc/init.d/picld start
对于 Solaris 10 系统:
% svcadm restart svc:/system/picl:default
在 Netra 1280 服务器上对 DC PSU 类型 D142 进行动态重新配置后,PICL 守护进程没有得到更新。
解决方法:在完成 DR 操作后,使用以下命令重新启动 PICL 守护进程:
对于 Solaris 8 和 Solaris 9 系统:
% /etc/init.d/picld stop
% /etc/init.d/picld start
对于 Solaris 10 系统:
% svcadm restart svc:/system/picl:default
“直流电源”报告的字段 A 和 B 显示错误,与实际情况相反。如果 A 有故障而 B 正常,则 Sun Management Center 将报告 B 有故障而 A 正常,反之亦然。
解决方法:无。
在 Solaris 10 系统上执行 DR 操作的删除过程期间,无法检测到内部设备(如磁盘和网络)。
解决方法:在完成 DR 操作后,使用以下命令重新启动 PICL 守护进程:
% svcadm restart picl
此解决方法可能无法启用在 Solaris 10 系统上运行的代理,这些代理可用于检测何时对内部设备(磁盘、网络)执行了删除、插入或重新配置等操作。
在具有两个对象的 Sun Fire V880 和 Sun Fire V480 服务器上,当您基于搜索到的对象选择“警报”选项卡时,将显示一条类似以下消息的警报警告消息。
可能显示以下警告消息:
无法从代理获取事件管理信息。代理忙或已关闭。将默认进入本地事件管理器。
此警告消息很可能有误,并且代理很可能在正常运行。
单击“确定”使警报选项卡表默认进入本地事件管理。如果关闭并再次打开了搜索到的对象的“详细信息”窗口,则单击“警报”选项卡将会导致显示相同的警告消息。
解决方法:无。
Sun Fire V890 服务器附带 UltraSparc-IV 处理器。但是,“硬件规则”表的“属性”列错误地将该处理器的类型显示为“可更正内存错误,Ultra Sparc III”和“可更正 I/O 错误,Ultra Sparc III”。
解决方法:无。