以下已知问题和错误会影响 Sun Cluster 3.1 9/04 发行版的运行。
问题摘要:当引导设备采用多路径时,scvxinstall 所创建的 vfstab 条目不正确。
解决方法:运行 scvxinstall 并选择封装。系统显示以下消息时,键入 Ctrl-C 异常终止重新引导:
This node will be re-booted in 20 seconds. Type Ctrl-C to abort. |
编辑 vfstab 条目,使 /global/.devices 使用名称 /dev/{r}dsk/cXtXdX 而非名称 /dev/did/{r}dsk。这个经过修改的条目使 VxVM 将其识别为根磁盘。重新运行 scvxinstall 并选择封装。vfstab 文件进行必要的更新。允许系统重新进行引导。封装将照常进行。
问题摘要:Sun Cluster for HA for Oracle 数据服务使用 su 命令来启动和停止数据库。如果运行的是 Solaris 8 或 Solaris 9,则当群集节点的公共网络发生故障时,网络服务可能会不可用。
解决方法:在可以成为 oracle_server 资源或 oracle_listener 资源的主节点的每个节点上的 /etc/nsswitch.conf 文件中包含以下条目:
passwd: files groups: files publickey: files project: files
这些条目可确保 su 命令不会引用 NIS/NIS+ 名称服务,以使数据服务在网络发生故障期间能够正常启动和停止。
问题摘要:如果一个或多个群集节点具有 4 个以上 CPU,则在专用互连上使用 ce 适配器的群集会观测到路径超时以及随后发生的节点瘫痪。
解决方法:通过在所有群集节点中的 /etc/system 文件中添加以下行来设置 ce 驱动程序中的 ce_taskq_disable 参数。
set ce:ce_taskq_disable=1
然后,重新引导群集节点。重新引导群集节点时请注意法定数目。设置此参数可确保在中断环境中能始终传送心跳(和其他数据包),从而消除路径超时以及随后发生的瘫痪。
问题摘要:Sun Cluster HA for SAP liveCache 数据服务使用 dbmcli 命令来启动和停止 liveCache。如果运行的是 Solaris 9,则当群集节点的公共网络出现故障时,网络服务可能会不可用。
解决方法:在可以成为 liveCache 资源主节点的每个节点上的 /etc/nsswitch.conf 文件中包含 publickey 数据库的以下条目之一:
publickey: publickey: files publickey: files [NOTFOUND=return] nis publickey: files [NOTFOUND=return] nisplus
除了《用于 SAP liveCache 的 Sun Cluster 数据服务指南(适用于 Solaris OS)》中介绍的更新之外,添加上述条目之一可确保 su 命令和 dbmcli 命令不引用 NIS/NIS+ 名称服务。绕过 NIS/NIS+ 名称服务可确保在网络发生故障期间数据服务可以正常启动和停止。
问题摘要:由于内部错误,Sun 提供的某些群集代理使用 LOG_USER 工具而不使用 LOG_DAEMON 来将消息写入系统日志(请参见 syslog(3C))。在配置为使用缺省系统日志设置(请参见 syslog.conf(4))的群集中,通常会将严重程度为 LOG_WARNING 或 LOG_NOTICE 的消息写入系统日志,而不会将其输出。仅对以 shell 脚本编写的代理代码才会出现此问题。
解决方法:
以下解决方法适用于编写 shell 脚本的代理开发者:
在 shell 脚本中,将工具明确地传递给 scds_sylog:
facility=`scha_cluster_get -O SYSLOG_FACILITY
'scds_syslog -p ${facility}.error -m "error message"
以下解决方法适于群集管理员:
在所有群集节点上的 /etc/syslog.conf 文件接近开头的部分添加以下条目:
user.warning /var/adm/messages
此条目能使 user.warning 消息被记录。您可以为 user.notice 消息添加类似的条目,但这样做既没有必要,还可能导致日志过快地填满,这取决于正在运行的混用的应用程序。
问题摘要:《用于 SAP liveCache 的 Sun Cluster 数据服务指南(适用于 Solaris OS)》的“准备节点和磁盘”中对 nsswitch.conf 文件的要求不适用于 passwd 数据库中的条目。如果满足了这些要求,则在公共网络关闭时,su 命令可能会在可以控制 liveCache 资源的每个节点上都挂起。
解决方法:在可以控制 liveCache 资源的每个节点上,确保 passwd 数据库的 /etc/nsswitch.conf 文件中的条目为:
passwd: files nis [TRYAGAIN=0]
问题摘要:如果同时从多个节点启动,则 sccheck 可能挂起。
解决方法:不要从任何用于将命令传递到多个节点的多控制台启动 sccheck。sccheck 可以重叠运行,但不应同时启动。
问题摘要:目前,HA-DB 数据服务不使用 JAVA_HOME 环境变量。因此,当从 HA-DB 数据服务调用 HA-DB 时,HA-DB 将从 /usr/bin/ 获取 Java 二进制文件。需要将 /usr/bin/ 中的 Java 二进制文件链接到 Java 的适当版本(Java 1.4 或更高版本)才能使 HA-DB 数据服务正常工作。
解决方法:如果您同意更改可用的缺省版本,请执行以下过程。作为示例,此解决方法假定了 /usr/j2se 目录是最新的 Java 版本(例如 1.4 和更高版本)所在的目录。
当前,在 /usr/ 目录中是否有名为 java/ 的目录?如果有,请将此目录移动到一个临时位置。
在 /usr/ 目录中,将 /usr/bin/java 和所有其他与 Java 相关的二进制文件都链接到 Java 的相应版本。
# ln -s j2se java |
如果不想更改可用的缺省版本,请在 /opt/SUNWappserver7/SUNWhadb/4/bin/hadbm 脚本中使用 Java 的适当版本(J2SE 1.4 或更高版本)来指定 JAVA_HOME 环境变量。
问题摘要:由于错误 4974875,因此只要执行自动恢复,数据库自身就将进行重新初始化且没有任何备用设备。所提到的错误已被修正并集成到 HA-DB 4.3 版中。对于 HA-DB 4.2 和更低版本,请按照以下过程之一更改 HA-DB 节点的角色。
解决方法:
在自动恢复成功之后,标识其角色发生更改的 HA-DB 节点。
在步骤 1 中标识的所有节点上,禁用当前 HA-DB 资源的故障监视器(一次一个节点)。
# cladm noderole -db dbname -node nodeno -setrole role-before-auto_recovery |
启用当前 HA-DB 资源的故障监视器。
或
在自动恢复成功之后,标识其角色发生更改的 HA-DB 节点。
在托管数据库的所有节点上,禁用当前 HA-DB 资源的故障监视器。
在任一节点上,对需要更改其角色的每个 HA-DB 节点执行以下命令。
# cladm noderole -db dbname -node nodeno -setrole role-before-auto_recovery |
问题摘要:在滚动升级期间,如果 scstat -i 命令是在尚未升级的群集节点上运行,则 scstat 输出将不会显示在已升级的节点上托管的 IPMP 组的状态。
解决方法:使用来自已升级节点的 scstat -i 输出。
问题摘要:如果 LogicalHostname 资源需要使用带有有故障的适配器的 IPMP 组,则无法将此 LogicalHostname 资源添加到群集中。
解决方法:尝试在 LogicalHostname 资源中使用 IPMP 组之前,删除 IPMP 组中有故障的适配器或修正此故障。
问题摘要:资源组状态页面中的“状态”和“类型”两个字段显示曾用于查看该页的第一语言环境中的值。
解决方法:要以其他语言环境查看值,请重新启动 Web 服务器。
问题摘要:封装根磁盘之后,如果解除封装然后又重新封装该根磁盘,则可能会看到名为 uservol 的卷被用于 /global/devices/node@nodeID 文件系统。这可能导致问题,因为每个节点的全局设备文件系统的卷名称必须唯一。
解决方法:按照所述步骤执行解除封装之后,请在再次运行 scvxinstall 重新封装根磁盘之前中止 vxconfigd 守护进程。
问题摘要:登录到 Sun Web Console 时,如果重复按“登录”或“进入”按钮,多个登录请求可能会导致多个失败,由此而无法对 SunPlex Manager 进行访问。
解决方法:成为群集节点上的超级用户并重新启动 Sun Web Console。
# /usr/sbin/smcwebserver restart |
问题摘要:当资源声明对可伸缩模式资源具有 any node 资源组间重新启动依赖性时,Resource_dependencies_restart 资源特性未按预期运行。大多数数据服务都不会受到影响。
有关资源组间依赖性和重新启动依赖性的背景:
通过使用 Sun Cluster 3.1 9/04 中的资源组间依赖性特性,Sun Cluster 软件支持可以跨资源组界限的资源依赖性。Sun Cluster 软件还支持新类型的资源依赖性 restart dependency。如果依赖资源处于联机状态,则 restart dependency 将在被依赖的资源启动时导致依赖资源自动重新启动。
有关 local node 与 any node 依赖性的背景:
如果组 RG1 中的资源 r1 依赖于 RG2 中的 r2,RG1 与 RG2 具有正关联,并且 RG1 和 RG2 在同一节点上同时启动或停止,则 r1 对 r2 的依赖性为 local node 依赖性。例如,在同一节点上启动 RG1 和 RG2 时,r1 会先等 r2 在该节点上启动之后,r1 才在同一节点上启动。r2 在其他节点上的状态对 r1 何时启动没有影响。
但是,如果 RG1 没有声明与 RG2 具有正关联,或如果它们具有弱正关联,但资源组在不同的节点上启动,则 r1 对 r2 的依赖性为 any node 依赖性。此依赖性表示 r2 在任何节点上启动之后,r1 就会启动。
问题说明:
当资源组 RG2 是可伸缩模式资源组(即多主资源组),且 r1 对 r2 的依赖性为 any node 重新启动依赖性时,就会出现该问题。每次启动 r2 的任何实例时,r1 都会重新启动。r1 只应在 r2 的第一个实例启动时重新启动。
解决方法:修正此错误后,当前的重新启动依赖性行为将会发生变化,如上所述。请不要开发依赖于当前不正确行为的代码或管理程序。
问题摘要:如果有 Sun Enterprise 15000 服务器并运行了 sccheck 命令,检查将失败并报告一个错误,该错误表明不支持 Sun Enterprise 15000 服务器。此陈述是不正确的。
解决方法:不必采取任何解决方法。Sun Cluster 软件支持 Sun Enterprise 15000 服务器。sccheck 命令报告的错误说明该检查可能已过时。在这种情况下,sccheck 已过时。
问题摘要:对于不属于 Sun Java Enterprise System 的数据服务代理,法文 (fr) 是不可用的语言选项。但是,那些软件包的 GUI 安装程序却给出了相反的建议。
解决方法:忽略 GUI 安装程序的不精确说明。法文 (fr) 不可用。
问题摘要:在升级到 Sun Cluster 3.1 9/04 软件期间,scinstall 命令安装了新的Common Agent Container软件包 SUNWcacao 和 SUNWcacaocfg,但并未向所有群集节点分发相同的安全密钥。
解决方法:执行以下步骤以确保Common Agent Container安全文件在所有群集节点上都相同,并确保所复制的文件保持正确的文件权限。Sun Cluster 软件需要这些文件。
在一个群集节点上,切换到 /etc/opt/SUNWcacao/ 目录。
phys-schost-1# cd /etc/opt/SUNWcacao/ |
创建 /etc/opt/SUNWcacao/security/ 目录的 tar 文件。
phys-schost-1# tar cf /tmp/SECURITY.tar security |
将 /tmp/SECURITY.tar 文件复制到其他每个群集节点上。
在向其复制了 /tmp/SECURITY.tar 文件的每个节点上,提取安全性文件。
将覆写 /etc/opt/SUNWcacao/ 目录中已存在的所有安全性文件。
phys-schost-2# cd /etc/opt/SUNWcacao/ phys-schost-2# tar xf /tmp/SECURITY.tar |
从群集中的每个节点删除 /tmp/SECURITY.tar 文件。
必须删除 tar 文件的所有副本以避免安全隐患。
phys-schost-1# rm /tmp/SECURITY.tar phys-schost-2# rm /tmp/SECURITY.tar |
在每个节点上,重新启动安全性文件代理。
# /opt/SUNWcacao/bin/cacaoadm start |
问题摘要:SunPlex Manager 的“高级过滤器”面板上的日期字段只接受 mm/dd/yyyy 格式。但是,在非英语语言环境中,日期格式不同于 mm/dd/yyyy 格式,从日历面板返回的日期格式也不同于 mm/dd/yyyy 格式。
解决方法:在“高级过滤器”面板中以 mm/dd/yyyy 格式键入日期范围。请不要使用“设置”按钮来显示日历和选择日期。
问题摘要:在 Solaris 8 上使用 SunPlex Manager 删除资源组时,您可能会收到无法阅读的错误消息。在日文、韩文、繁体中文和简体中文中出现此问题。
解决方法:运行英文系统语言环境以显示英文错误消息。
问题摘要:在资源类型登记 (RTR) 文件 SUNW.sapscs 中,对两个扩展特性的描述不正确。
解决方法:对 Scs_Startup_Script 的描述应为 Startup script for the SCS. Defaults to /usr/sap/SAP_SID/SYS/exe/run/startsap。对 Scs_Shutdown_Script 的描述应为 Shutdown script for the SCS. Defaults to /usr/sap/SAP_SID/SYS/exe/run/stopsap。
问题摘要:通过使用 JumpStart 方法安装 Sun Cluster 软件后,Sun Web Console 无法启动 SunPlex Manager。JumpStart 安装后处理未能在 Sun Web Console 中成功地注册 SunPlex Manager。
解决方法:在所有节点上完成 Sun Cluster 软件的 JumpStart 安装之后,请在所有群集节点上运行以下脚本。
# /var/sadm/pkg/SUNWscspmu/install/postinstall |
此脚本将在 Sun Web Console 中登记 SunPlex Manager。
问题摘要:Sun Cluster 3.1 9/04 数据服务 CD-ROM(适用于 x86)上的安装程序不能用于安装 HA Oracle。安装程序将发出以下消息:
Could not find child archive ....
解决方法:使用 scinstall 安装 Sun Cluster Data Service for HA Oracle。
问题摘要:以下应用程序的数据服务不能使用 scinstall 实用程序进行升级:
Apache Tomcat
DHCP
mySQL
Oracle E-Business Suite
Samba
SWIFTAlliance Access
WebLogic Server
WebSphere MQ
WebSphere MQ Integrator
解决方法:如果要升级上面列出的应用程序的数据服务,请使用以下步骤替代《Sun Cluster Software Installation Guide for Solaris OS》中的 “Upgrading to Sun Cluster 3.1 9/04 Software (Rolling)”中有关升级数据服务的步骤。对于已安装数据服务的每个节点执行以下步骤。
删除要升级的数据服务的软件包。
# pkgrm pkg-inst |
pkg-inst 指定要升级的数据服务的软件包名称,如下表所列。
应用程序 |
数据服务软件包 |
---|---|
Apache Tomcat |
SUNWsctomcat |
DHCP |
SUNWscdhc |
mySQL |
SUNWscmys |
Oracle E-Business Suite |
SUNWscebs |
Samba |
SUNWscsmb |
SWIFTAlliance Access |
SUNWscsaa |
WebLogic Server(英文语言环境) |
SUNWscwls |
WebLogic Server(法文语言环境) |
SUNWfscwls |
WebLogic Server(日文语言环境) |
SUNWjscwls |
WebSphere MQ |
SUNWscmqs |
WebSphere MQ Integrator |
SUNWscmqi |
安装适用于要升级到的数据服务版本的软件包。
要安装软件包,请按照适用于要升级的数据服务的 Sun Cluster 文档中的说明进行操作。此文档可从 http://docs.sun.com/ 获得。