Sun Cluster 3.1 9/04 发行说明（适用于 Solaris OS）

已知问题和错误

以下已知问题和错误会影响 Sun Cluster 3.1 9/04 发行版的运行。

当引导设备采用多路径时，`scvxinstall` 所创建的 `vfstab` 条目不正确 (4639243)

问题摘要：当引导设备采用多路径时，scvxinstall 所创建的 vfstab 条目不正确。

解决方法：运行 scvxinstall 并选择封装。系统显示以下消息时，键入 Ctrl-C 异常终止重新引导：

This node will be re-booted in 20 seconds. Type Ctrl-C to abort.

编辑 vfstab 条目，使 /global/.devices 使用名称 /dev/{r}dsk/cXtXdX 而非名称 /dev/did/{r}dsk。这个经过修改的条目使 VxVM 将其识别为根磁盘。重新运行 scvxinstall 并选择封装。vfstab 文件进行必要的更新。允许系统重新进行引导。封装将照常进行。

HA Oracle 停止方法超时 (4644289)

问题摘要：Sun Cluster for HA for Oracle 数据服务使用 su 命令来启动和停止数据库。如果运行的是 Solaris 8 或 Solaris 9，则当群集节点的公共网络发生故障时，网络服务可能会不可用。

解决方法：在可以成为 oracle_server 资源或 oracle_listener 资源的主节点的每个节点上的 /etc/nsswitch.conf 文件中包含以下条目：

passwd: files
groups: files
publickey: files
project:  files

这些条目可确保 su 命令不会引用 NIS/NIS+ 名称服务，以使数据服务在网络发生故障期间能够正常启动和停止。

专用互连上的 `ce` 适配器观测到超时并造成节点瘫痪 (4746175)

问题摘要：如果一个或多个群集节点具有 4 个以上 CPU，则在专用互连上使用 ce 适配器的群集会观测到路径超时以及随后发生的节点瘫痪。

解决方法：通过在所有群集节点中的 /etc/system 文件中添加以下行来设置 ce 驱动程序中的 ce_taskq_disable 参数。

set ce:ce_taskq_disable=1

然后，重新引导群集节点。重新引导群集节点时请注意法定数目。设置此参数可确保在中断环境中能始终传送心跳（和其他数据包），从而消除路径超时以及随后发生的瘫痪。

SAP liveCache 停止方法超时 (4836272)

问题摘要：Sun Cluster HA for SAP liveCache 数据服务使用 dbmcli 命令来启动和停止 liveCache。如果运行的是 Solaris 9，则当群集节点的公共网络出现故障时，网络服务可能会不可用。

解决方法：在可以成为 liveCache 资源主节点的每个节点上的 /etc/nsswitch.conf 文件中包含 publickey 数据库的以下条目之一：

publickey: 
publickey:  files
publickey:  files [NOTFOUND=return] nis 
publickey:  files [NOTFOUND=return] nisplus

除了《用于 SAP liveCache 的 Sun Cluster 数据服务指南（适用于 Solaris OS）》中介绍的更新之外，添加上述条目之一可确保 su 命令和 dbmcli 命令不引用 NIS/NIS+ 名称服务。绕过 NIS/NIS+ 名称服务可确保在网络发生故障期间数据服务可以正常启动和停止。

某些代理不使用工具 `LOG_DAEMON` (4897239)

问题摘要：由于内部错误，Sun 提供的某些群集代理使用 LOG_USER 工具而不使用 LOG_DAEMON 来将消息写入系统日志（请参见 syslog(3C)）。在配置为使用缺省系统日志设置（请参见 syslog.conf(4)）的群集中，通常会将严重程度为 LOG_WARNING 或 LOG_NOTICE 的消息写入系统日志，而不会将其输出。仅对以 shell 脚本编写的代理代码才会出现此问题。

解决方法：

以下解决方法适用于编写 shell 脚本的代理开发者：

在 shell 脚本中，将工具明确地传递给 scds_sylog：

facility=`scha_cluster_get -O SYSLOG_FACILITY

'scds_syslog -p ${facility}.error -m "error message"
以下解决方法适于群集管理员：

在所有群集节点上的 /etc/syslog.conf 文件接近开头的部分添加以下条目：
```
user.warning		/var/adm/messages
```
此条目能使 user.warning 消息被记录。您可以为 user.notice 消息添加类似的条目，但这样做既没有必要，还可能导致日志过快地填满，这取决于正在运行的混用的应用程序。

不应将 `nsswitch.conf` 要求应用于 `passwd` 数据库 (4904975)

问题摘要：《用于 SAP liveCache 的 Sun Cluster 数据服务指南（适用于 Solaris OS）》的“准备节点和磁盘”中对 nsswitch.conf 文件的要求不适用于 passwd 数据库中的条目。如果满足了这些要求，则在公共网络关闭时，su 命令可能会在可以控制 liveCache 资源的每个节点上都挂起。

解决方法：在可以控制 liveCache 资源的每个节点上，确保 passwd 数据库的 /etc/nsswitch.conf 文件中的条目为：

passwd: files nis [TRYAGAIN=0]

`sccheck` 挂起 (4944192)

问题摘要：如果同时从多个节点启动，则 sccheck 可能挂起。

解决方法：不要从任何用于将命令传递到多个节点的多控制台启动 sccheck。sccheck 可以重叠运行，但不应同时启动。

Java 二进制文件链接到不正确的 Java 版本导致 HA-DB 代理出现故障 (4968899)

问题摘要：目前，HA-DB 数据服务不使用 JAVA_HOME 环境变量。因此，当从 HA-DB 数据服务调用 HA-DB 时，HA-DB 将从 /usr/bin/ 获取 Java 二进制文件。需要将 /usr/bin/ 中的 Java 二进制文件链接到 Java 的适当版本（Java 1.4 或更高版本）才能使 HA-DB 数据服务正常工作。

解决方法：如果您同意更改可用的缺省版本，请执行以下过程。作为示例，此解决方法假定了 /usr/j2se 目录是最新的 Java 版本（例如 1.4 和更高版本）所在的目录。

当前，在 /usr/ 目录中是否有名为 java/ 的目录？如果有，请将此目录移动到一个临时位置。
在 /usr/ 目录中，将 /usr/bin/java 和所有其他与 Java 相关的二进制文件都链接到 Java 的相应版本。
# ln -s j2se java

如果不想更改可用的缺省版本，请在 /opt/SUNWappserver7/SUNWhadb/4/bin/hadbm 脚本中使用 Java 的适当版本（J2SE 1.4 或更高版本）来指定 JAVA_HOME 环境变量。

HA-DB 重新初始化且没有备用设备 (4973982)

问题摘要：由于错误 4974875，因此只要执行自动恢复，数据库自身就将进行重新初始化且没有任何备用设备。所提到的错误已被修正并集成到 HA-DB 4.3 版中。对于 HA-DB 4.2 和更低版本，请按照以下过程之一更改 HA-DB 节点的角色。

解决方法：

在自动恢复成功之后，标识其角色发生更改的 HA-DB 节点。
在步骤 1 中标识的所有节点上，禁用当前 HA-DB 资源的故障监视器（一次一个节点）。
# cladm noderole -db dbname -node nodeno -setrole role-before-auto_recovery
启用当前 HA-DB 资源的故障监视器。

或

在自动恢复成功之后，标识其角色发生更改的 HA-DB 节点。
在托管数据库的所有节点上，禁用当前 HA-DB 资源的故障监视器。
在任一节点上，对需要更改其角色的每个 HA-DB 节点执行以下命令。
# cladm noderole -db dbname -node nodeno -setrole role-before-auto_recovery

滚动升级期间其他节点无法访问 `pnmd` (4997693)

问题摘要：在滚动升级期间，如果 scstat -i 命令是在尚未升级的群集节点上运行，则 scstat 输出将不会显示在已升级的节点上托管的 IPMP 组的状态。

解决方法：使用来自已升级节点的 scstat -i 输出。

无法添加 LogicalHostname 资源 (5004611)

问题摘要：如果 LogicalHostname 资源需要使用带有有故障的适配器的 IPMP 组，则无法将此 LogicalHostname 资源添加到群集中。

解决方法：尝试在 LogicalHostname 资源中使用 IPMP 组之前，删除 IPMP 组中有故障的适配器或修正此故障。

SunPlex Manager 错误地存储状态的编码信息 (5012328)

问题摘要：资源组状态页面中的“状态”和“类型”两个字段显示曾用于查看该页的第一语言环境中的值。

解决方法：要以其他语言环境查看值，请重新启动 Web 服务器。

重新封装根磁盘之后，`uservol` 用于 `/global/.devices/node@2` (5028284)

问题摘要：封装根磁盘之后，如果解除封装然后又重新封装该根磁盘，则可能会看到名为 uservol 的卷被用于 /global/devices/node@nodeID 文件系统。这可能导致问题，因为每个节点的全局设备文件系统的卷名称必须唯一。

解决方法：按照所述步骤执行解除封装之后，请在再次运行 scvxinstall 重新封装根磁盘之前中止 vxconfigd 守护进程。

向 Sun Web Console 多次提交登录页面导致各个登录均失败 (5039143)

问题摘要：登录到 Sun Web Console 时，如果重复按“登录”或“进入”按钮，多个登录请求可能会导致多个失败，由此而无法对 SunPlex Manager 进行访问。

解决方法：成为群集节点上的超级用户并重新启动 Sun Web Console。

# /usr/sbin/smcwebserver restart

`Resource_dependencies_restart` 未按预期运行 (5041013)

问题摘要：当资源声明对可伸缩模式资源具有 any node 资源组间重新启动依赖性时，Resource_dependencies_restart 资源特性未按预期运行。大多数数据服务都不会受到影响。

有关资源组间依赖性和重新启动依赖性的背景：

通过使用 Sun Cluster 3.1 9/04 中的资源组间依赖性特性，Sun Cluster 软件支持可以跨资源组界限的资源依赖性。Sun Cluster 软件还支持新类型的资源依赖性 restart dependency。如果依赖资源处于联机状态，则 restart dependency 将在被依赖的资源启动时导致依赖资源自动重新启动。
有关 local node 与 any node 依赖性的背景：

如果组 RG1 中的资源 r1 依赖于 RG2 中的 r2，RG1 与 RG2 具有正关联，并且 RG1 和 RG2 在同一节点上同时启动或停止，则 r1 对 r2 的依赖性为 local node 依赖性。例如，在同一节点上启动 RG1 和 RG2 时，r1 会先等 r2 在该节点上启动之后，r1 才在同一节点上启动。r2 在其他节点上的状态对 r1 何时启动没有影响。

但是，如果 RG1 没有声明与 RG2 具有正关联，或如果它们具有弱正关联，但资源组在不同的节点上启动，则 r1 对 r2 的依赖性为 any node 依赖性。此依赖性表示 r2 在任何节点上启动之后，r1 就会启动。
问题说明：

当资源组 RG2 是可伸缩模式资源组（即多主资源组），且 r1 对 r2 的依赖性为 any node 重新启动依赖性时，就会出现该问题。每次启动 r2 的任何实例时，r1 都会重新启动。r1 只应在 r2 的第一个实例启动时重新启动。

解决方法：修正此错误后，当前的重新启动依赖性行为将会发生变化，如上所述。请不要开发依赖于当前不正确行为的代码或管理程序。

`sccheck` 缺少对 Sun Enterprise 15000 的支持 (5056534)

问题摘要：如果有 Sun Enterprise 15000 服务器并运行了 sccheck 命令，检查将失败并报告一个错误，该错误表明不支持 Sun Enterprise 15000 服务器。此陈述是不正确的。

解决方法：不必采取任何解决方法。Sun Cluster 软件支持 Sun Enterprise 15000 服务器。sccheck 命令报告的错误说明该检查可能已过时。在这种情况下，sccheck 已过时。

非 JES 数据服务代理无法使用法文 (5059963)

问题摘要：对于不属于 Sun Java Enterprise System 的数据服务代理，法文 (fr) 是不可用的语言选项。但是，那些软件包的 GUI 安装程序却给出了相反的建议。

解决方法：忽略 GUI 安装程序的不精确说明。法文 (fr) 不可用。

`scinstall –u update` 不保留 `SUNWcacao` 安全密钥 (5068616)

问题摘要：在升级到 Sun Cluster 3.1 9/04 软件期间，scinstall 命令安装了新的Common Agent Container软件包 SUNWcacao 和 SUNWcacaocfg，但并未向所有群集节点分发相同的安全密钥。

解决方法：执行以下步骤以确保Common Agent Container安全文件在所有群集节点上都相同，并确保所复制的文件保持正确的文件权限。Sun Cluster 软件需要这些文件。

在一个群集节点上，切换到 /etc/opt/SUNWcacao/ 目录。
phys-schost-1# cd /etc/opt/SUNWcacao/
创建 /etc/opt/SUNWcacao/security/ 目录的 tar 文件。
phys-schost-1# tar cf /tmp/SECURITY.tar security
将 /tmp/SECURITY.tar 文件复制到其他每个群集节点上。
在向其复制了 /tmp/SECURITY.tar 文件的每个节点上，提取安全性文件。

将覆写 /etc/opt/SUNWcacao/ 目录中已存在的所有安全性文件。
phys-schost-2# cd /etc/opt/SUNWcacao/ phys-schost-2# tar xf /tmp/SECURITY.tar
从群集中的每个节点删除 /tmp/SECURITY.tar 文件。

必须删除 tar 文件的所有副本以避免安全隐患。
phys-schost-1# rm /tmp/SECURITY.tar phys-schost-2# rm /tmp/SECURITY.tar
在每个节点上，重新启动安全性文件代理。
# /opt/SUNWcacao/bin/cacaoadm start

SunPlex Manager 的“高级过滤器”面板的日期格式不正确 (5075018)

问题摘要：SunPlex Manager 的“高级过滤器”面板上的日期字段只接受 mm/dd/yyyy 格式。但是，在非英语语言环境中，日期格式不同于 mm/dd/yyyy 格式，从日历面板返回的日期格式也不同于 mm/dd/yyyy 格式。

解决方法：在“高级过滤器”面板中以 mm/dd/yyyy 格式键入日期范围。请不要使用“设置”按钮来显示日历和选择日期。

删除资源组时 SunPlex Manager 中出现无法阅读的错误消息 (5083147)

问题摘要：在 Solaris 8 上使用 SunPlex Manager 删除资源组时，您可能会收到无法阅读的错误消息。在日文、韩文、繁体中文和简体中文中出现此问题。

解决方法：运行英文系统语言环境以显示英文错误消息。

`SUNW.sapscs` 中扩展特性描述不正确 (5083259)

问题摘要：在资源类型登记 (RTR) 文件 SUNW.sapscs 中，对两个扩展特性的描述不正确。

解决方法：对 Scs_Startup_Script 的描述应为 Startup script for the SCS. Defaults to /usr/sap/SAP_SID/SYS/exe/run/startsap。对 Scs_Shutdown_Script 的描述应为 Shutdown script for the SCS. Defaults to /usr/sap/SAP_SID/SYS/exe/run/stopsap。

Sun Cluster 3.1 9/04 的 JumpStart 完成后，用户无法访问 SunPlex Manager (5095638)

问题摘要：通过使用 JumpStart 方法安装 Sun Cluster 软件后，Sun Web Console 无法启动 SunPlex Manager。JumpStart 安装后处理未能在 Sun Web Console 中成功地注册 SunPlex Manager。

解决方法：在所有节点上完成 Sun Cluster 软件的 JumpStart 安装之后，请在所有群集节点上运行以下脚本。

# /var/sadm/pkg/SUNWscspmu/install/postinstall

此脚本将在 Sun Web Console 中登记 SunPlex Manager。

从 CD-ROM 安装 Sun Cluster Data Service for HA Oracle 失败 (5098622)

问题摘要：Sun Cluster 3.1 9/04 数据服务 CD-ROM（适用于 x86）上的安装程序不能用于安装 HA Oracle。安装程序将发出以下消息：

Could not find child archive ....

解决方法：使用 scinstall 安装 Sun Cluster Data Service for HA Oracle。

某些数据服务不能使用 `scinstall` 实用程序进行升级

问题摘要：以下应用程序的数据服务不能使用 scinstall 实用程序进行升级：

Apache Tomcat
DHCP
mySQL
Oracle E-Business Suite
Samba
SWIFTAlliance Access
WebLogic Server
WebSphere MQ
WebSphere MQ Integrator

解决方法：如果要升级上面列出的应用程序的数据服务，请使用以下步骤替代《Sun Cluster Software Installation Guide for Solaris OS》中的 “Upgrading to Sun Cluster 3.1 9/04 Software (Rolling)”中有关升级数据服务的步骤。对于已安装数据服务的每个节点执行以下步骤。

如何升级不能使用 `scinstall` 进行升级的数据服务

步骤

删除要升级的数据服务的软件包。

# pkgrm pkg-inst

pkg-inst 指定要升级的数据服务的软件包名称，如下表所列。

应用程序	数据服务软件包
Apache Tomcat	`SUNWsctomcat`
DHCP	`SUNWscdhc`
mySQL	`SUNWscmys`
Oracle E-Business Suite	`SUNWscebs`
Samba	`SUNWscsmb`
SWIFTAlliance Access	`SUNWscsaa`
WebLogic Server（英文语言环境）	`SUNWscwls`
WebLogic Server（法文语言环境）	`SUNWfscwls`
WebLogic Server（日文语言环境）	`SUNWjscwls`
WebSphere MQ	`SUNWscmqs`
WebSphere MQ Integrator	`SUNWscmqi`

安装适用于要升级到的数据服务版本的软件包。

要安装软件包，请按照适用于要升级的数据服务的 Sun Cluster 文档中的说明进行操作。此文档可从 http://docs.sun.com/ 获得。

已知问题和错误

当引导设备采用多路径时，scvxinstall 所创建的 vfstab 条目不正确 (4639243)

HA Oracle 停止方法超时 (4644289)

专用互连上的 ce 适配器观测到超时并造成节点瘫痪 (4746175)

SAP liveCache 停止方法超时 (4836272)

某些代理不使用工具 LOG_DAEMON (4897239)

不应将 nsswitch.conf 要求应用于 passwd 数据库 (4904975)

sccheck 挂起 (4944192)