Sun Cluster 3.1 9/04 发行说明(适用于 Solaris OS)

已知问题和错误

以下已知问题和错误会影响 Sun Cluster 3.1 9/04 发行版的运行。

当引导设备采用多路径时,scvxinstall 所创建的 vfstab 条目不正确 (4639243)

问题摘要:当引导设备采用多路径时,scvxinstall 所创建的 vfstab 条目不正确。

解决方法:运行 scvxinstall 并选择封装。系统显示以下消息时,键入 Ctrl-C 异常终止重新引导:


This node will be re-booted in 20 seconds. Type Ctrl-C to abort.

编辑 vfstab 条目,使 /global/.devices 使用名称 /dev/{r}dsk/cXtXdX 而非名称 /dev/did/{r}dsk。这个经过修改的条目使 VxVM 将其识别为根磁盘。重新运行 scvxinstall 并选择封装。vfstab 文件进行必要的更新。允许系统重新进行引导。封装将照常进行。

HA Oracle 停止方法超时 (4644289)

问题摘要:Sun Cluster for HA for Oracle 数据服务使用 su 命令来启动和停止数据库。如果运行的是 Solaris 8 或 Solaris 9,则当群集节点的公共网络发生故障时,网络服务可能会不可用。

解决方法:在可以成为 oracle_server 资源或 oracle_listener 资源的主节点的每个节点上的 /etc/nsswitch.conf 文件中包含以下条目:

passwd: files
groups: files
publickey: files
project:  files

这些条目可确保 su 命令不会引用 NIS/NIS+ 名称服务,以使数据服务在网络发生故障期间能够正常启动和停止。

专用互连上的 ce 适配器观测到超时并造成节点瘫痪 (4746175)

问题摘要:如果一个或多个群集节点具有 4 个以上 CPU,则在专用互连上使用 ce 适配器的群集会观测到路径超时以及随后发生的节点瘫痪。

解决方法:通过在所有群集节点中的 /etc/system 文件中添加以下行来设置 ce 驱动程序中的 ce_taskq_disable 参数。

set ce:ce_taskq_disable=1

然后,重新引导群集节点。重新引导群集节点时请注意法定数目。设置此参数可确保在中断环境中能始终传送心跳(和其他数据包),从而消除路径超时以及随后发生的瘫痪。

SAP liveCache 停止方法超时 (4836272)

问题摘要:Sun Cluster HA for SAP liveCache 数据服务使用 dbmcli 命令来启动和停止 liveCache。如果运行的是 Solaris 9,则当群集节点的公共网络出现故障时,网络服务可能会不可用。

解决方法:在可以成为 liveCache 资源主节点的每个节点上的 /etc/nsswitch.conf 文件中包含 publickey 数据库的以下条目之一:

publickey: 
publickey:  files
publickey:  files [NOTFOUND=return] nis 
publickey:  files [NOTFOUND=return] nisplus

除了《用于 SAP liveCache 的 Sun Cluster 数据服务指南(适用于 Solaris OS)》中介绍的更新之外,添加上述条目之一可确保 su 命令和 dbmcli 命令不引用 NIS/NIS+ 名称服务。绕过 NIS/NIS+ 名称服务可确保在网络发生故障期间数据服务可以正常启动和停止。

某些代理不使用工具 LOG_DAEMON (4897239)

问题摘要:由于内部错误,Sun 提供的某些群集代理使用 LOG_USER 工具而不使用 LOG_DAEMON 来将消息写入系统日志(请参见 syslog(3C))。在配置为使用缺省系统日志设置(请参见 syslog.conf(4))的群集中,通常会将严重程度为 LOG_WARNINGLOG_NOTICE 的消息写入系统日志,而不会将其输出。仅对以 shell 脚本编写的代理代码才会出现此问题。

解决方法:

不应将 nsswitch.conf 要求应用于 passwd 数据库 (4904975)

问题摘要:用于 SAP liveCache 的 Sun Cluster 数据服务指南(适用于 Solaris OS)》的“准备节点和磁盘”中对 nsswitch.conf 文件的要求不适用于 passwd 数据库中的条目。如果满足了这些要求,则在公共网络关闭时,su 命令可能会在可以控制 liveCache 资源的每个节点上都挂起。

解决方法:在可以控制 liveCache 资源的每个节点上,确保 passwd 数据库的 /etc/nsswitch.conf 文件中的条目为:

passwd: files nis [TRYAGAIN=0]

sccheck 挂起 (4944192)

问题摘要:如果同时从多个节点启动,则 sccheck 可能挂起。

解决方法:不要从任何用于将命令传递到多个节点的多控制台启动 scchecksccheck 可以重叠运行,但不应同时启动。

Java 二进制文件链接到不正确的 Java 版本导致 HA-DB 代理出现故障 (4968899)

问题摘要:目前,HA-DB 数据服务不使用 JAVA_HOME 环境变量。因此,当从 HA-DB 数据服务调用 HA-DB 时,HA-DB 将从 /usr/bin/ 获取 Java 二进制文件。需要将 /usr/bin/ 中的 Java 二进制文件链接到 Java 的适当版本(Java 1.4 或更高版本)才能使 HA-DB 数据服务正常工作。

解决方法:如果您同意更改可用的缺省版本,请执行以下过程。作为示例,此解决方法假定了 /usr/j2se 目录是最新的 Java 版本(例如 1.4 和更高版本)所在的目录。

  1. 当前,在 /usr/ 目录中是否有名为 java/ 的目录?如果有,请将此目录移动到一个临时位置。

  2. /usr/ 目录中,将 /usr/bin/java 和所有其他与 Java 相关的二进制文件都链接到 Java 的相应版本。


    # ln -s j2se java
    

如果不想更改可用的缺省版本,请在 /opt/SUNWappserver7/SUNWhadb/4/bin/hadbm 脚本中使用 Java 的适当版本(J2SE 1.4 或更高版本)来指定 JAVA_HOME 环境变量。

HA-DB 重新初始化且没有备用设备 (4973982)

问题摘要:由于错误 4974875,因此只要执行自动恢复,数据库自身就将进行重新初始化且没有任何备用设备。所提到的错误已被修正并集成到 HA-DB 4.3 版中。对于 HA-DB 4.2 和更低版本,请按照以下过程之一更改 HA-DB 节点的角色。

解决方法:

  1. 在自动恢复成功之后,标识其角色发生更改的 HA-DB 节点。

  2. 在步骤 1 中标识的所有节点上,禁用当前 HA-DB 资源的故障监视器(一次一个节点)。


    # cladm noderole -db dbname -node nodeno -setrole role-before-auto_recovery
    
  3. 启用当前 HA-DB 资源的故障监视器。

  1. 在自动恢复成功之后,标识其角色发生更改的 HA-DB 节点。

  2. 在托管数据库的所有节点上,禁用当前 HA-DB 资源的故障监视器。

  3. 在任一节点上,对需要更改其角色的每个 HA-DB 节点执行以下命令。


    # cladm noderole -db dbname -node nodeno -setrole role-before-auto_recovery
    

滚动升级期间其他节点无法访问 pnmd (4997693)

问题摘要:在滚动升级期间,如果 scstat -i 命令是在尚未升级的群集节点上运行,则 scstat 输出将不会显示在已升级的节点上托管的 IPMP 组的状态。

解决方法:使用来自已升级节点的 scstat -i 输出。

无法添加 LogicalHostname 资源 (5004611)

问题摘要:如果 LogicalHostname 资源需要使用带有有故障的适配器的 IPMP 组,则无法将此 LogicalHostname 资源添加到群集中。

解决方法:尝试在 LogicalHostname 资源中使用 IPMP 组之前,删除 IPMP 组中有故障的适配器或修正此故障。

SunPlex Manager 错误地存储状态的编码信息 (5012328)

问题摘要:资源组状态页面中的“状态”和“类型”两个字段显示曾用于查看该页的第一语言环境中的值。

解决方法:要以其他语言环境查看值,请重新启动 Web 服务器。

重新封装根磁盘之后,uservol 用于 /global/.devices/node@2 (5028284)

问题摘要:封装根磁盘之后,如果解除封装然后又重新封装该根磁盘,则可能会看到名为 uservol 的卷被用于 /global/devices/node@nodeID 文件系统。这可能导致问题,因为每个节点的全局设备文件系统的卷名称必须唯一。

解决方法:按照所述步骤执行解除封装之后,请在再次运行 scvxinstall 重新封装根磁盘之前中止 vxconfigd 守护进程。

向 Sun Web Console 多次提交登录页面导致各个登录均失败 (5039143)

问题摘要:登录到 Sun Web Console 时,如果重复按“登录”或“进入”按钮,多个登录请求可能会导致多个失败,由此而无法对 SunPlex Manager 进行访问。

解决方法:成为群集节点上的超级用户并重新启动 Sun Web Console。


# /usr/sbin/smcwebserver restart

Resource_dependencies_restart 未按预期运行 (5041013)

问题摘要:当资源声明对可伸缩模式资源具有 any node 资源组间重新启动依赖性时,Resource_dependencies_restart 资源特性未按预期运行。大多数数据服务都不会受到影响。

解决方法:修正此错误后,当前的重新启动依赖性行为将会发生变化,如上所述。请不要开发依赖于当前不正确行为的代码或管理程序。

sccheck 缺少对 Sun Enterprise 15000 的支持 (5056534)

问题摘要:如果有 Sun Enterprise 15000 服务器并运行了 sccheck 命令,检查将失败并报告一个错误,该错误表明不支持 Sun Enterprise 15000 服务器。此陈述是不正确的。

解决方法:不必采取任何解决方法。Sun Cluster 软件支持 Sun Enterprise 15000 服务器。sccheck 命令报告的错误说明该检查可能已过时。在这种情况下,sccheck 已过时。

非 JES 数据服务代理无法使用法文 (5059963)

问题摘要:对于不属于 Sun Java Enterprise System 的数据服务代理,法文 (fr) 是不可用的语言选项。但是,那些软件包的 GUI 安装程序却给出了相反的建议。

解决方法:忽略 GUI 安装程序的不精确说明。法文 (fr) 不可用。

scinstall –u update 不保留 SUNWcacao 安全密钥 (5068616)

问题摘要:在升级到 Sun Cluster 3.1 9/04 软件期间,scinstall 命令安装了新的Common Agent Container软件包 SUNWcacaoSUNWcacaocfg,但并未向所有群集节点分发相同的安全密钥。

解决方法:执行以下步骤以确保Common Agent Container安全文件在所有群集节点上都相同,并确保所复制的文件保持正确的文件权限。Sun Cluster 软件需要这些文件。

  1. 在一个群集节点上,切换到 /etc/opt/SUNWcacao/ 目录。


    phys-schost-1# cd /etc/opt/SUNWcacao/
    
  2. 创建 /etc/opt/SUNWcacao/security/ 目录的 tar 文件。


    phys-schost-1# tar cf /tmp/SECURITY.tar security
    
  3. /tmp/SECURITY.tar 文件复制到其他每个群集节点上。

  4. 在向其复制了 /tmp/SECURITY.tar 文件的每个节点上,提取安全性文件。

    将覆写 /etc/opt/SUNWcacao/ 目录中已存在的所有安全性文件。


    phys-schost-2# cd /etc/opt/SUNWcacao/
    phys-schost-2# tar xf /tmp/SECURITY.tar
    
  5. 从群集中的每个节点删除 /tmp/SECURITY.tar 文件。

    必须删除 tar 文件的所有副本以避免安全隐患。


    phys-schost-1# rm /tmp/SECURITY.tar
    phys-schost-2# rm /tmp/SECURITY.tar
    
  6. 在每个节点上,重新启动安全性文件代理。


    # /opt/SUNWcacao/bin/cacaoadm start
    

SunPlex Manager 的“高级过滤器”面板的日期格式不正确 (5075018)

问题摘要:SunPlex Manager 的“高级过滤器”面板上的日期字段只接受 mm/dd/yyyy 格式。但是,在非英语语言环境中,日期格式不同于 mm/dd/yyyy 格式,从日历面板返回的日期格式也不同于 mm/dd/yyyy 格式。

解决方法:在“高级过滤器”面板中以 mm/dd/yyyy 格式键入日期范围。请不要使用“设置”按钮来显示日历和选择日期。

删除资源组时 SunPlex Manager 中出现无法阅读的错误消息 (5083147)

问题摘要:在 Solaris 8 上使用 SunPlex Manager 删除资源组时,您可能会收到无法阅读的错误消息。在日文、韩文、繁体中文和简体中文中出现此问题。

解决方法:运行英文系统语言环境以显示英文错误消息。

SUNW.sapscs 中扩展特性描述不正确 (5083259)

问题摘要:在资源类型登记 (RTR) 文件 SUNW.sapscs 中,对两个扩展特性的描述不正确。

解决方法:Scs_Startup_Script 的描述应为 Startup script for the SCS. Defaults to /usr/sap/SAP_SID/SYS/exe/run/startsap。对 Scs_Shutdown_Script 的描述应为 Shutdown script for the SCS. Defaults to /usr/sap/SAP_SID/SYS/exe/run/stopsap

Sun Cluster 3.1 9/04 的 JumpStart 完成后,用户无法访问 SunPlex Manager (5095638)

问题摘要:通过使用 JumpStart 方法安装 Sun Cluster 软件后,Sun Web Console 无法启动 SunPlex Manager。JumpStart 安装后处理未能在 Sun Web Console 中成功地注册 SunPlex Manager。

解决方法:在所有节点上完成 Sun Cluster 软件的 JumpStart 安装之后,请在所有群集节点上运行以下脚本。


# /var/sadm/pkg/SUNWscspmu/install/postinstall  

此脚本将在 Sun Web Console 中登记 SunPlex Manager。

从 CD-ROM 安装 Sun Cluster Data Service for HA Oracle 失败 (5098622)

问题摘要:Sun Cluster 3.1 9/04 数据服务 CD-ROM(适用于 x86)上的安装程序不能用于安装 HA Oracle。安装程序将发出以下消息:

Could not find child archive ....

解决方法:使用 scinstall 安装 Sun Cluster Data Service for HA Oracle。

某些数据服务不能使用 scinstall 实用程序进行升级

问题摘要:以下应用程序的数据服务不能使用 scinstall 实用程序进行升级:

解决方法:如果要升级上面列出的应用程序的数据服务,请使用以下步骤替代《Sun Cluster Software Installation Guide for Solaris OS》中的 “Upgrading to Sun Cluster 3.1 9/04 Software (Rolling)”中有关升级数据服务的步骤。对于已安装数据服务的每个节点执行以下步骤。

Procedure如何升级不能使用 scinstall 进行升级的数据服务

步骤
  1. 删除要升级的数据服务的软件包。


    # pkgrm pkg-inst
    

    pkg-inst 指定要升级的数据服务的软件包名称,如下表所列。

    应用程序 

    数据服务软件包 

    Apache Tomcat 

    SUNWsctomcat

    DHCP 

    SUNWscdhc

    mySQL 

    SUNWscmys

    Oracle E-Business Suite 

    SUNWscebs

    Samba 

    SUNWscsmb

    SWIFTAlliance Access 

    SUNWscsaa

    WebLogic Server(英文语言环境) 

    SUNWscwls

    WebLogic Server(法文语言环境) 

    SUNWfscwls

    WebLogic Server(日文语言环境) 

    SUNWjscwls

    WebSphere MQ 

    SUNWscmqs

    WebSphere MQ Integrator 

    SUNWscmqi

  2. 安装适用于要升级到的数据服务版本的软件包。

    要安装软件包,请按照适用于要升级的数据服务的 Sun Cluster 文档中的说明进行操作。此文档可从 http://docs.sun.com/ 获得。