Solaris 10 10/08 发行说明

Sun Enterprise 中型系统的动态重新配置

本节包含有关运行 Solaris 10 软件的下列中型服务器的动态重新配置 (dynamic reconfiguration, DR) 功能的最新信息:

有关 Sun Enterprise Server Dynamic Reconfiguration 的更多信息,请参阅《Dynamic Reconfiguration User's Guide for Sun Enterprise 3x00/4x00/5x00/6x00 Systems》。Solaris 10 发行版支持上述列表中提到的系统中的所有 CPU/内存板以及大多数 I/O 板。

支持的硬件

继续操作前,请确保系统支持动态重新配置。如果系统为旧设计,则控制台或控制台日志中会显示下列消息。这类系统不适合进行动态重新配置。


Hot Plug not supported in this system

当前不支持下列 I/O 板:

软件说明

本节提供有关 DR 的一般软件信息。

启用动态重新配置

要启用动态重新配置,必须在 /etc/system 文件中设置两个变量。还必须设置一个额外变量,才能删除 CPU/内存板。请执行以下步骤:

  1. 以超级用户身份登录。

  2. 通过添加下列行,编辑 /etc/system 文件:


    set pln:pln_enable_detach_suspend=1
    set soc:soc_enable_detach_suspend=1
    
  3. 要启用 CPU/内存板的删除,请将以下行添加到文件:


    set kernel_cage_enable=1
    

    设置此变量将启用对内存的取消配置操作。

  4. 重新引导系统以应用更改。

停顿测试

使用以下命令开始停顿测试:


 # cfgadm -x quiesce-test sysctr10:slot number

在大型系统上,停顿测试的运行时间可能会长达一分钟。在这段时间内,如果 cfgadm 未发现不兼容的驱动程序,则不显示任何消息。

禁用板列表

试图连接禁用板列表中的板可能生成以下错误消息:


# cfgadm -c connect sysctrl0:slotnumber







cfgadm: Hardware specific failure: connect failed:
board is disabled: must override with [-f][-o enable-at-boot]

要改写禁用条件,可以使用下面两种方法:

要从禁用板列表中删除所有板,请根据发出命令时所在的提示符,选择下面的两种操作之一:

有关 disabled-board-list 设置的详细信息,请参阅《Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems》手册中的 "Specific NVRAM Variables" 一节。该手册包含在此发行版的文档集中。

禁用内存列表

此发行版发布有关 OpenBoot PROM disabled-memory-list 设置的信息。请参阅 Solaris on Sun Hardware 文档中《Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems》中的 "Specific NVRAM Variables"。

卸载无法安全分离的驱动程序

如果需要卸载无法安全分离的驱动程序,请使用 modinfo 行命令查找相应驱动程序的模块 ID。然后,可在 modunload 命令中使用相应模块 ID 以卸载无法安全分离的驱动程序。

连接期间自检失败

如果在 DR 连接期间显示以下错误消息,请尽快从系统中卸下该板:


cfgadm: Hardware specific failure: connect failed: firmware operation error

该板未通过自检,将其卸下可以避免下次重新引导时发生重新配置错误。

在自检失败状态下,不允许执行其他操作。所以,如果希望立即重试失败的操作,必须首先卸下该板,然后重新插入它。

已知错误

以下列表中的内容可能会随时改变。

某程序使网络设备处于打开状态时无法删除该设备 (5054195)

如果某进程使网络设备处于打开状态,则与该设备相关的任何 DR 操作都会失败。保存引用计数的守护进程和进程都会停止 DR 操作,使其无法完成。

解决方法: 以超级用户身份执行以下步骤:

  1. 删除或重命名 /rplboot 目录。

  2. 关闭 NFS 服务。


    # sh /etc/init.d/nfs.server stop
    
  3. 关闭 Boot Server 服务。


    # sh /etc/init.d/boot.server stop
    
  4. 执行 DR 分离操作。

  5. 重新启动 NFS 服务。


    # sh /etc/init.d/nfs.server start
    
  6. 重新启动 Boot Server 服务。


    # sh /etc/init.d/boot.server start
    

运行并发 cfgadm 命令时 cfgadm 断开操作失败 (4220105)

如果正在对一块板运行 cfgadm 进程,则同时断开另一块板的尝试失败。将显示以下错误消息:


cfgadm: Hardware specific failure: 
disconnect failed: nexus error during detach:address

解决方法: 一次仅运行一个 cfgadm 操作。允许对一块板运行的 cfgadm 操作完成,然后再对第二块板启动 cfgadm 断开操作。