6


用于 Sun Fire 高端系统的 Dynamic Reconfiguration 软件

使用运行于 Sun Fire 高端系统上的 Dynamic Reconfiguration (DR) 软件,您可以对正在运行 Solaris 操作系统的活动域执行硬件配置更改。

可从 SC 或单个域中执行 DR 操作。

可使用 addboard(1M)、moveboard(1M)、deleteboard(1M) 和 rcfgadm(1M) SMS 命令从 SC 中执行 DR 操作。

使用 Dynamic Reconfiguration 软件,您还可对系统板进行热插拔,而不必关闭系统。这用于从域中取消有问题系统板的资源配置,从而将该系统板从系统中拆除。这样,便可在 Solaris 操作系统运行的同时将已修复或替换的系统板插入域中。

然后,DR 软件将该板上的资源配置到域中。如果使用 DR 功能添加或拆除系统板,DR 始终将该板置于已知的配置状态。

系统板包括:


系统板插槽和逻辑域

Sun Fire 高端系统的域配置由驻留在 SC 上的平台配置数据库 (Platform Configuration Database, PCD) 中的域配置决定。PCD 控制着如何从逻辑上将系统板插槽划分到域中。因此,配置可包括空插槽和插有卡的插槽。

物理域由逻辑域确定。逻辑域是一些属于域的插槽的集合。物理域是物理上相互连接的系统板的集合。插槽可以是逻辑域的成员,但不一定是物理域的一部分。

给定域的可用插槽数由在系统控制器上维护的可用组件列表控制。使用 cfgadm(1M) 命令更改域的状态之前,必须为其分配可用插槽。

给域分配插槽之后,该插槽将对该域可见,而对其他任何域既不可见也不可用。相反地,若要将插槽分配并连接到另一个域,必须先将其从原来的域中取消分配并断开连接。

引导域后,即可给逻辑域分配系统板和空插槽,或从逻辑域中取消系统板和空插槽的分配。但是,在操作系统对其发出请求之前,系统板和空插槽不能成为物理域的一部分。

未分配给任何域的系统板插槽可用于所有域。这些板可由平台管理员分配给域;但是,您可在 SC 上建立一个可用组件列表,从而仅允许有相应权限的用户将可用系统板分配给域。


DR 管理模型

可用组件列表基于用户的用户名和组标识来控制可执行哪些管理任务。例如,平台管理员可向域中添加板、从域中删除板或在域中移动板。此外,平台管理员还可以给域分配板或取消板的分配。而域管理员或域的配置人员则不能给域分配板或取消板的分配。


SC 状态模型

在 Sun Fire 高端系统的 SC 中,板可处于以下四种状态之一:unavailableavailableassignedactive。您可以使用 showboards(1M) 命令查看特定板的状态。但必须拥有指定域的相应权限。不可用 (Unavailable) 的板对域管理员而言是不可见的。只有平台管理员才能看到系统中的所有板。

有关 SC 上板状态的名称和描述将在随后的章节中介绍。SC 上板的状态与域上板的状态不同。

unavailable

板对于域而言不可用。这意味着该板尚未添加到指定域的可用组件列表中,或者当前已被分配给其他域。请注意,不在可用组件列表中的板对域而言不可见。处于不可用 (unavailable) 状态的板不是指定域的一部分。

available

板对于域而言可用,并可添加到域中。这意味着该板在域的可用组件列表中。请注意,板可对任意数量的域可用。处于可用 (available) 状态的板可视作逻辑域的一部分。

assigned

板已分配给域,即该板在该域的可用组件列表中,不能用于其他域。处于已分配 (assigned) 状态的板可视作物理域的一部分。

active

板已连接或板已连接并配置到 Solaris 操作系统中,可由操作系统使用。处于活动 (active) 状态的板可视作物理域的一部分。


I/O 板上的 DR

添加或拆除带有 I/O 设备的系统板时必须小心。在拆除带有 I/O 设备的板之前,必须先关闭其上的所有设备,并卸载其上的所有文件系统。

如果需要暂时从域中拆除带有 I/O 设备的板,并在随后添加其他带有 I/O 设备的板之前重新装回,则不需要也不必执行重新配置操作。此时,到板设备的设备路径保持不变。但是,如果在装回第一块板之前添加了其他带有 I/O 设备的板,则必须进行重新配置,因为到第一块板的设备路径已改变。


自动 DR

自动 DR 可在无用户干预的情况下使应用程序执行 DR 操作。此功能由增强的 DR 框架提供,该框架包括了重新配置协调管理器 (Reconfiguration Coordination Manager, RCM) 和 sysevent 系统事件工具。RCM 启用应用程序专用的可下载模块来注册回调。回调功能在 DR 操作之前执行预备任务,在 DR 操作过程中执行错误恢复任务,在 DR 操作后执行清除任务。

系统事件框架允许应用程序登记系统事件并接收这些事件的通知。自动 DR 框架与 RCM 和系统事件工具交互作用,允许应用程序在被取消配置前自动放弃资源,并在配置到域时自动捕获新资源。

自动 DR 框架可在本地通过 cfgadm(1M) 命令从域中使用,或从 SC 中使用。在本地从域中启动的自动 DR 操作称为本地自动 DR,从 SC 中启动的自动 DR 操作称为全局自动 DR。全局自动 DR 操作包括:将系统板从一个域移动到另一个域、将热插拔板配置到域中以及从域中拆除系统板。


获取更多信息

有关 Dynamic Reconfiguration 软件的更多信息,请参见 Dynamic Reconfiguration 软件信息,以确定要阅读哪些文档。