|
Sun
Control Station 软件的 Lights Out 管理 (LOM) 控制模块允许您在与智能平台管理接口 (IPMI) 1.5 版兼容的主机上,远程执行特定管理和监视功能。本文档介绍可通过Lights Out 管理控制模块可用的功能和服务。
|
注 - 本手册假定您了解 Sun Control Station 软件的基本操作。有关 Sun Control Station 基本功能(如状态图标、选定器窗口、调度程序和“任务进度”对话框)的介绍,请参阅《Sun Control Station 2.2 管理员手册》。 |
为了让 LOM 控制模块工作,必须将 Linux 内核源 RPM 安装在想要运行 LOM 功能的受管理主机上。
LOM 控制模块包括一个设备驱动程序,当将该模块安装到受管理主机上时自动编译该驱动程序;内核源 RPM 是成功编译该设备驱动程序的必要条件。
如果受管理主机正在运行 Sun Linux 分发,则无需使用 Linux 内核源 RPM。
LOM 控制模块可通过受管理主机上的任一内置网络接口(eth0 或 eth1)运行。不过,如果受管理主机上的这两个内置网络接口均为活动状态,则受管理主机的缺省选择为 eth0。
单击“Lights Out 管理”菜单项,通过其子菜单项可对主机服务处理器进行配置以使用 LOM,执行打开和关闭电源操作,查看受管理主机的传感器和 SEL 数据,或将全局设置应用于受管理主机的服务处理器。
要使 LOM 模块软件能够正确管理主机,则需要对某些即将受管理的主机进行服务处理器 (SP) 预配置或安装后手动配置。
Sun Fire
V60x、Sun Fire V65x 和 Sun LX50 平台无需预安装设置。
而 Sun Fire V20z 和 Sun Fire V40z 系统则必须预配置服务处理器 (SP) 并安装当前 BIOS 和服务处理器固件。有关说明,请参阅Sun Fire V20z 和 V40z 系统的服务处理器 (SP) 预配置。
如果主机为 Sun Fire LX50、Sun Fire V60x 或 Sun Fire V65x,则在安装 LOM 模块时执行“自动配置”。有关说明,请参阅在 Sun LX50、Sun Fire V60x 和 V65x Systems 上自动配置 LOM。
如果主机是 Sun Fire V20z 或 V40z 系统,则必须手动配置 LOM。有关说明,请参阅在 Sun Fire V20z 和 V40z 系统上手动配置 LOM。
而 Sun Fire V60x、Sun Fire V65x 和 Sun LX50 系列机器有时不能远程打开电源。如果遇到这个问题,请在“LOM 设置”屏幕上启用“免费 Arp”功能。有关详细信息,请参阅设置。
1. 通过 LCD 前面板使用静态 IP 地址、子网掩码和缺省网关 IP 地址来配置服务处理器 (SP)。
有关进一步说明,请参阅《Sun Fire V20z and Sun Fire V40z Servers Installation Guide》中的 "Defining SP Network Settings" 一节。
|
注 - 为该 SP 使用的 IP 地址不能与主机 IP 地址相同。此 IP 地址必须是静态的;LOM 不支持 DHCP 提供的 IP 地址。 |
有必要允许登录到服务处理器 (SP) 并按下述步骤运行 IPMI 命令。
有关完整说明,请参阅《Sun Fire V20z and Sun Fire V40z Servers Installation Guide》中的 "Creating the Initial Manager Account" 一节。
3. (可选)为服务处理器 (SP) 设置服务器管理和平台软件。
请参阅《Sun Fire V20z and Sun Fire V40z Servers Installation Guide》中的 "Server Management and Platform Software" 一节。
使用 2 中定义的初始管理员帐户并使用 ssh 登录到服务处理器 (SP)。登录时将看到类似于以下信息:
Sun MicrosystemsIPMI v1.5 Service ProcessorVersion: V2.1.0.16
如果“Version”显示为 V2.0.x.x,则您必须更新 BIOS 和服务处理器 (SP)。
5. (必要时)请参阅以下网站获得有关 BIOS 安装及相应说明的信息。
http://www.sun.com/servers/entry/v20z/downloads.html
http://www.sun.com/servers/entry/v40z/downloads.html
1. 从 Sun Control Station 界面选择“LOM”
“配置”。
将看到最新添加的主机。对于 Sun Fire V20z 或 V40z 系统,LOM 配置值将为 N。
出现“为 LOM 配置节点设置”屏幕(请参阅图 1)。
|
注 - BMC(底板管理控制器)即为服务处理器 (SP)。本手册使用“服务处理器”一词,但可能会在 Sun Control Station 界面的某些部分中见到“BMC”一词。 |
|
注 - 如果为 Sun Fire V20z 或 Sun Fire V40z 之外的机器手动配置 LOM,请参阅表 1 以确定正确的通道值。 |
该命令首先将尝试清除服务处理器 (SP) 上的这些值,然后再将其设为期望值。完成该命令可能需要几分钟的时间。
以上所有步骤执行完毕之后,如果 LOM 无法工作(即无法从 LOM 向受管理主机发出任何命令),请参阅《Sun Fire V20z and Sun Fire V40z Servers Server Management Guide》中的 "IPMI Troubleshooting" 一节,或者与您的 Sun 服务代表联系以寻求帮助。
要在 Sun LX50、Sun Fire V60x 和 V65x 系列机器上配置 LOM,请从 Sun Control Station 界面执行这些步骤。
该命令首先将尝试清除服务处理器 (SP) 上的这些值,然后再将其设为期望值。完成该命令可能需要几分钟的时间。
通常,您应当使用“自动配置”功能在 LX50、V60x 和 V65x 系统上设置 LOM。不过,如果选择为这些系统手动配置 LOM(请参阅图 1),则有些问题需要注意。
1. 服务处理器与主机所用的 IP 地址、子网掩码和缺省网关相同。
2. 您需要根据具体的硬件、所用的以太网接口以及基本 Linux 内核版本来设置通道值。请参阅表 1 以确定使用的通道值。
通过“Lights Out 管理电源”子菜单项可以在一台或多台受管理主机上执行电源管理功能。
单击“电源”子菜单项后,会出现选定器窗口,显示各个组以及各组内的受管理主机。在选定器窗口底部显示以下按钮(请参阅图 2)。
如果使用 LOM 模块向受管理主机发送“关闭电源”命令,紧接着发送“打开电源”命令(在“关闭电源”命令完成之前),则受管理主机可能会处于 init 0 状态:主机仍处于开机状态而操作系统却关闭了。
2. 突出显示一台或多台主机,或者单击“全部选择”选择列表中的所有主机。
通过“关闭电源”命令可以远程关闭主机电源。该命令会尝试在关闭主机电源之前关闭操作系统。
2. 突出显示一台或多台主机,或者单击“全部选择”选择列表中的所有主机。
“重置”命令会使硬件重置。如果主机操作正常,则系统将正常关闭并重新引导。如果系统挂起并且没有响应,则“重置”命令将强行对系统进行重置。
2. 突出显示一台或多台主机,或者单击“全部选择”选择列表中的所有主机。
在具有标识 LED 的主机上(如 Sun LX50 服务器或 Sun Fire V60x 和 V65x 服务器),“标识”命令能使前面板和后面板上的 LED 闪烁;这对于在设备机架中定位主机十分有用。
|
注 - 如果关闭主机电源,或如果系统挂起,则该命令仍能使 LED 闪烁。如果您已经从主机前面板激活了 LED(持续发光,但不闪烁),则该命令不会对主机产生影响。 |
2. 突出显示一台或多台主机,或者单击“全部选择”选择列表中的所有主机。
通过传感器/SEL 子菜单项可以查看主机上的传感器或系统事件日志 (SEL) 中的最新数据,实时更新数据,或安排在以后进行数据更新。
单击“传感器/SEL”子菜单项后,出现选定器窗口,显示各个组以及各组内的主机。在选定器窗口底部显示以下按钮(请参阅图 3)。
更新传感器和 SEL 信息时,该功能将从受管理主机中对整个 SEL 进行检索。一个完整的 SEL 可包含多达 3000 条记录。直到从受管理主机中对整个 SEL 检索完毕之后,才会显示已更新的 SEL 信息。
SEL 中包含的条目越多,检索 SEL 和传感器数据时所涉及的主机数量越多,检索信息所需的时间就越长。如果决定为许多受管理主机安排传感器和 SEL 信息的更新,您就应当考虑这些因素。
您可以查看主机的传感器数据汇总。然后您可以从结果汇总表中查看传感器数据详细资料表、查看 SEL 以及更新当前数据。即使关闭了主机电源也能更新这些数据。
|
注 - 还可以在“运行状况监视”模块中显示受管理主机的 LOM 传感器汇总数据。请参阅运行状况监视模块中的传感器数据。 |
1. 选择“Lights Out 管理”
“传感器/SEL”。
2. 突出显示一台或多台主机,或者单击“全部选择”选择列表中的所有主机。
随即就会显示“传感器状态汇总”表(请参阅图 4)。
5. 如果单击“传感器详细资料”图标,便会出现传感器详细资料表。
根据主机类型的不同,在该表中显示不同的传感器(请参阅图 5)。
单击“更新数据”以更新传感器数据(请参阅更新主机信息显示)。
随即显示 SEL 中的记录(请参阅图 6)。
有关事件说明的详细信息,请参阅以下位置的 IPMI 文档:
http://www.intel.com/design/servers/ipmi/index.htm。
可以从该屏幕中对 SEL 进行清除(请参阅清除 SEL)或更新 SEL(请参阅更新 SEL 显示)。
可以清除受管理主机的 SEL。SEL 数据一旦清除就无法恢复。由于 Sun 技术支持部门可能需要这些数据,因此在清除 SEL 之前,请注意任何不寻常的错误模式。
1. 转到“详细系统事件日志”表(请参阅图 6)。
此按钮位于“详细系统事件日志”表下方。将会显示“任务进度”对话框。
此按钮位于“详细系统事件日志”表下方。将会显示“任务进度”对话框。
通过“更新”功能可以在受管理主机上检索最新的传感器数据和 SEL。
该功能将更新选定受管理主机的所有传感器数据和 SEL 信息。
该按钮位于表下方。单击该按钮会更新“传感器状态汇总”表中列出的每台主机的传感器数据和 SEL。
该按钮位于表下方。该功能将更新此特定主机的所有传感器数据和 SEL 信息。
|
注 - 也可以将更新主机信息安排在以后进行。详细信息,请参阅《Sun Control Station 2.2 管理员手册》中的调度功能。 |
在“运行状况监视”模块中,可以查看受管理主机上组件和服务状态的详细信息表。
查看报告 LOM 传感器数据的主机的这些表时,会在“其他系统服务”表中显示汇总数据。这些数据包括传感器和系统事件日志 (SEL)。
可以在“运行状况监视”模块中输入一个电子邮件地址,这样在发生紧急系统事件(带红圈)时,就能从该模块发出警告。
详细信息,请参阅 PDF 格式的《Sun Control Station 2.2 运行状况监视模块》。
通过“设置”屏幕(请参阅图 7),可以将通用设置应用到所有受管理主机的服务处理器。这些设置影响当前由控制站管理的所有主机,以及您随后增加的那些受管理主机。
IPMI 定义了“智能”硬件的通用接口,这些接口用于监视服务器的物理运行状况特征和组件(如温度、电压、风扇、电源和机箱)。除了能够进行运行状况监视之外,IPMI 还具有其他系统管理功能,如自动报警、自动关闭和重新启动系统、远程重启和电源控制能力,以及资产追踪。
基于 IPMI 的服务器管理使用户能确定服务器硬件的运行状况,确定服务器是否运行正常或是否处于不可操作状态。基于 IPMI 的服务器使用“智能”或自治硬件,这类硬件即使在处理器关闭的情况下也可继续操作,因此能保证平台管理信息和控制功能始终均可访问。IPMI 接口功能强大,得到广泛认可,可在任何系统阶段从串行/调制解调器、LAN、本地管理软件、第三方突发事件管理插卡以及其他支持 IPMI 的服务器,访问相同的管理功能:关闭电源、重新引导、加载操作系统和运行时间。
有关 IPMI 的详细信息,请参阅 http://www.intel.com/design/servers/ipmi/index.htm。
版权所有 © 2004, Sun Microsystems, Inc. 保留所有权利。