Lights Out 管理模块

Suntrademark Control Station 软件的 Lights Out 管理 (LOM) 控制模块允许您在与智能平台管理接口 (IPMI) 1.5 版兼容的主机上,远程执行特定管理和监视功能。本文档介绍可通过Lights Out 管理控制模块可用的功能和服务。

LOM 模块能实现 IPMI 1.5 版中具有的功能。

利用该模块可以进行以下操作:

传感器返回以下环境和状态信息:



注 - 本手册假定您了解 Sun Control Station 软件的基本操作。有关 Sun Control Station 基本功能(如状态图标、选定器窗口、调度程序和“任务进度”对话框)的介绍,请参阅《Sun Control Station 2.2 管理员手册》




Linux 内核源 RPM 需求

为了让 LOM 控制模块工作,必须将 Linux 内核源 RPM 安装在想要运行 LOM 功能的受管理主机上。

LOM 控制模块包括一个设备驱动程序,当将该模块安装到受管理主机上时自动编译该驱动程序;内核源 RPM 是成功编译该设备驱动程序的必要条件。

如果受管理主机正在运行 Sun Linux 分发,则无需使用 Linux 内核源 RPM。


网络接口

LOM 控制模块可通过受管理主机上的任一内置网络接口(eth0eth1)运行。不过,如果受管理主机上的这两个内置网络接口均为活动状态,则受管理主机的缺省选择为 eth0


Lights Out 管理屏幕

单击“Lights Out 管理”菜单项,通过其子菜单项可对主机服务处理器进行配置以使用 LOM,执行打开和关闭电源操作,查看受管理主机的传感器和 SEL 数据,或将全局设置应用于受管理主机的服务处理器。

这些子菜单项包括:


配置

为 LOM 模块配置服务处理器 (SP)

要使 LOM 模块软件能够正确管理主机,则需要对某些即将受管理的主机进行服务处理器 (SP) 预配置或安装后手动配置。

Sun Firetrademark V60x、Sun Fire V65x 和 Sun LX50 平台无需预安装设置。

而 Sun Fire V20z 和 Sun Fire V40z 系统则必须预配置服务处理器 (SP) 并安装当前 BIOS 和服务处理器固件。有关说明,请参阅Sun Fire V20z 和 V40z 系统的服务处理器 (SP) 预配置

如果主机为 Sun Fire LX50、Sun Fire V60x 或 Sun Fire V65x,则在安装 LOM 模块时执行“自动配置”。有关说明,请参阅在 Sun LX50、Sun Fire V60x 和 V65x Systems 上自动配置 LOM

如果主机是 Sun Fire V20z 或 V40z 系统,则必须手动配置 LOM。有关说明,请参阅在 Sun Fire V20z 和 V40z 系统上手动配置 LOM

而 Sun Fire V60x、Sun Fire V65x 和 Sun LX50 系列机器有时不能远程打开电源。如果遇到这个问题,请在“LOM 设置”屏幕上启用“免费 Arp”功能。有关详细信息,请参阅设置

Sun Fire V20z 和 V40z 系统的服务处理器 (SP) 预配置

1. 通过 LCD 前面板使用静态 IP 地址、子网掩码和缺省网关 IP 地址来配置服务处理器 (SP)。

有关进一步说明,请参阅《Sun Fire V20z and Sun Fire V40z Servers Installation Guide》中的 "Defining SP Network Settings" 一节。



注 - 为该 SP 使用的 IP 地址不能与主机 IP 地址相同。此 IP 地址必须是静态的;LOM 不支持 DHCP 提供的 IP 地址。



2. 为服务处理器 (SP) 创建初始管理员帐户。

有必要允许登录到服务处理器 (SP) 并按下述步骤运行 IPMI 命令。

有关完整说明,请参阅《Sun Fire V20z and Sun Fire V40z Servers Installation Guide》中的 "Creating the Initial Manager Account" 一节。

3. (可选)为服务处理器 (SP) 设置服务器管理和平台软件。

请参阅《Sun Fire V20z and Sun Fire V40z Servers Installation Guide》中的 "Server Management and Platform Software" 一节。

4. 确定您的机器是否需要更新 BIOS。

使用 2 中定义的初始管理员帐户并使用 ssh 登录到服务处理器 (SP)。登录时将看到类似于以下信息:

Sun MicrosystemsIPMI v1.5 Service ProcessorVersion: V2.1.0.16

如果“Version”显示为 V2.0.x.x,则您必须更新 BIOS 和服务处理器 (SP)。

5. (必要时)请参阅以下网站获得有关 BIOS 安装及相应说明的信息。

http://www.sun.com/servers/entry/v20z/downloads.html
http://www.sun.com/servers/entry/v40z/downloads.html

在 Sun Fire V20z 和 V40z 系统上手动配置 LOM

1. 从 Sun Control Station 界面选择“LOM”right arrow“配置”。

将看到最新添加的主机。对于 Sun Fire V20z 或 V40z 系统,LOM 配置值将为 N。

2. 选择主机并单击“手动配置”。

出现“为 LOM 配置节点设置”屏幕(请参阅图 1)。


图 1 为 LOM 配置节点设置屏幕

此图显示“为 LOM 配置节点设置”页。屏幕上的按钮包括“保存”和“取消”。


3. 提供 IP 配置信息。



注 - BMC(底板管理控制器)即为服务处理器 (SP)。本手册使用“服务处理器”一词,但可能会在 Sun Control Station 界面的某些部分中见到“BMC”一词。





注 - 如果为 Sun Fire V20z 或 Sun Fire V40z 之外的机器手动配置 LOM,请参阅表 1 以确定正确的通道值。



该命令首先将尝试清除服务处理器 (SP) 上的这些值,然后再将其设为期望值。完成该命令可能需要几分钟的时间。

最终应看到 LOM 配置值设为 Y。

以上所有步骤执行完毕之后,如果 LOM 无法工作(即无法从 LOM 向受管理主机发出任何命令),请参阅《Sun Fire V20z and Sun Fire V40z Servers Server Management Guide》中的 "IPMI Troubleshooting" 一节,或者与您的 Sun 服务代表联系以寻求帮助。

在 Sun LX50、Sun Fire V60x 和 V65x Systems 上自动配置 LOM

要在 Sun LX50、Sun Fire V60x 和 V65x 系列机器上配置 LOM,请从 Sun Control Station 界面执行这些步骤。

1. 选择“LOM”right arrow“配置”。

2. 选择待配置主机。

3. 单击“自动配置”。

该命令首先将尝试清除服务处理器 (SP) 上的这些值,然后再将其设为期望值。完成该命令可能需要几分钟的时间。

在 Sun LX50、Sun Fire V60x 和 V65x 系统上手动配置 LOM

通常,您应当使用“自动配置”功能在 LX50、V60x 和 V65x 系统上设置 LOM。不过,如果选择为这些系统手动配置 LOM(请参阅图 1),则有些问题需要注意。

1. 服务处理器与主机所用的 IP 地址、子网掩码和缺省网关相同。

2. 您需要根据具体的硬件、所用的以太网接口以及基本 Linux 内核版本来设置通道值。请参阅表 1 以确定使用的通道值。


表 1 通道映射

硬件

Linux 内核

网络接口

通道

LX50

所有版本

eth0

7

LX50

所有版本

eth1

6

V60/5x

2.4

eth0

6

V60/5x

2.4

eth1

7

V60/5x

2.6

eth0

7

V60/5x

2.6

eth1

6

V20/40z

所有版本

所有版本

1


 


电源

通过“Lights Out 管理电源”子菜单项可以在一台或多台受管理主机上执行电源管理功能。

单击“电源”子菜单项后,会出现选定器窗口,显示各个组以及各组内的受管理主机。在选定器窗口底部显示以下按钮(请参阅图 2)。


图 2 电源菜单选择窗口

此屏幕快照显示“电源”子菜单;按钮包括“打开电源”、“关闭电源”、“重置”和“标识”。


电源功能的已知问题

如果使用 LOM 模块向受管理主机发送“关闭电源”命令,紧接着发送“打开电源”命令(在“关闭电源”命令完成之前),则受管理主机可能会处于 init 0 状态:主机仍处于开机状态而操作系统却关闭了。

再次向受管理主机发送“关闭电源”命令,就可以更正该问题。

打开主机电源

通过“打开电源”命令可以远程打开主机电源。



注 - 如果主机已经打开电源,则该命令不会对主机产生影响。



1. 选择“Lights Out 管理”right arrow“电源”

随即出现选定器窗口,显示受管理主机的列表。

2. 突出显示一台或多台主机,或者单击“全部选择”选择列表中的所有主机。

3. 单击右下角的“打开电源”

将会显示“任务进度”对话框。

关闭主机电源

通过“关闭电源”命令可以远程关闭主机电源。该命令会尝试在关闭主机电源之前关闭操作系统。



注 - 如果主机已经关闭电源,则该命令不会对主机产生影响。



1. 选择“Lights Out 管理”right arrow“电源”

随即出现选定器窗口,显示受管理主机的列表。

2. 突出显示一台或多台主机,或者单击“全部选择”选择列表中的所有主机。

3. 单击右下角的“关闭电源”

将会显示“任务进度”对话框。

重置主机

“重置”命令会使硬件重置。如果主机操作正常,则系统将正常关闭并重新引导。如果系统挂起并且没有响应,则“重置”命令将强行对系统进行重置。



注 - 如果主机电源关闭,则该命令不会对主机产生影响。



1. 选择“Lights Out 管理”right arrow“电源”

随即出现选定器窗口,显示受管理主机的列表。

2. 突出显示一台或多台主机,或者单击“全部选择”选择列表中的所有主机。

3. 单击右下角的“重置”

将会显示“任务进度”对话框。

标识主机

在具有标识 LED 的主机上(如 Sun LX50 服务器或 Sun Fire V60x 和 V65x 服务器),“标识”命令能使前面板和后面板上的 LED 闪烁;这对于在设备机架中定位主机十分有用。

LED 闪烁四分钟,然后关闭。



注 - 如果关闭主机电源,或如果系统挂起,则该命令仍能使 LED 闪烁。如果您已经从主机前面板激活了 LED(持续发光,但不闪烁),则该命令不会对主机产生影响。



1. 选择“Lights Out 管理”right arrow“电源”

随即出现选定器窗口,显示受管理主机的列表。

2. 突出显示一台或多台主机,或者单击“全部选择”选择列表中的所有主机。

3. 单击右下角的“标识”

将会显示“任务进度”对话框。


传感器/SEL

通过传感器/SEL 子菜单项可以查看主机上的传感器或系统事件日志 (SEL) 中的最新数据,实时更新数据,或安排在以后进行数据更新。

单击“传感器/SEL”子菜单项后,出现选定器窗口,显示各个组以及各组内的主机。在选定器窗口底部显示以下按钮(请参阅图 3)。


图 3 传感器/SEL 选定器窗口

此屏幕快照显示“传感器/SEL”子菜单;按钮包括“显示”、“立即更新”和“进程调度”。


更新传感器和 SEL 信息时,该功能将从受管理主机中对整个 SEL 进行检索。一个完整的 SEL 可包含多达 3000 条记录。直到从受管理主机中对整个 SEL 检索完毕之后,才会显示已更新的 SEL 信息。

SEL 中包含的条目越多,检索 SEL 和传感器数据时所涉及的主机数量越多,检索信息所需的时间就越长。如果决定为许多受管理主机安排传感器和 SEL 信息的更新,您就应当考虑这些因素。

显示传感器数据和 SEL

您可以查看主机的传感器数据汇总。然后您可以从结果汇总表中查看传感器数据详细资料表、查看 SEL 以及更新当前数据。即使关闭了主机电源也能更新这些数据。



注 - 还可以在“运行状况监视”模块中显示受管理主机的 LOM 传感器汇总数据。请参阅运行状况监视模块中的传感器数据



1. 选择“Lights Out 管理”right arrow“传感器/SEL”

显示受管理主机的列表。

2. 突出显示一台或多台主机,或者单击“全部选择”选择列表中的所有主机。

3. 单击“显示”按钮。

随即就会显示“传感器状态汇总”表(请参阅图 4)。


图 4 传感器状态汇总表

此屏幕快照显示“传感器状态汇总”表的一个样例。


4. 在右侧的列中,您可以执行以下操作之一:

5. 如果单击“传感器详细资料”图标,便会出现传感器详细资料表。

根据主机类型的不同,在该表中显示不同的传感器(请参阅图 5)。

单击“更新数据”以更新传感器数据(请参阅更新主机信息显示)。


图 5 传感器详细资料表

此屏幕快照显示传感器详细资料表。


6. 单击“系统事件日志”图标。

随即显示 SEL 中的记录(请参阅图 6)。


图 6 “详细系统事件日志”表

此屏幕快照显示系统错误日志 (SEL) 数据详细资料表的一个样例。


“详细系统事件日志”表显示以下信息:

有关事件说明的详细信息,请参阅以下位置的 IPMI 文档:
http://www.intel.com/design/servers/ipmi/index.htm

可以从该屏幕中对 SEL 进行清除(请参阅清除 SEL)或更新 SEL(请参阅更新 SEL 显示)。

清除 SEL

可以清除受管理主机的 SEL。SEL 数据一旦清除就无法恢复。由于 Sun 技术支持部门可能需要这些数据,因此在清除 SEL 之前,请注意任何不寻常的错误模式。

1. 转到“详细系统事件日志”表(请参阅图 6)。

2. 单击“清除 SEL”按钮。

此按钮位于“详细系统事件日志”表下方。将会显示“任务进度”对话框。

更新 SEL 显示

可以强行从受管理主机中检索最新的 SEL 数据。

1. 转到显示详细 SEL 表的屏幕。

2. 单击“更新 SEL”按钮。

此按钮位于“详细系统事件日志”表下方。将会显示“任务进度”对话框。



注 - “详细系统事件日志”表中的“立即更新”功能只能更新 SEL 信息,而不能更新传感器数据。



更新主机信息显示

通过“更新”功能可以在受管理主机上检索最新的传感器数据和 SEL。

可以在用户界面的若干位置更新传感器数据和 SEL:

single-step bullet在选定器窗口底部,单击“立即更新”。

该功能将更新选定受管理主机的所有传感器数据和 SEL 信息。

single-step bullet查看“传感器状态汇总”表时单击“更新数据”。

该按钮位于表下方。单击该按钮会更新“传感器状态汇总”表中列出的每台主机的传感器数据和 SEL。

single-step bullet查看传感器数据详细资料表时单击“更新传感器”。

该按钮位于表下方。该功能将更新此特定主机的所有传感器数据和 SEL 信息。

将会显示“任务进度”对话框。



注 - 也可以将更新主机信息安排在以后进行。详细信息,请参阅《Sun Control Station 2.2 管理员手册》中的调度功能。



运行状况监视模块中的传感器数据

在“运行状况监视”模块中,可以查看受管理主机上组件和服务状态的详细信息表。

查看报告 LOM 传感器数据的主机的这些表时,会在“其他系统服务”表中显示汇总数据。这些数据包括传感器和系统事件日志 (SEL)。

可以在“运行状况监视”模块中输入一个电子邮件地址,这样在发生紧急系统事件(带红圈)时,就能从该模块发出警告。

详细信息,请参阅 PDF 格式的《Sun Control Station 2.2 运行状况监视模块》。


设置

通过“设置”屏幕(请参阅图 7),可以将通用设置应用到所有受管理主机的服务处理器。这些设置影响当前由控制站管理的所有主机,以及您随后增加的那些受管理主机。


图 7 LOM 设置屏幕

此屏幕快照显示 LOM 设置屏幕。


服务处理器设置影响以下内容。



注 - 如果您没有为主机指定任何本地密码,而且没有设置全局密码,LOM 模块就会使用缺省(随机)密码。




智能平台管理接口 (IPMI) 概述

IPMI 定义了“智能”硬件的通用接口,这些接口用于监视服务器的物理运行状况特征和组件(如温度、电压、风扇、电源和机箱)。除了能够进行运行状况监视之外,IPMI 还具有其他系统管理功能,如自动报警、自动关闭和重新启动系统、远程重启和电源控制能力,以及资产追踪。

基于 IPMI 的服务器管理使用户能确定服务器硬件的运行状况,确定服务器是否运行正常或是否处于不可操作状态。基于 IPMI 的服务器使用“智能”或自治硬件,这类硬件即使在处理器关闭的情况下也可继续操作,因此能保证平台管理信息和控制功能始终均可访问。IPMI 接口功能强大,得到广泛认可,可在任何系统阶段从串行/调制解调器、LAN、本地管理软件、第三方突发事件管理插卡以及其他支持 IPMI 的服务器,访问相同的管理功能:关闭电源、重新引导、加载操作系统和运行时间。

有关 IPMI 的详细信息,请参阅 http://www.intel.com/design/servers/ipmi/index.htm