第九章



监视 Sun Fire Link 互联体


Sun Fire Link 软件的特性窗格提供了有关互联体配置的信息。本章讨论如何访问和理解特性窗格。

Sun Management Center 软件还提供了与互联体组件有关的当前状态信息。此信息显示在“互联体细节”窗格中。本章讨论如何访问和理解包含有互联体组件信息的“细节”窗格。

通过再次访问配置互联体及其分区所用到的对话框,可获得很多有用的信息。

Sun Management Center 和 Sun Fire Link Manager 软件从很多方面提供了关于互联体的更为全面的信息。


通过查看配置对话框来检查互联体信息

通过再次打开配置互联体时用过的对话框来查看某些信息。例如,



注意 - 日志文件中也提供状态和错误信息。




显示互联体控制台

Sun Management Center 软件收集与 Sun Fire Link 硬件和软件组件相关的状态数据。可使用各种 Sun Management Center 刷新 命令,来请求更新状态数据。

双击“缺省域”窗口中的互联体图标,Sun Management Center 控制台会弹出“细节”窗口。该互联体“细节”窗口含有 Sun Fire Link 软件命令的菜单。若视为一个整体,“互联体细节”窗口也称为 FM 控制台。图 9-1 显示一个 FM 控制台的实例

图 9-1   Sun Fire Link 互联体控制台

“视图”菜单

依“视图”的设定,对于每个分区的拓扑结构都有两种不同的视图。

图 9-2   “视图”菜单

使用“视图”下拉菜单来选择互联体两种视图中的一种:

  • “节点和路由”视图 -- 这一视图反映出数据在 Sun Fire Link 节点间的路由。每个路由可包含多个电缆链接。该视图为缺省视图。

  • “机柜和链接”视图 -- 这一视图反映出各个链接(电缆),它们连接着基于机柜的节点和交换机(若有)。

树窗格

该互联体控制台以树状结构显示互联体组件:
互联体 -> 分区 -> 节点(或机柜)。另外,可用节点和可用交换机(若有)的文件夹也显示在互联体树的根符号下。

树元素有:

  • 互联体 - 互联体所有组件的一份列表。这一级别不显示警报图标。

  • 可用节点 - 可用于挂接到某个分区(即它们尚未被指定给任何分区)的互联体中所有已注册节点的列表。这一级别不显示警报图标。

  • 可用机柜 - 含有可用于挂接到某个分区(即它们尚未被指定给任何分区)的节点的互联体中所有系统的列表。在单个机柜的级别显示警报图标,并细化到机柜内的节点。

  • 可用交换机 - 可用于挂接到某个分区(即它们尚未被指定给任何分区)的互联体中所有已注册的交换机的列表。这一级别不显示警报图标。

  • 分区 - 一系列的互联体节点和交换机。一旦节点或交换机被分配给某个分区,它就不再出现在可用 文件夹中。于这一级别以及属于该分区的节点,会显示警报图标。



注意 - 在这一版本中,交换机不显示警报图标。



拓扑窗格

分隔窗格的右侧窗格为拓扑窗格,它以拓扑图形的方式描述互联体。双击窗格中的任一项,可弹出与其相关的的信息对话框。从“编缉”菜单选择命令或右键单击某项目将其选定,以执行各种操作。如有警报出现,则与该警报相关的项目会在拓扑窗格中标出。警报的显示是可以过滤的,可以显示全部警报,显示有关降级或出故障的警报。也可从下拉菜单中选择查看大图标或小图标。

拓扑窗格显示 Sun Fire Link 网络中分区运作状况的高级视图。这些信息可为调查问题提供切入点。

双击任一窗格中的机柜或节点,可弹出与之相关的“细节”对话框。

使用“节点和路由”视图查看分区

可以用大图标或小图标的形式显示拓扑窗格中的组件(分别如图 9-1图 9-3 所示)。

图 9-3   具有两个节点的分区(以小图标显示)

“节点和路由”视图显示出数据在一个分区中各节点间的路由。这些路由可包含一个或多个物理链路(电缆),可通过双击或右键单击路由来访问路由和链接的详细信息。通过路由的颜色和图标可看出路由的状态,其状态包括:

  • 正常 - 路由中不存在严重性级别高于“正常”的链接。这种路由为黑色。该路由上有一个标准路由访问点(黑色方框)。

  • 降级 - 路由中的一个或多个链接的严重性高于“正常”,或路由包含的链接不足以满足分区的复线要求。这种路由为黄色。一个标准的 Sun Management Center 警告图标替代了路由访问点。

  • 故障 - 路由中所有链接的严重性都高于“正常”,或该路由根本不包含任何链接(即,无法到达该节点)。这种路由为红色。一个标准的 Sun Management Center 错误图标替代了路由访问点。

“节点和路由”视图显示的项目有:

  • Sun Fire Link 节点 - 以中心为白色的节点图形表示。每个节点标有分区名、节点 ID 和域 ID。

  • 路由 - 以连接着各个节点的实线表示。

  • 路由访问点 - 以路由拐角处的方形符号表示,便于选择。

  • 警报图标 - 以标准 Sun Management Center 错误图标表示,显示在路由的拐角处,便于发觉和选择。

查看数据路由特性

双击“节点和路由”视图中的路由,可看到两个节点间与该路由有关的数据。

“路由特性”对话框有助于找出是哪些故障导致路由被标记为降级或故障。图 9-4 显示一组运作良好的链接的路由特性。

图 9-4   路由特性对话框

路由信息包括:

  • 此路由中的节点 - 由它的 SC 主机名和域 ID 标识出的每个节点。

  • 复线级别

  • 路由状态

  • 该路由的端口到端口的连接:

    • 从 - 节点

    • 到 - 节点

    • 电缆始端 - 节点.插槽.接口.paroli

    • 电缆终端 - 节点.插槽.接口.paroli

    • 链接状况 - 连通或断开

使用“机柜和链接”视图查看分区

拓扑窗格显示了以下项目:

  • 机柜 - 包含了所有节点的灰色无边框矩形。

  • 节点 - 显示在灰色矩形(机柜)中的具有多种颜色的节点图标,矩形是节点的物理位置。

  • 链接 - 连接着节点的实线。

  • 警报图标 - 标准 Sun Management Center 错误图标,显示在链接的中点处。

  • 复线环 - 显示在窗格的左上角。环数表明复线级别。

  • 信息 - 信息类消息,出现在拓扑视图窗格的底部。这些消息提供了鼠标指针所在对象的相关信息。



注意 - 分区中包含交换机时,拓扑窗格会显示相互重叠的交换机。



查看链接特性

双击“机柜和链接”视图中的链接,可看到与该链接相关的数据。

“链接特性”对话框显示:

  • 链接的节点

  • 复线级别

  • 端口到端口的连接性:

    • 电缆始端 - 节点.插槽.接口.paroli

    • 电缆终端 - 节点.插槽.接口.paroli

    • 链接状态 - 连通或断开

图 9-5   “链接特性”对话框


显示分区中节点的特性


步骤图标   查看节点特性


single-step bullet 双击节点图标,以查看该节点的“节点特性”对话框。

关键节点信息显示在顶部,包括:

  • SC 主机名

  • 域 ID

  • SC IP 地址

  • 机柜类型

  • Solaris 主机名

  • Solaris IP 地址

  • 内存

  • 代理端口

  • 代理服务器主机名

  • 物理位置

  • WCI 信息:模式 - 总是 RSM

  • WCI 信息:WCIS - Sun Fire Link 接口,按插槽顺序排列

  • WCI 信息:链接信息(状态)

图 9-6   “节点特性”对话框


步骤图标   查看交换机特性


single-step bullet 双击节点图标,以查看该节点的“节点特性”对话框。

关键节点信息显示在顶部,包括:

  • SC 主机名

  • SC IP 地址

  • 机柜类型

  • 内存

  • 代理端口

  • 代理服务器主机名

  • 实体位置

  • 模式

  • WCIS

  • 链接信息

图 9-7   “交换机特性”对话框


步骤图标   查看机柜特性


single-step bullet 双击机柜图标,以查阅机柜的相关数据。

这些数据包括:

  • SC 主机名

  • SC IP 地址

  • 机柜类型

  • 节点列表:

    • 域 ID

    • 模式 - RSM

    • Solaris 主机名

    • Solaris IP 地址

图 9-8   “机柜特性”对话框

Sun Management Center 软件从节点自身驻留的代理模块所管理的数据获得 Sun Fire Link 机柜信息。

此表列出了全部现有节点,以及所有可用的摘要信息。使用“节点细节”按钮,可调出所选节点的“节点特性”对话框。


显示互联体硬件数据


步骤图标   查看互联体硬件设备的相关数据

1. 在 Sun Management Center 控制台中,双击一个 Sun Fire 服务器系统的图标。

随之弹出该系统的“细节”窗口。

2. 在“细节”窗口中选择“浏览器”选项卡。

出现“配置读取器”树(如图 9-9 所示)。

图 9-9   配置读取器树

3. 双击树中与 Sun Fire Link 相关的项目。

举例来讲,您可以查看图 9-10 所示的 Sun Fire Paroli DCA 表格,以及如图 9-11 所示的 ASIC(包括安装在 Sun Fire Link 组件中的 cPCI I/O 板)表格。

还可查看 Sun Fire Link ASIC 数据表格,如图 9-12 所示。

图 9-10   配置读取器 Paroli 数据表格

图 9-11   配置读取器板数据表格

图 9-12   配置读取器 Sun Fire Link ASIC 数据表格


步骤图标   查看互联体设备的物理视图

1. 单击打开节点细节窗口的“硬件”选项卡。

2. 在“视图”下拉菜单中,选择“物理视图”或“逻辑视图”中的一项。请参见图 9-13

图 9-13   硬件细节窗口中组件的硬件摘要列表

如果选择了“物理视图”标题下一个名为 system 的条目,随后可将光标移至系统的前视图或后视图上。

将光标放在某个组件上,可令物理查看器显示出该组件的相关信息。例如,图 9-14 中所示图片即为 Sun Fire 6800 系统的后视图。光标高亮显示了 Paroli IB8。

当光标经过现场可替换部件 (FRU)时,它们在图中被高亮显示。若将光标在其上停留几秒钟,相应特性和值会显示在特性窗口中。

所显示的选定系统的特性有:

  • 名称 - 所选组件的名称

  • FRU - 该组件是否为现场可替换部件

  • 链接号 - 链接端口编号,可能是 0(零)或 2。

  • 链接有效性 - 链接可能为有效的或无效的。无效的状况会引发警报。

  • 链接状况 - 链接可能为连通的或断开的。关闭状况有多种,每种所引发的警报各不相同。

    链接状况

    警报级别

    LINK UP

    LINK DOWN

    LINK NOT THERE

    WAIT FOR SC TAKEDOWN

    WAIT FOR SC LINK UP

    SC ERROR WAIT FOR LINK DOWN

    UNKNOWN

    无警报

    错误 - 红色,紧急

    信息 - 蓝色,警告

    警告 - 黄色,警报

    警告 - 黄色,警报

    警告 - 黄色,警报

    错误 - 红色,紧急

  • 远程链接号 - 链接远端相应组件的编号(0 或 2)。

  • 远程群集成员 - 含有远程链接上相应组件的节点的名称

图 9-14   Sun Fire 6800 系统的物理视图

图 9-15   Sun Fire 15K/12K 系统的物理视图

图 9-16 显示 Sun Fire Link 交换机的物理视图。在本例中,列出了 Paroli 板插槽 7 中的特性值。

监视交换机信息对所显示的交换机组件的特性和值进行了描述。

图 9-16   交换机的物理视图

如果选择了“逻辑视图”,单击某图标,将在特性窗口中显示它的特性。可双击一些图标以看到各个组件,或者单击“展开所有”按钮,这将看到系统中的所有组件。“特性”窗口中显示不同的特性和值。

逻辑视图以列表形式显示与选定组件相关的信息。例如,图 9-17 显示了 IB8 中板的逻辑视图。除了列出 PAR1 的细节之外,它与图 9-14 所示的 I/O 位置相同。

图 9-17   Paroli IB8/PAR1 的逻辑视图

有关 Sun Fire 6800 系统“物理视图”和“逻辑视图”的详细信息,请参见《Sun 商标 Management Center 3.0 Supplement for Sun Fire 商标 6800/4810/3800 Systems》


利用系统细节监视互联体

通过打开群集中某 Sun Fire 系统的“细节”窗格,可使 Sun Management Center 控制台显示出与 Sun Fire Link 分区结构相关的信息。许多 Sun Fire Link 附加模块都通过“细节”窗格提供信息。

利用“细节”窗格查看互联体信息时,无需打开互联体控制台。

可查看的内容有:

  • FM 特性表格

  • 互联体信息表格

  • RSM 特性和数据表格

图 9-18   Sun Fire Link FM 特性表格

FM 特性表格

  • 互联体名称 - 互联体的名称

  • 服务器名称 - Fabric Manager 主机的名称

  • 端口 - 缺省情况下,端口号为 1099。

  • FM 状态 -“OK”或“Could not connect”

  • FM 版本 - Fabric Manager 软件的版本号,或者“Could not connect”

  • FMDAQ 日志名 - 安装在 Sun Management Center 服务器中的 FM 组件与 Fabric Manager 自身之间互相发送的消息的日志

  • FMDAQ 日志大小 - FMDAQ 日志的大小(以字节为单位)

图 9-19   Sun Fire Link FM 细节表

互联体信息表

  • 分区表

    • 分区名 - 分区的名称

    • 类型 - RSM

    • 拓扑结构 - 直接连接或 WcixSwitch

  • 成员表

    • 分区名 - 分区的名称

    • 成员名 - 节点或交换机的名称

    • SC 名称 - 系统控制器的名称

    • 域 ID - 节点域的 ID:A、B、C 或 D

    • 机柜类型 - 其类型包括:S24 (Sun Fire 6800)、S72 (Sun Fire 15K/12K) 或 WCIX_SWITCH

    • 代理端口 - 缺省情况下,代理端口号为 161

  • 链接表

    • 分区名 - 分区的名称

    • 成员名 - 节点或交换机的名称

    • SC 名称 - 系统控制器的名称

    • 域 ID - 节点域的 ID:A、B、C 或 D

    • 本地 WCI 插槽 - 本地 Sun Fire Link 部件插槽的编号

    • 本地 WCI ID - I/O WIB 的 ID(总为 1)

    • 本地端口号 - 0 或者 2

    • 交换机端口号 - 从 0 到 7 之间的某个值

    • 链接状态 -“链接连通”或未知

    • 链接状况 - MPI 通信需要“链接连通”。所有其它状况都会停止 MPI 通信。

      链接状况

      LINK UP

      LINK DOWN

      LINK NOT THERE

      WAIT FOR SC TAKEDOWN

      WAIT FOR SC LINK UP

      SC ERROR WAIT FOR LINK DOWN

      UNKNOWN

    • 远程节点名 - 远程节点的名称

    • 远程 WCI 插槽 - 远程 Sun Fire Link 部件插槽的编号

    • 远程 WCI ID - I/O WIB 的 ID

    • 远程端口号 - 0 或者 2

FM 警报

通过 Sun Management Center 控制台监视 FM 信息的过程中,一旦出现不正常的或应报告的情况,Sun Fire Link Fabric Manager 都会发出警报。以下条件将引发已定义严重级别的警报:

条件

严重性级别(图标颜色)

FM 不处于“正常”状态

警告(黄色)

FM XML 文件的修改状态为“已修改”

信息(蓝色)


监视 RSM 信息

WRSM 代理模块监视着互联体中每一个节点的信息。它通过 Solaris 的库和命令执行操作,这些库和命令包括 WCI RSM 驱动程序、kstatsyseventd 工具。WRSM 模块收集详细的 RSM 链接参数并进行汇总,以便将这些信息提供给其它 Fabric Manager 代理模块。代理模块监视着这些参数的阈值并根据那些阈值发出故障信号。

WNode RSM 特性

WNode RSM 特性文件夹显示 WNode 数据表、RSM 控制器数据表和 RSM 节点 WCI 数据表。这些表格中所列数据代表着 RSM 驱动程序的内部配置和状况。

术语 Wnodes 是指分区中的节点。

所有分区配置操作都要有 RSM 控制器的参与。每个分区联结到一个 RSM 控制器 -- 一个节点可以有多个控制器,每一个控制器都管理其所在的一个分区。

图 9-20   WNode RSM 特性表

  • WNode 数据

    • 主机名 - 节点的名称

    • 节点类型 - SUNW 或 Sun-Fire

  • RSM 控制器数据

    • 控制器 ID - RSM 控制器的 ID。

    • 控制器版本 - RSM 控制器的版本。Sun Fire Link 软件以此编号来识别当前的群集配置。

  • RSM 节点 WCI 数据

    • 控制器 ID - RSM 控制器的 ID。

    • WCI 端口 ID - WCI 的地址(总是 1)。

    • Paroli 数 - 缺省值为 2。

Wnode RSM 信息

Wnode RSM 信息文件夹显示 RSM 成员表、链接状态表和路由数据表。

图 9-21   Wnode RSM 信息表

  • RSM 成员数据

    • 控制器 ID - RSM 控制器的 ID。

    • 成员名 - 节点的名称。

    • CNode ID - RSM 群集节点 ID,一个介于 0 到 255 之间的唯一的值。Sun Fire Link 软件使用此编号将数据路由到分区成员。

  • RSM 链接状态数据

    • 控制器 ID - RSM 控制器的 ID。

    • WCI 端口 ID - WCI 的地址(总是 1)。

    • 链接号 - 链接端口的编号。0 或 2。

    • 链接状态 -“连通”或“断开”

    • 链接状况 - 7 种链接状况分别为

      链接状况

      LINK UP

      LINK DOWN

      LINK NOT THERE

      WAIT FOR SC TAKEDOWN

      WAIT FOR SC LINK UP

      SC ERROR WAIT FOR LINK DOWN

      UNKNOWN

    • 链接有效性 - 有效或无效

    • 远程 CNode ID - RSM 群集节点 ID,0 到 255 之间的一个唯一的值。

    • 远程 WNode ID - 0 到 15 之间的一个值

    • 远程 WCI 端口 ID - WCI 的地址。

    • 远程链接号 - 远程链接端口的编号。0 或 2。

    • 链接错误断开次数 - 由 kstat 计算得出。

    • 链接配置断开次数 - 由 kstat 计算得出。

    • 链接重接失败次数 - 由 kstat 计算得出。

    • 最大链接错误数 - 由 kstat 计算得出。

    • 平均链接错误数 - 由 kstat 计算得出。

  • RSM 路由数据

    • 控制器 ID - RSM 控制器的 ID。

    • WCI 端口 ID - WCI 的地址(总是 1)。

    • 链接号 - 链接端口的编号。0 或 2。

    • 路由类型 - 通过或者多重中继。

    • 路由更改数 - 由 kstat 计算得出。

    • 目标主机名 - 位于链接远端的系统的主机名。

    • 目标 CNode ID - Sun Fire Link ASIC 和驱动程序用此编号将数据传递至分区中的成员。

    • 目标 GNID - Sun Fire Link 软件用此编号在分区中传递数据。

警报

WRSM Agent Module 检查 kstat 数据,查找那些超出预定义阈值的值。适当情况下 WRSM 代理模块会触发警报或警告。对于所有受到监视的链接,以下条件可引起已定义严重级别的警报:

条件

严重性级别(图标颜色)

链接有效性为无效

错误(红色)

链接状况为“链接断开”

错误(红色)

链接状况为“SC 错误,等待链接断开”

错误(红色)

链接状况为“未知”状态

错误(红色)

链接状况为“等待 SC 链接断开”

错误(红色)

链接状况为“链接不存在”

信息(蓝色)

链接状况为“等待 SC 链接连通”

警告(黄色)

链接错误断开数大于较低的阈值

警告(黄色)

链接错误断开数大于较高的阈值

错误(红色)

链接配置断开数大于较低的阈值

警告(黄色)

链接配置断开数大于较高的阈值

错误(红色)

链接重接失败次数大于较低的阈值

警告(黄色)

链接重接失败次数大于较高的阈值

错误(红色)

最大链接错误数大于较低的阈值

警告(黄色)

最大链接错误数大于较高的阈值

错误(红色)

平均链接错误数大于较低的阈值

警告(黄色)

平均链接错误数大于较高的阈值

错误(红色)

监视交换机信息

“交换机”模块的数据显示出除陷阱之外的整个 Sun Fire Link 交换机代理数据库(如本节所示)。

图 9-22   主机硬件细节窗格中的交换机代理服务器代理图标

双击交换机代理服务器,可打开数据表格的树状视图,而这些数据是由交换机代理服务器提供给 Sun Management Center 软件的。随后可从树状视图中选择一个表格,并查看其显示在右侧窗格中的各项特性和值。

机柜数据

机柜表中存储着有关交换机的概览级的数据。

  • 描述 - 用交换机 CLI 设置或 setupplatform 命令创建的交换机机柜的“交换机描述”。

  • FRU 索引 - 交换机背板的 FRU 数据的指针。

  • 名称 - 交换机的主机名。

  • 位置 - 用户可写入的字段,用于存储对于交换机物理位置的描述。

  • 联系人信息 - 用户可写入的字段,用于存储负责此交换机维护事宜的人或组的联系数据。

  • 日志主机 - 用户可写入的字段,用于存储日志主机的名称。

  • 陷阱主机 - 用户可写入的字段,用于存储陷阱主机列表的名称。

  • 插槽数 - 交换机中插槽的数目。这决定着该交换机插槽表中条目的数量。

  • 运行时间 - 自交换机控制器最后一次重新初始化以来所经过的时间(以百分之一秒为单位)。

  • 以太网地址 - 用以访问此交换机控制器的 MAC 地址。

  • 名称 - 支持交换机物理视图和逻辑视图的数据。

插槽数据

插槽表存储着一份交换机插槽、占用那些插槽的板的类型以及板状态等信息的列表。复位时,在交换机中为所有可能的插槽创建了一个插槽项。如果复位时某插槽为空,日后它也许会被占用。

  • 插槽索引 - 标识特定部件的整数。

  • 索引 - 标识特定插槽的整数。

  • 板类型 - 安装在机柜这一插槽中的板的类型。请参见表 9-1

    表 9-1   插槽板类型

    含义

    1

    2

    控制器

    3

    wciX

    4

    paroli

    5

    风扇

    6

    电源

  • 状况 - 板的当前状态。若占据着插槽的板已损坏,则状态值为未知。若一个链接正在进行中但尚未完全决定其角色,则状态值为已分配。若组件由于测试失败或正在测试中而导致不可用,则其状况为不可用。若此板可以安全拆除,则其状态为可拆除

    表 9-2   状况

    含义

    1

    不可用

    2

    未知

    3

    可用

    4

    已分配

    5

    活动

    6

    可拆除

  • 测试状态- 此插槽中板的测试状态。

    表 9-3   测试状态值

    含义

    1

    未知

    2

    未经测试

    3

    已通过测试

    4

    失败

    5

    测试中

  • 状态 - 板的状态,主要用于陷阱。如果插槽不可访问,其状态为未知。如果所有受监视的插槽环境变量处于警告限定值之内,则状态为正常(绿色)。如果一个或多个环境变量高于或低于绝对上限值或下限值,则状态分别为超上限(红色)超下限(红色)。如果某些变量高于或低于警告限定值,则状况分别为超警告上限(黄色)超警告下限(黄色)。如果状态既非未知 也非正常(绿色),插槽的“传感器”字段将含有一个字符串,它描述用于监控插槽状态的传感器。请参见表 9-4

    表 9-4   状态

    含义

    1

    未知

    2

    正常(绿色)

    3

    超警告下限(黄色)

    4

    超下限(红色)

    5

    超警告上限(黄色)

    6

    超上限(红色)

  • 插槽名称 - 描述插槽名称的字符串。

  • 传感器 - 如果状态是红或黄,则为监控该状态的传感器的名称。

  • 名称 - 支持交换机物理视图和逻辑视图的数据。

控制器部件数据

对于每台交换机的交换机系统控制器 (SSC) 都有一个插槽。如果未安装控制器部件,则此数据不可用,因为 SSC 卡上的处理器和以太网控制器共同提供 SNMP 服务(用于提供数据)。

  • 索引 - 标识特定部件的整数。

  • FRU 索引 - FRU 表中的一个索引,用于标识与该设备有关的信息

  • 软件版本 - 一个用于标识运行在该控制器卡上的软件版本的字符串。

  • 时区 - 简单易懂的时区描述,用于表示此控制器上的日期。

  • 日期 - 控制器的日期与时间,以

mmddHHMMSSccyy 的格式表示。

请参见表 9-5,以获得有关这些字段的说明:
表 9-5   日期

字段

含义

mm

月 (1-12)

dd

日 (1-31)

HH

时 (0-23)

MM

分 (0-59)

SS

秒 (0-59)

cc

时区

yy

当前年份的最后两位数字

  • 网络配置 - 说明网络配置,以及控制器是如何在网络中标识其自身的。表 9-6 定义可能的值。

    表 9-6   网络配置

    含义

    1

    未知

    2

    未联网

    3

    固定的

    4

    dhcp

  • 主机名 - 此控制器的主机名。

  • IP - 此控制器的 IPV4 地址。如果此控制器最后一次引导时,controllerNetConfigdhcp,则初始化过程中,该字段被隐性设置为由 dhcp 返回的值。

  • 网络掩码 - 此控制器用于 IP 网络通信的网络掩码。

  • 缺省路由器 - 为此控制器设定的以空格分隔的一份路由器列表。

  • DNS - 该控制器的 DNS 域。

  • DNS 解析器 - 该控制器所使用的 DNS 解析器。

  • 电源 LED - 控制器上电源 LED 的状况。请参见表 9-7

    表 9-7   电源 LED

    含义

    1

    打开

    2

    关闭

    3

    未知

  • 故障 LED - 控制器上故障 LED 的状况。请参见表 9-8

    表 9-8   故障 LED

    含义

    1

    打开

    2

    关闭

    3

    未知

  • 热插拔 LED - 控制器上“热插拔 LED”的状况。请参见表 9-9

    表 9-9   热插拔 LED

    含义

    1

    打开

    2

    关闭

    3

    未知

  • 状况 - 描述 SSC 的状况(总是 启动

  • 电压 33 - 在 3.3 伏电源线路上检测到的电压数值(以百分之一伏特为单位)。

  • 电压 50 - 在 5.0 伏电源线路上检测到的电压数值(以百分之一伏特为单位)。

  • 电压 120 - 在 12.0 伏电源线路上检测到的电压数值(以百分之一伏特为单位)。

  • 温度 - 板的温度(以百分之一摄氏度为单位)。

  • Nvram 备用电池 - 描述 NVRAM 备用电池的状态。请参见表 9-10

    表 9-10   Nvram 备用电池

    含义

    1

    未知

    2

    正常

    3

    电量低

  • 主机 ID - 控制器主机 ID。

  • 名称 - 支持交换机物理视图和逻辑视图的数据。

SFL 部件数据

此表描述 SFL 交换机部件数据。

  • 索引 - 标识特定部件的整数。

  • FRU 索引 - 此 SFL 部件中 FRU 信息的“FRU 表”中的索引。

  • 描述 - Sun Fire Link Crossbar 模块。

  • 状况 - 如果无法与 SFL 部件建立通信(如找不到卡时),或者通电之后尚未进行处理,则 SFL 部件是未知 的。一旦获知该设备存在,如果接通电源它即转换到未经测试,如果仅是控制器重新引导并且可认定芯片已经过测试(如它正在使用中),状态即转换到已通过测试。如果设备经测试证明失败,则状况转换为失败处于反射模式 表明一个或多个链接为进行 SunVTS 测试而置于反射模式。请参见表 9-11

    表 9-11   状况

    含义

    1

    未知

    2

    未经测试

    3

    已通过测试

    4

    处于反射模式

    5

    失败

  • 温度 - SFL 部件的内部温度(以百分之一摄氏度为单位)。

  • ASIC 温度 A - SFL 部件的 ASIC A 的内部温度(以百分之一摄氏度为单位)。

  • ASIC 温度 B - SFL 部件的 ASIC B 的内部温度(以百分之一摄氏度为单位)。

  • 电压 15 - 在 1.5 伏电源线路上检测到的电压数值(以百分之一伏特为单位)。

  • 电压 25 - 在 2.5 伏电源线路上检测到的电压数值(以百分之一伏特为单位)。

  • 电源电压 25 电源状态 - 2.5 伏电源的状态。请参见表 9-12

    表 9-12   电源电压 25 电源状态

    含义

    1

    未知

    2

    额定值

    3

    失败

  • 电压 33 - 在 3.3 伏电源线路上检测到的电压数值(以百分之一伏特为单位)。

  • 电压 50 - 在 5.0 伏电源线路上检测到的电压数值(以百分之一伏特为单位)。

  • 名称 - 支持交换机物理视图和逻辑视图的数据。

Paroli 部件数据

此表描述了每个 Paroli 的当前状况。

  • 编号 - 标识特定 Paroli 的整数 (0-7)。

  • 状况 -描述特定 Paroli 的当前状况。请参见表 9-13

    表 9-13   状况

    含义

    1

    未安装

    2

    开机自检失败

    3

    已禁用

    4

    等待运行

    5

    运行

    6

    测试中

    7

    关闭

  • 链接状况 - 每个链接的状况。如果看上去未安装任何卡,则状态为未安装。如果链接不活动,则状态为关闭。如果从链接的另一端检测到一个信号,并且该链接正在启动,则状态为查找。如果链接连通并且正在使用,则状态为使用中。只要链接状况查询过程中出现任何硬件故障,状态都为未安装。请参见表 9-14

    表 9-14   链接状况

    含义

    1

    未安装

    2

    关闭

    3

    查找

    4

    (未使用)

    5

    使用中

  • 端点 - 链接的远端的文字描述,一般包括互联体节点标识符的表达、远程链接编号和远程 Sun Fire 系统标识符。

  • 错误率 - 一个以逗号分隔的统计列表,以此来反映错误的累积速度。该字符串的格式为:

<短间隔中的错误数>,<长间隔中的错误数>,<短间隔中的最大错误数>,
<长间隔中的最大错误数>,<短间隔中的平均错误数>,<长间隔中的平均错误数>,<总错误数>。

“短间隔中的错误数”和“长间隔中的错误数”是发生在当前短间隔和长间隔(通常 1 小时和 24 小时)期间的错误数目,“总错误数”是自链接激活以来出现的错误总数,其余的值描述了发生在短间隔和长间隔期间的最大错误数和平均错误数。如果链接不活动,或者访问此数据时发生错误,字符串将被赋值为未知

  • 配置 - 保留作为内部使用。

  • 控制高 - 保留作为内部使用。

  • 控制低 - 保留作为内部使用。

  • 状态高 - 保留作为内部使用。

  • 状态低 - 保留作为内部使用。

  • 短间隔数 - 自链接激活以来所经过的短间隔的总数。

  • 每个短间隔的分钟数 - 一个短的错误监视间隔的长度,以分钟为单位。

  • 每个长间隔中的短间隔数 - 包含在一个用于错误监视的长间隔之中的短间隔数目。

  • 滚动平均数 - 用于计算链接错误率累积平均数的样本数目。

  • FRU 索引 - FRU 数据表中的一个索引,它提供了此部件的 FRU 信息。

  • 温度 - Paroli 模块中的温度(以百分之一摄氏度为单位)。

  • 电压 33 - 在 3.3 伏电源线路上检测到的电压数值(以百分之一伏特为单位)。

  • 电压 15 - 在 1.5 伏电源线路上检测到的电压数值(以百分之一伏特为单位)。

  • 细节 - 总是

  • LED - 一份 LED 的状况报告。请参见表 9-15

    表 9-15   LED

    含义

    1

    全灭

    2

    绿色,链接连通(激光器打开)

    3

    绿色,链接连通(错误状况)

    4

    全亮(激光器打开,并且处于错误状况)

  • 名称 - 支持交换机物理视图和逻辑视图的数据。

风扇部件数据

与安装在此交换机上的风扇部件有关的信息。

  • 插槽索引 - 标识特定风扇部件的整数。

  • 插槽状况 - 如果没有风扇插槽,则状态为未知。请参见表 9-16

    表 9-16   插槽状况

    含义

    1

    未知

    2

    额定值

    3

    失败

  • 速度 0 - 插槽中风扇 0 的转速(以 RPM 单位)。

  • 速度 1 - 插槽中风扇 1 的转速(以 RPM 单位)。

  • 速度 2 - 插槽中风扇 2 的转速(以 RPM 单位)。

  • 名称 - 支持物理视图和逻辑视图的数据。

电源部件数据

与安装在此交换机上的电源部件有关的信息。

  • 索引 - 标识特定电源部件的整数。

  • 状况 - 请参见表 9-17

    表 9-17   状况

    含义

    1

    未知

    2

    额定值

    3

    降级(接近故障)

    4

    失败

  • 名称 - 支持交换机物理视图和逻辑视图的数据。

FRU 数据

每个属于 FRU 的实体都具有一个指针,指向此表中的一行。此表包含所有的常用 FRU 数据字段。表格的每个元素都是含有 FRU 数据的其它表格中的一系列索引。索引值为 -1 说明对于给定的 FRU 不存在这类可用的数据。当一个 FRU 的一种类型有多个可用的 FRU 记录时,它们以连续的索引号出现在表格项中。每个索引栏都含有起始索引,每个记录数栏都含有记录的数目。最新的记录是索引号为 -1 的那条记录,例如“记录数” = -1。

  • FRU 索引 - 交换机机柜中该 FRU 的唯一索引。

  • 制造表索引 - FRU 制造数据表中的索引。

  • 安装表索引 - FRU 安装数据表中的索引。

  • 安装表记录数 - 此 FRU 的安装数据记录的数目。

  • 电源摘要表索引 - FRU 电源摘要数据表中的索引。

  • 电源事件表索引 - FRU 电源事件数据表中的索引。

  • 电源事件表记录数 - 此 FRU 的电源事件的记录数目。

  • 温度表索引 - FRU 温度数据表中的索引。

  • ECO 表索引 - FRU ECO 数据表中的索引。

  • 客户数据表索引 - FRU 客户数据表中的索引。

  • 激光器电源摘要表索引 - 激光器电源摘要数据表中的索引。

  • 激光器电源事件表索引 - 激光器事件摘要数据表中的索引。

  • 激光器电源事件表记录数 - 此 FRU 的激光器电源事件的记录数。

FRU 制造数据

  • 索引 - 唯一的整数标识符。

  • 供应商名 - 供应商名:JEDEC 标识符。

  • 位置 - 产地。

  • 日期 - 制造日期。

  • 部件号 - Sun 部件号。

  • 硬件抗震级别 - 初始硬件抗震级别。

  • 硬件修订级别 - 初始硬件修订级别。

  • 序列号 - Sun 序列号。

  • 缩写名 - 此 FRU 的缩写名。

  • 描述 - 对此 FRU 的描述。

FRU 安装数据

  • 索引 - 唯一的整数标识符。

  • 时间戳 - 记载该项记录最后一次更新的时间。

  • FRU 路径 - 在物理层面上,按分层结构描述 FRU 是如何连接到系统的。

  • 部件号 - 用于标识父级 FRU。

  • 序列号 - 用于标识父级 FRU。

  • 抗震级别 - 用于标识父级 FRU。

  • 系统ID - 系统的唯一的标识符。

  • 时区 - 系统时区。

  • 地理北方 - 可使用此系统的地理位置(北距)。

  • 地理东方 - 可使用此系统的地理位置(东距)。

  • 地理高度 - 可使用此系统的地理位置(海拔高度)。

  • 地理位置 - 系统所在的位置。

FRU 电源事件数据

  • 索引 - 唯一的整数标识符。

  • 时间戳 - 记载该项记录最后一次更新的时间。

  • 事件- 请参见表 9-18

    表 9-18   事件

    含义

    1

    电源接通

    2

    仍然通电

    3

    电源关闭

FRU 电源摘要数据

  • 索引 - 唯一的整数标识符。

  • 时间戳 - 记载该项记录最后一次更新的时间。

  • 总运行时间 - FRU 接通电源以来所运行的总时间,以分钟计。

  • 总电源接通次数 - 接通 FRU 电源的次数。

  • 总电源断开次数 - 断开 FRU 电源的次数。

FRU 温度数据

  • 索引 - 唯一的整数标识符。

  • 时间戳 - 记载该项记录最后一次更新的时间。

  • 传感器 - 总是 0(零),(以序数值)说明板上的单一温度传感器。

  • 最低 - FRU 曾经运行的最低环境温度。

  • 最高 - FRU 曾经运行的最高环境温度。

  • 最新 - FRU 最近一次运行时的温度。

  • 频布图 - 这是一个 10 位整数编码的字符串,数值间以逗号作为分隔。每一个值都记录着在某特定温度范围运行的小时数。第一个元素记录 20 摄氏度以下的小时数;其后的 8 个记录,依次以 10 摄氏度的范围递增;最后一个元素记录超过 100 摄氏度的小时数。

FRU ECO 数据

  • 索引 - 唯一的整数标识符。

  • 时间戳 - 记载该项记录最后一次更新的时间。

  • 固件版本 - 记录影响固件版本的 ECO 更改。

  • 硬件版本 - 记录影响版本号的 ECO 更改。

  • 固件抗震级别 - 记录自首次建立后,来自 ECO 的抗震级别更改。

FRU 客户数据

  • 索引 - 唯一的整数标识符。

  • 时间戳 - 记载该项记录最后一次更新的时间。

  • 数据 - 客户定义的数据

FRU 激光器电源摘要数据

  • 索引 - 唯一的整数标识符。

  • 时间戳 - 记载该项记录最后一次更新的时间。

  • 总运行时间 - 激光器接通电源以来所运行的总时间,以分钟计。

  • 总电源接通次数 - 接通激光器电源的次数。

  • 总电源断开次数 - 断开激光器电源的次数。

FRU 激光器电源事件数据

  • 索引 - 唯一的整数标识符。

  • 时间戳 - 记载该项记录最后一次更新的时间。

  • 事件- 请参见表 9-19

    表 9-19   事件

    含义

    1

    电源接通

    2

    仍然通电

    3

    电源关闭

SFL 交换机事件

Sun Management Center 控制台显示多个附加的、交换机产生的陷阱事件。这些事件有:

  • SFL 交换机开机 - SSC 重新开机。

  • SFL 交换机可用 - POST 检测运行结束后发送。

  • SFL 交换机重新引导 - 交换机重新引导前发送。

  • SFLX 关闭 - 当环境因素导致交换机断电时发送。操作员应迅速切断机柜的电源,以避免损失。

  • 自检结果更改 - 当 POST 结果表明有更改时发送。Sun Management Center 代理作出如下响应:刷新交换机数据、检查报警条件和生成警报(如有必要)。

  • 环境状态更改 - 当环境传感器状态更改(例如,从“正常”改为“警告”)时发送。Sun Management Center 代理作出如下响应:刷新交换机数据、检查报警条件和生成警报(如有必要)。

  • Paroli 错误率状态更改 - 当某特定链接上出现的错误数超出警告阈值或关闭限定阈值时发送。Sun Management Center 代理作出如下响应:刷新交换机数据、检查报警条件和生成警报(如有必要)。

  • Paroli 环境关闭 - 当某链接因环境传感器检测到的条件而关闭时发送。

  • Paroli 错误率关闭 - 当某链接因高错误率而关闭时发送。

  • NVRAM 备用电池电量过低 - 当系统控制器的 NVRAM 备用电池电压等级过低时发送。

  • SNMP 团体字符串更改 - 当交换机上 SNMP 团体字符串发生更改时发送。要始终保持 SNMP 通讯顺畅,就必须运行 es-setup,以删除正监视此交换机的交换机代理模块的实例。然后再次运行 es-setup,以创建该模块的一个用于监视此交换机的新实例,并根据提示指定新的 SNMP 团体字符串。

  • 日志主机更改 - 当提供交换机事件和错误的次级日志的主机名称发生更改时发送。这并不影响同步。

  • SNMP 陷阱主机更改 - 当交换机上 SNMP 陷阱主机的名称更改时发送。这是一个紧急错误,它会阻止所有交换机陷阱到达 Sun Management Center 代理。交换机中指定的 SNMP 陷阱主机的名称,必须与为监视该交换机的 Sun Management Center 代理所指定的 Sun Management Center 服务器的名称相匹配。

注意:要纠正此错误,应运行 es-setup 并更改与该代理相关的 Sun Management Center 服务器的名称 这可通过运行 es-setup 中针对整个代理进行设置的那一部分来完成。不必运行 es-setup 中专门针对交换机代理模块的实例进行设置的那一部分。

  • 板插入 - 在交换机机柜中添加板时或通过 CLI 启用板时发送。 Sun Management Center 中相应的交换机数据随之刷新。

  • 板拆除 - 从交换机机柜中拆除板时或通过 CLI 禁用板时发送。 Sun Management Center 中相应的交换机数据随之刷新。


监视交换机警报

我们将某些交换机特性配置为产生警报。表 9-20 列出了这些特性及其警报级别。从中还可找到触发各种警报级别的值。

表 9-20   交换机警报

表格:特性

日志中的字符串

信息

警告

错误

注释

插槽:测试状态

slotTestStatus

已通过测试


失败


插槽:状态

slotStatus


超警告下限(黄色)/超警告上限(黄色)

超下限(红色)/超上限(红色)

与 slotSensor 有关

控制器:软件版本

controllerSwVersion


如果不同于当前固件版本 (1.12.13)


这样可保证交换机固件与 WCI 交换机模块之间的一致性。

控制器:电压 33

controllerVolt33


<96%, >104%

<90%, >110%

相对于 3.3 伏期望电压值的百分数。报告时以百分之一伏为单位。

控制器:电压 50

controllerVolt50


<96%, >104%

<90%, >110%

相对于 5.0 伏期望电压值的百分数。报告时以百分之一伏为单位。

控制器:电压 120

controllerVolt120


<96%, >104%

<90%, >110%

相对于 12.0 伏期望电压值的百分数。报告时以百分之一伏为单位。

控制器:温度

controllerTemp


>65 C

>75 C

报告时以百分之一摄氏度为单位。

控制器:Nvram 备用
电池

controllerNvramBackupBattery


未知

电量低

永远不应为未知

SFL Unit:状况

wciState

(4) 反射
模式

(2)

未经测试

(5) 失败


SFL 部件:温度

wciTemp


>65 C

>75 C

报告时以百分之一摄氏度为单位。

SFL 部件:ASIC 温度 A

wciASICTempA


>95 C

>105 C

报告时以百分之一摄氏度为单位。

SFL 部件:ASIC 温度 B

wciASICTempB


>95 C

>105 C

报告时以百分之一摄氏度为单位。

SFL 部件:电压 15

wciVolt15


<96%, >104%

<90%, >110%

相对于 1.5 伏期望电压值的百分数。报告时以百分之一伏为单位。

SFL 部件:电压 25

wciVolt25


<96%, >104%

<90%, >110%

相对于 2.5 伏期望电压值的百分数。报告时以百分之一伏为单位。

SFL 部件:电源电压 25 状态

wciPSVolt25Status



失败


SFL 部件:电压 33

wciVolt33


<96%, >104%

<90%, >110%

相对于 3.3 伏期望电压值的百分数。报告时以百分之一伏为单位。

SFL 部件:电压 50

wciVolt50


<96%, >104%

<90%, >110%

相对于 5.0 伏期望电压值的百分数。报告时以百分之一伏为单位。

Paroli:状况

paroliState



开机自检失败


Paroli:错误率

paroliErrorRate





Paroli:温度

paroliTemp


>65 C

>75 C

报告时以百分之一摄氏度为单位。

Paroli:电压 33

paroliVolt33


<96%, >104%

<90%, >110%

相对于 3.3 伏期望电压值的百分数。报告时以百分之一伏为单位。

Paroli:电压 15

paroliVolt15


<96%, >104%

<90%, >110%

相对于 1.5 伏期望电压值的百分数。报告时以百分之一伏为单位。

风扇:插槽状况

fanTrayState


未知

失败

应与如下条件有关。

风扇:速度 0

fanSpeed0


<75%

>250%

<70%

>300%


风扇:速度 1

fanSpeed1


<75%

>250%

<70%

>300%


风扇:速度 2

fanSpeed2


<75%

>250%

<70%

>300%


电源:状况

powerSupplyState


降级

失败



监视交换机陷阱

Sun Fire Link 软件利用产生的陷阱来跟踪系统的可用性。所有陷阱均会被记录下来。但是并非所有陷阱都直接产生警报。某些陷阱会导致数据表格的刷新。那些表格的数据刷新动作即会触发警报。表 9-21 列出了交换机陷阱。

表 9-21   交换机陷阱

表格:特性

日志中的陷阱字符串

信息

警告

错误

注释

SFL 交换机事件:开机开机

availabilityOn





SFL 交换机事件: 可用

availabilityAvail





SFL 交换机事件: 重新引导

availabilityReboot


已接收



SFL 交换机事件: 关机

availabilityWcxShutdown



已接收


SFL 交换机事件:
自检结果已更改

postResultChanged





SFL 交换机事件: 环境因素更改

environmentalStatusChanged





SFL 交换机事件: Paroli 错误率状况更改

paroliErrorRateStatusChanged



已接收


SFL 交换机事件: Paroli 受环境条件影响而关机

paroliEnviromentalShutdown



已接收


SFL 交换机事件: Paroli 受错误率影响而关机

paroliErrorRateShutdown



已接收


SFL 交换机事件: NVRAM 备用电池电量过低

nvramBackupBatteryLow





SFL 交换机事件: 团体更改

communityChange



已接收

虽称不上是错误,但需要马上采取矫正操作,以保持对交换机的连续监视

SFL 交换机事件: 日志主机更改

logHostChange

已接收




SFL 交换机事件: 陷阱主机更改

trapHostChange



已接收

虽称不上是错误,但需要马上采取矫正操作,以保持对交换机的连续监视

SFL 交换机事件: 板加入

boardArrival





SFL 交换机事件: 板移除

boardDeparture






矫正操作

表 9-22表 9-23 收录了每个警报或陷阱产生的原因以及所需采取的矫正操作。每个警报或陷阱所产生的消息说明了导致该警报或陷阱的原因。

表 9-22   警报原因及矫正操作

表格:特性

日志中的警报字符串

原因

操作 / 注释

插槽:测试状态

slotTestStatus

开机自检失败

请查看系统日志中的诊断信息 / 更换 FRU

插槽:状态

slotStatus

环境条件

观察环境传感器字段。可能需要切断此交换机的电源

控制器:软件版本

controllerSwVersion

交换机固件版本与 WCI 交换机模块所期望的不匹配

验证版本是否可接受,并编缉 Sun Management Center 控制台中的警报属性

控制器:电压 33

controllerVolt33

板故障 / 电源

如果只有一块板受到影响,将其更换即可。如果影响到多块板,则有必要更换电源或背板。

控制器:电压 50

controllerVolt50

"

"

控制器:电压 120

controllerVolt120

"

"

控制器:温度

controllerTemp

过热条件

切断交换机电源 / 更换有故障的 SSC

控制器:Nvram 备用电池

controllerNvramBackupBattery

NVRAM 电池电量过低

安装替代电池 / 交换 SSC

SFL 部件:状况

wciState

过热条件 / 电压不匹配 / JPOST 故障 / sunvts 在使用

核查 Sun Management Center 控制台中的环境数据 / 核查错误日志 / 检查 JPOST 结果

SFL 部件:温度

wciTemp

过热条件

切断交换机电源 / 更换有故障的 WCIX 模块

SFL 部件:ASIC 温度 A

wciASICTempA

过热条件

切断交换机电源 / 更换有故障的 WCIX 模块

SFL 部件:ASIC 温度 B

wciASICTempB

过热条件

切断交换机电源 / 更换有故障的 WCIX 模块

SFL 部件:电压 15

wciVolt15

板故障 / 电源

若只影响到一块板,将其更换即可。若影响到多块板,则需更换电源 / 背板。

SFL 部件:电压 25

wciVolt25

板故障 / 电源

若只影响到一块板,将其更换即可。若影响到多块板,则需更换电源 / 背板。

SFL 部件:电源电压 25 状态

wciPSVolt25Status

WCIX 模块的直流-直流转换器发生故障(或由于极差的环境条件,软件关闭了电源)

切断交换机电源 / 更换有故障的 WCIX 模块

SFL 部件:电压 33

wciVolt33

板故障 / 电源

若只影响到一块板,将其更换即可。若影响到多块板,则需更换电源 / 背板。

SFL 部件:电压 50

wciVolt50

板故障 / 电源

若只影响到一块板,将其更换即可。若影响到多块板,则需更换电源 / 背板。

Paroli:状况

paroliState

开机自检失败

请查看系统日志中的诊断信息 / 更换 FRU

Paroli:链接状况

paroliLinkState



Paroli:错误率

paroliErrorRate



Paroli:温度

paroliTemp

过热条件

切断交换机电源 / 更换有故障的 Paroli 模块

Paroli:电压 33

paroliVolt33

板故障 / 电源

若只影响到一块板,将其更换即可。若影响到多块板,则需更换电源 / 背板。

Paroli:电压 15

paroliVolt15

板故障 / 电源

若只影响到一块板,将其更换即可。若影响到多块板,则需更换电源 / 背板。

风扇:插槽状况

fanTrayState

失败:风扇插槽发生故障

未知:找不到风扇插槽,或风扇插槽有故障

更换风扇插槽

风扇:速度 0

fanSpeed0

风扇插槽有故障

更换风扇插槽

风扇:速度 1

fanSpeed1

风扇插槽有故障

更换风扇插槽

风扇:速度 2

fanSpeed2

风扇插槽有故障

更换风扇插槽

电源:状况

powerSupplyState

电源有故障

更换电源

表 9-23   陷阱原因及矫正操作

陷阱

日志中的陷阱字符串

原因

操作 / 注释

SFL 交换机事件:开机

availabilityOn

交换机已引导且网络适配器已初始化


SFL 交换机事件:可用

availabilityAvail

引导期间全部设备均完成了开机自检。


SFL 交换机事件:重新引导

availabilityReboot

准备重新引导


SFL 交换机事件: 关机

availabilityWcxShutdown

导致关机的环境
条件。

切断交换机电源

SFL 交换机事件: 自检结果更改

postResultChanged

它的发送表明自检结果有更改之处。如果发送了错误级别的警报,则表明开机自检出现故障。

查阅系统日志中的诊断信息。如有必要,请更换 FRU。

SFL 交换机事件: 环境因素更改

environmentalStatusChanged

当环境传感器状态更改(例如,从“正常”改为“警告”)时发送。

设法确定是什么引起了陷阱。可能需要切断此交换机的电源。

SFL 交换机事件: Paroli 错误率状况更改

paroliErrorRateStatusChanged

当某特定链接上出现的错误数超出警告阈值或关闭限定阈值时发送。


SFL 交换机事件: Paroli 受环境条件影响而关机

paroliEnviromentalShutdown

当某链接因环境传感器检测到的条件而关闭时发送。

关闭了激光器。若此情况持续存在或者恶化,则有必要切断交换机电源。

SFL 交换机事件: Paroli 受错误率影响而关机

paroliErrorRateShutdown

当某链接因高错误率而关闭时发送。


SFL 交换机事件(控制器):nvram 备用电池电量过低

nvramBackupBatteryLow

系统控制器 NVRAM 电池电量过低。

更换 SSC 的 NVRAM 芯片上的电池。如果断开 SSC 的电源,NVRAM 的内容将丢失。对于这种情况,必须设法恢复其配置。

SFL 交换机事件: SNMP 团体字符串更改

communityChange

当交换机上 SNMP 团体字符串发生更改时发送。

要始终保持 SNMP 通讯顺畅,就必须运行 es-setup,以删除正监视此交换机的交换机代理模块的实例。然后再次运行
es-setup,以创建该模块的一个用于监视此交换机的新实例,并根据提示指定新的 SNMP 团体字符串。

SFL 交换机事件: 日志主机更改

logHostChange

当提供交换机事件和错误的次级日志的主机名称发生更改时发送。这不会影响 Sun Management Center 软件。

这些是交换机日志,而不是由 WCI 交换机模块产生的事件日志。

SFL 交换机事件: SNMP 陷阱主机更改

trapHostChange

当交换机上 SNMP 陷阱主机的名称更改时发送。

这是一个紧急错误,它会阻止所有交换机陷阱到达 Sun Management Center 代理。交换机中指定的 SNMP 陷阱主机的名称,必须与为监视该交换机的 Sun Management Center 代理所指定的 Sun Management Center 服务器的名称相匹配。
注意:要纠正此错误,应运行
es-setup,并更
改与该代理相关的 Sun Management Center 服务器的
名称。

SFL 交换机事件: 板插入

boardArrival

插入了板或用 CLI 命令启用了板


SFL 交换机事件: 板移除

boardDeparture

拆除了板或用 CLI 命令禁用了板