Oracle® X5 系列服务器管理指南

退出打印视图

更新时间: 2015 年 7 月
 
 

故障检测和诊断概述

服务器支持多个故障检测和诊断工具。故障检测工具(如 Oracle ILOM Fault Manager)可以自动轮询系统以检测硬件故障和不利环境条件。诊断工具(如 Oracle VTS)必须手动运行,它们可以帮助您对服务器问题进行故障排除。下表概述了服务器支持的故障检测和诊断工具。

工具
说明
文档
Oracle ILOM Fault Manager
Oracle ILOM Fault Manager 属于服务器服务处理器 (Service Processor, SP) 上嵌入的 Oracle ILOM 固件的一部分。Fault Manager 会自动检测服务器上的系统硬件故障和环境状况。如果在服务器上出现问题,则 Oracle ILOM 会在 "Open Problems" 表中标识该问题,并在事件日志中记录有关故障的信息。
请参阅《Oracle ILOM 系统监视和诊断用户指南(固件发行版 3.2.x)》中的“防止硬件故障:Oracle ILOM Fault Manager”,网址为:
Oracle Linux Fault Management Architecture (FMA)
可通过 Oracle Hardware Management Pack 将 Oracle Linux FMA 软件安装在服务器上(可选)。Oracle Linux FMA 可用于管理在操作系统 (OS) 级别检测到的故障,与在 Oracle ILOM 中管理故障的方式大致相同。来自 Linux FMA 的故障诊断消息将保留在与 Oracle ILOM 共享的故障管理数据库中。
请参阅《Oracle Linux Fault Management Architecture User's Guide》,网址为:
Oracle Solaris Fault Management Architecture (FMA)
Oracle Solaris FMA 随附在 Oracle Solaris 操作系统 (OS) 中。故障管理器接收与硬件和软件错误相关的数据,自动诊断底层问题,并通过尝试让故障组件脱机来进行响应。
请参阅《Oracle Solaris 管理:常见任务》,网址为:
自动服务请求 (Auto Service Request, ASR)
ASR 是针对 Oracle 硬件的一个可选支持服务。ASR 从数据中心支持 ASR 的系统上的遥测来源(如 Oracle ILOM)中收集硬件遥测数据。ASR 过滤此遥测数据并将它确定的潜在故障直接转发到 Oracle,然后自动发起服务请求。可以从 Oracle ILOM 配置 ASR 服务的功能。
转到:
U-Boot 诊断
U-Boot 会自动测试基本硬件功能,以确保有足够的功能来引导 SP。
要启动 U-Boot 诊断,请重新启动服务器并在提示时按 "e"、"q" 或 "n" 以启动相应的诊断测试。
请参阅《Oracle x86 服务器诊断、应用程序和实用程序指南(适用于支持 Oracle ILOM 3.1 和 Oracle ILOM 3.2.x 的服务器)》中的“U-Boot 诊断”部分,网址为:
服务处理器 "Preboot" 菜单
服务处理器 "Preboot" 菜单使您能够更改在引导服务处理器 (Service Processor, SP) 后无法更改的 SP 设置。例如,"Preboot" 菜单使您能够将 Oracle ILOM root 密码重置为出厂默认值,恢复对串行端口的 Oracle ILOM 访问以及更新 SP 固件。
要启动 "Preboot" 菜单,必须复位 SP 并中断引导过程。在本地,可以通过在复位 SP 期间按住服务器上的定位按钮执行此操作。在远程,可以通过在引导过程的暂停期间键入 xyzzy 执行此操作。
请参阅《Oracle x86 服务器诊断、应用程序和实用程序指南(适用于支持 Oracle ILOM 3.1 和 Oracle ILOM 3.2.x 的服务器)》中的“Oracle ILOM "Preboot" 菜单”部分,网址为:
BIOS POST
系统启动时,系统 BIOS 会执行开机自检 (power-on self-test, POST),检查服务器上的硬件,以确保所有组件都已具备并正常运行。它会在系统控制台上显示此测试的结果。
要启动开机自检并查看测试输出,请将服务器电源复位。
请参阅《Oracle x86 服务器诊断、应用程序和实用程序指南(适用于支持 Oracle ILOM 3.1 和 Oracle ILOM 3.2.x 的服务器)》中的 "BIOS POST" 部分,网址为:
Oracle VTS
Oracle VTS 是一个综合性的诊断工具,可用于验证大多数硬件控制器和设备的连通性和功能。Oracle VTS 是用于诊断 I/O 和主机总线适配器 (host bus adapter, HBA) 问题的首选测试。
可以在运行 Oracle Solaris 操作系统的系统上启动 Oracle VTS。或者,可以将 Oracle VTS ISO 映像下载到您的 Oracle 服务器或 CD/DVD,然后使用 Oracle ILOM 重定向引导该映像。
请参阅《Oracle x86 服务器诊断、应用程序和实用程序指南(适用于支持 Oracle ILOM 3.1 和 Oracle ILOM 3.2.x 的服务器)》中的 "Oracle VTS" 部分,网址为:
UEFI Diagnostics
UEFI Diagnostics 是一组诊断测试,可检测主板组件、驱动器、端口和插槽的问题。
可从 Oracle Integrated Lights Out Manager (ILOM) Web 界面或命令行界面 (Command-Line Interface, CLI) 启动这些测试:
Web:
  1. 导航到 "Host Management" > "Diagnostics" 页面。

  2. 在 "Mode" 下拉式列表中,选择要运行的诊断级别("Enabled"、"Disabled"、"Extended" 或 "Manual")。

  3. 单击 "Start Diagnostics"。

CLI:
  • 发出以下命令来指定诊断模式:

    set /HOST/diag mode=[enabled|disabled|extended| manual]

  • 发出以下命令以启动诊断:

    start /HOST/diag

请参阅以下资源之一: