Oracle® x86 服务器诊断、应用程序和实用程序指南

退出打印视图

更新时间: 2014 年 4 月
 
 

服务器验证和故障排除方案

在新安装服务器、升级或改装服务器以及服务器出现故障时,可使用诊断测试检验服务器的运行。以下几部分列出了常用测试方案:

新服务器

在安装任何选件之前,运行以下诊断测试:

  • U-Boot

  • Pc-Check 或 UEFIdiag

  • HWdiag

测试失败:如果测试识别出服务器存在故障:

  • 检查产品或选件的产品说明或发行说明中是否存在可能导致诊断测试失败的已知状况。

  • 如果查阅产品说明或发行说明未能解决问题,可以认为服务器在运输期间受损。终止安装过程,通知 Oracle 服务人员。这可以确保服务器处于保修范围内。

如果在服务器首次投入使用后出现网络连接问题,请确保已激活了服务器的网络访问点。


注 -  并非所有的 U-Boot 和 Pc-Check/UEFIdiag 测试都适用于所有服务器。

测试通过:如果服务器通过测试且没有要安装的选件,可使服务器投入使用。

如果服务器通过测试,但有要安装的选件,请安装选件,然后重新运行测试。

  • 如果服务器安装选件后通过测试,可使其投入使用。

  • 如果诊断测试指示所安装的选件存在故障,请拆下故障选件,将其退回以进行更换。

升级已投入使用的服务器

在安装服务器升级组件(内存、硬盘驱动器、I/O 卡或电源)之前,请停止使用服务器并运行诊断测试:

  1. 停止使用服务器。

  2. 运行 U-Boot 诊断测试。

  3. 运行 Pc-Check、UEFIdiag 或 HWdiag 诊断测试。

  4. 安装服务器升级组件。

  5. 再次运行 U-Boot、HWdiag 及 Pc-Check 或 UEFIdiag 诊断测试。

测试失败:如果诊断测试失败,则说明安装的某个选件存在故障,或者服务器在安装选件时损坏。无论是哪一种情况,请移除并更换故障组件,再次运行诊断测试确认问题已解决,然后再将服务器投入使用。

测试通过:将服务器投入使用。


注 -  如果故障组件是服务器主板上不可更换的组件,可将主板退回给 Oracle 进行维修,或者订购用于更换的主板并由授权的服务人员现场进行更换。

现有服务器上的新问题

服务器无故障运行了很长时间,但服务器前面板上的“需要维修操作”LED 指示灯亮起。

执行以下操作:

  1. 打开服务器机盖前,请检查服务器和 Oracle ILOM 服务处理器 (service processor, SP) 的日志文件,以确定是否有明显的故障消息,并检查是否有任何表示故障的 LED 指示灯亮起。有关详细信息,请参阅服务文档。

  2. 检查服务器的内部组件,以确认是否存在明显问题(如烧毁的组件或任何妨碍服务器组件正常冷却的情况)。

  3. 如果目视检查无法找出有故障的组件,请依次运行 U-Boot 测试和 Pc-Check 或 UEFIdiag 诊断测试来找出故障组件。

  4. 如果测试没有发现有故障的组件,请运行 SunVTS。

  5. 如果故障组件是客户可更换单元 (customer-replaceable unit, CRU),请更换该单元。服务手册、系统手册和 My Oracle Support 中定义了每种型号的 CRU。

  6. 如果故障组件是现场可更换单元 (field-replaceable unit, FRU),请向 Oracle 服务人员发出服务请求。服务手册中定义了特定服务器型号的 FRU。


注 -  如果故障组件是服务器主板上不可更换的组件,可将主板退回给 Oracle 进行维修,或者订购用于更换的主板并由授权的服务人员现场进行更换。