14 故障排除

另请参见

基本故障排除

在运行诊断测试或与 Oracle 技术支持联系之前,请查看以下故障排除提示。

“需要维修”(琥珀色)LED 指示灯持续亮起

使用 SLC 检查磁带库以及连接的设备(磁带机、CAP 和机械手)的运行状况。请参见查看磁带库和设备信息

要执行运行状况检查,请执行以下操作:

  1. 登录到 SLC。

  2. 访问 "System Detail" 模块,Tools > System Detail

  3. 在导航树中检查以下指示器:"Device Healthy" 或 "Device Error"

其他检查:

  1. 检查 "Status"(例如,联机/脱机)选项卡和 "Statistics"(例如,正常运行时间、停机时间、错误和警告)选项卡,以了解有关磁带库和设备运行状况的更多信息。

  2. 确保磁带已在其存储插槽中完全就位并且朝向正确。

  3. 对照 X 表检查是否存在任何外部物品或碎片,并将其移除(如果有)。

“CAP 打开”LED 指示灯亮起并闪烁

打开 CAP 并确保磁带正确安放。关闭 CAP。

SLC 不显示修改过的数据,即信息保持不变

检查 SLC 心跳图标。

“机械手故障”或“磁带库故障”琥珀色 LED 指示灯持续亮起
  1. 检查 SLC 是否显示了任何错误消息。写下报告的错误消息。

  2. 打开前门。观察并记下磁带、机械手和磁带机的状态。

  3. 确保磁带已在其存储插槽中完全就位并且朝向正确。

  4. 确保已拆除包装材料。

  5. 检查磁带库基底是否存在任何物品或碎屑。如果存在,请将其清除。

  6. 检查磁带机的状态。

  7. 关闭前门。

  8. 在磁带机托盘背面推拉,确保磁带机已完全就位并向前锁定。如果托盘可以移动,则表明需要对其重新定位和锁定。

客户机无法与磁带库或磁带机通信

确保电缆已安全连接到磁带库背面、磁带机和客户机上的相应连接器。

磁带库无法与磁带机通信,SLC 上的磁带机状态显示 "Not communicating"

确保电缆已安全连接到磁带库背面、磁带机和客户机上的相应连接器。

磁带机清洗或清洗消息重复或过多
  1. 将清洗磁带更换为新的清洗磁带。

  2. 运行磁带库自检,并注意是否报告了磁带机的错误。

  3. 运行任何基于客户机的磁带机诊断测试。

运行磁带库自检

使用磁带库自检帮助诊断问题。磁带库自检可以是非中断性的(磁带返回至其原始位置),也可以是中断性的(磁带可能放置在新位置)。

注:

执行中断性自检之前,磁带库必须脱机(请参见 使磁带库脱机)。
  1. 确保磁带库中有合适的磁带机诊断磁带(请参见导入或导出诊断磁带或清洗磁带)。

  2. 在 SLC 中,选择 Tools > Diagnostics,然后单击 Library 文件夹。

  3. 单击 SelfTest 选项卡。

  4. 在 "Mode" 列表中,选择自检类型:

    • Non-Disruptive-测试中使用的所有磁带均将返回到其原始位置

    • Disruptive-磁带可能会返回到新位置。磁带库必须与所有主机脱机,才能运行此自检。

  5. 单击 Run。测试完成时会显示测试结果。

  6. 对于中断性测试,将磁带库联机后可恢复正常操作。

自检期间磁带库检查的内容:

  • 验证磁带库控制器、磁带机、升降装置以及机械手之间的通信路径。

  • 执行获取和放置操作以检查机械手、升降装置和 CAP 的运行状况。其中包括从保留的系统插槽到随机的空存储插槽或 CAP 插槽的获取和放置操作。

  • 执行全面的磁带库审计。

  • 针对磁带库中安装的所有磁带机,执行诊断磁带的挂载和卸载。除非系统插槽中有诊断磁带,否则不会开始自检。如果系统找到了兼容的诊断磁带,则将针对每种磁带机类型重复自检。如果系统未找到用于某种磁带机类型的诊断磁带,则将跳过该磁带机的挂载/卸载操作。

运行设备自检

使用设备自检帮助诊断问题。可以对 CAP、机械手或磁带机执行自检。

注:

对批量 CAP 运行自检需要手动打开和关闭 CAP 门。

对所有 CAP 运行自检(仅限批量 CAP)

  1. 在 SLC 中,选择 Tools >Diagnostics,然后选择 CAP 文件夹。

  2. 在 "Mode" 列表中,选择 Non-Disruptive(中断性自检需要使磁带库与所有主机脱机)。

  3. 单击 Run

  4. 根据指示打开并关闭 CAP 门。测试完成后会显示一条消息。

针对单个设备运行自检

  1. 在 SLC 中,选择 Tools >Diagnostics

  2. 展开设备树中的设备文件夹(CAP、机械手、磁带机、PTP 或升降装置)。选择设备。

    注:

    要执行机械手自检,磁带库中必须有诊断磁带可用(请参见导入或导出诊断磁带或清洗磁带)。
  3. 在 "Mode" 列表中,选择 Non-Disruptive

  4. 单击 Run。测试完成后会显示一条消息。

诊断机械手问题

诊断移动可以通过发出一系列“获取”和“放置”操作来帮助监视或诊断机械手问题。系统根据设置的最小和最大目标和池地址范围选择诊断移动的机械手。如果地址范围需要,可选择多个机械手。

成功的诊断移动不会重新排列磁带库中的磁带,系统会将磁带返回到其原始位置。但是,有些诊断移动失败可能会导致将盒式磁带留在新位置中。

定义诊断移动

注:

诊断移动要求共享机械手资源。活动高峰期间不应运行诊断移动。

可以设置多个诊断移动例程并同时运行这些例程,只要每个诊断移动的目标范围和池范围不重叠即可。

  1. 在 SLC 中,选择 Tools > Diagnostics。选择设备树中的 Library

  2. 单击 DiagMove 选项卡,然后单击 Manage 选项卡。

  3. 在 "Defined Sequence" 部分中,单击 Add

  4. 定义目标地址范围(用于“获取”操作的区域)。

    1. 选择插槽类型。

    2. 选择范围的开始位置和结束位置。

  5. 单击 Next

  6. 定义源地址范围(用于在目标地址不包含磁带或无可用的空插槽时提供磁带或空插槽的区域)。

    1. 选择插槽类型。

    2. 选择开始位置和结束位置。

  7. 单击 Next

  8. 为移动命名并指定移动数(介于 1 和 5000 之间)。

  9. 选择访问顺序和移动类型,并启用/禁用移动前的兼容性检查(有关详细信息,请参见下文)。

  10. 单击 Finish。新的诊断序列列在 "Defined Sequences" 部分中。请参见启动诊断移动

诊断移动要定义以下项目:

  • Target Address Range-定义用于在诊断移动中执行“获取”操作的区域。有效的目标地址类型为存储插槽、CAP、磁带机和存储插槽、系统插槽或全部。

    注:

    目标地址范围中的所有资源都会保留。但是,只有当前机械手为获取/放置操作而访问的位置对主机不可用。
  • Pool Address Range-定义用于在目标地址不包含磁带或无空插槽可用时提供磁带或空插槽的区域。池和目标地址可以重叠。

  • Access Order-确定机械手在目标地址范围内执行“获取”操作的方式。有两个选项:

    • Sequential-机械手从目标地址范围中的第一个位置开始执行获取操作。机械手会继续按顺序访问该范围内的位置,直到完成请求的移动次数为止。

    • Random-机械手随机选择目标地址范围中的某个位置来获取磁带。机械手还可以多次访问目标地址范围内的同一地址获取磁带;但是,如果指定了足够的移动请求次数,则可保证机械手访问所有插槽。随机访问例程会在完成请求的移动次数之后结束。

启动诊断移动

注:

可以同时运行多个移动,只要用于移动的目标地址范围和池地址范围不重叠即可。

在开始诊断移动之前,必须定义移动(请参见定义诊断移动)。

  1. 在 SLC 中,选择 Tools > Diagnostics。选择设备树中的 Library

  2. 单击 DiagMove 选项卡,然后单击 Manage 选项卡。

  3. 在 "Defined Sequences" 部分中,选择一个诊断移动。单击 Open

  4. 选择 File > Start Sequence

保存诊断移动

可以将定义的诊断移动保存到文件中,并使用该文件恢复已从磁带库中删除的移动或将其复制到其他磁带库。

  1. 在 SLC 中,选择 Tools > Diagnostics。选择设备树中的 Library

  2. 单击 DiagMove 选项卡,然后单击 Manage 选项卡。

  3. 在 "Defined Sequence" 部分中,选择诊断移动,然后单击 SLC 屏幕顶部的 Save

监视和控制打开的诊断移动

要启动诊断移动,请参见启动诊断移动

  1. 在 SLC 中,选择 Tools > Diagnostics。选择设备树中的 Library

  2. 单击 DiagMove 选项卡,然后单击 Monitor 选项卡。

  3. 每个监视器窗口均指示相应移动的状态:

    状态指示器
    有效值
    Spooling Status-指示是否正将移动输出保存到文件 True、False
    State-移动的执行状态 Running、pausing、paused、stopping、stopped
    Health-移动的运行状态 OK、warning、error
    Completed moves-已完成的移动数 数量

  4. 使用每个 Monitor 窗口中的 File 菜单可启动/停止/暂停序列、清除输出窗口或者启动/停止假脱机。

确定控制器卡的状态

控制器卡状态由卡上的 LED 指示灯进行指示并显示在 SLC 中(请参见查看设备状态和属性)。可以使用卡的状态解决磁带库的问题。

这些 LED 指示灯及其含义在两种卡类型(HBC 和 HBT)上是一样的。

控制器卡 LED 指示灯 定义
活动-绿色 卡正在作为活动控制器运行并运行活动代码。
备用-琥珀色 卡正在作为备用控制器运行并运行备用代码。
故障-红色 卡遇到严重错误。
弹出正常-蓝色 技术支持代表可以安全地启动卡弹出。

清除磁带库状态警报

只能清除标记为 "Clearable" 的警报,并且只能在磁带库上有活动服务时清除。

清除警报只是将其从 Status Module 显示中删除,并没有从根源上解决问题。如果没有其他设备或状态警报,磁带库运行状态指示器将恢复 "Normal"。如果警报是定期更新引起的,则会在下一个更新周期重新出现。

  1. 在 SLC 中,选择 Tools > System Detail,并单击 Library 文件夹。

  2. 单击 Status 选项卡,然后单击 Status Module 选项卡。

  3. 在 "Clear Alert Number" 列表上,选择要清除的警报编号,然后单击 Apply

使用 SLC 启动手动 RE 切换

注:

您还可以使用主机软件或 CLI 启动手动 RE 切换(请参见启动手动故障转移的方法)。

此过程在本地操作面板上不可用。

  1. 验证卡的设备状态是否指示 "switch is possible"(请参见查看设备状态和属性)。

  2. 在 SLC 中,选择 Tools > Diagnostics

  3. 选择 Redundant Electronics 文件夹

  4. 单击 Apply 开始切换过程。如果备用磁带库和磁带机控制器卡有问题,则无法继续切换。

  5. 如果没有错误,请单击 Yes

  6. 单击 OK 注销 SLC。

  7. 等待切换完成,然后重新登录到磁带库。必须指定新活动控制器的 IP 地址或 DNS 别名。

校准触摸屏

出厂之前会校准触摸屏。如果触摸屏未校准,则可以重新校准或重置触摸屏。校准触摸屏的方法具体取决于类型和版本(请参见查看本地操作面板类型)。

  • 如果附带的是基于 Linux 的本地操作面板(DL 或 OL),则可以按照以下过程自行重新校准或将其重置为出厂设置。

  • 如果附带的是基于 Windows 的本地操作面板 (W),请与您的 Oracle 技术支持代表联系。

重新校准本地操作面板

  1. 如需精确校准,应确保触摸屏上没有碎屑。

  2. 登录到本地操作面板。选择 Tools > Calibrate

  3. 单击 Calibrate

  4. 将显示一系列目标。用手指或手写笔轻按每个目标的中心。

  5. 要保存新设置,请执行以下操作:

    1. 点按 Click Me 按钮。

      如果按钮不下陷,则表明触摸屏未正确校准。放弃新设置(请参见步骤 6)。

    2. 单击 OK 以保存新设置。

  6. 要放弃新设置,请执行以下操作:

    1. 不点按 Click Me 按钮,让计时器过期。

    2. 返回步骤 3 并重新校准。

    如果第二次校准不成功,本地操作面板将自动重新引导,恢复以前保存的校准。

将本地操作面板重置为出厂设置

  1. 登录到本地操作面板。

  2. 在 SLC 中,选择 Tools > Calibrate

  3. 单击 Reset Calibration。本地操作面板将重新引导。

排除主机连接问题

  • 使用探测器(一种用于跟踪磁带库网络通信的设备或程序)。

  • 在连接到磁带库的交换机或路由器上显示端口统计信息。搜索任何错误。

  • 通过磁带库管理软件运行跟踪以显示主机到磁带库的数据包和传输。

  • 确认两台单独的主机没有争相管理同一个磁带库或分区。要查看当前主机连接,请参见查看磁带库运行状态。单击 HLI 选项卡。