7 监视功能和恢复过程

SMC 提供了多种内部监视功能,可用于确保 SMC 子系统及所有客户机/服务器通信正常进行。

SMC 监视子任务会定期执行以下操作,具体取决于在 SMC MONitor 命令中设置的参数:

  • 在当前没有活动的通信路径时或者在当前通信路径不是首选路径时,检查 TapePlex 通信。

  • 在有一段时间没有与 TapePlex 的通信时,检查 TapePlex 通信。

  • 在 SMC 影响 z/OS 分配的情况下,确保 SMC IEFJFRQ 处于活动状态。

  • 清理不活动的通信标记

  • 重新驱动暂停的挂载

  • (可选)报告已达到其低暂存阈值的暂存子池

如果不输入 MONitor 命令,则除暂存阈值以外的以上所有操作都将受监视。此外,在默认情况下,SMC 始终会在中断后尝试恢复为主通信路径(第一个定义的服务器)。

有关 SMC MONitor 命令的更多信息,请参阅《ELS Command, Control Statement, and Utility Reference》。

通信监视

如果 SMC 监视处于活动状态,将定期检查每个 TapePlex 的状态。

如果 TapePlex 表现为活动,本地或主服务器路径(或已将 PREFprimary 设置为 OFF)上的通信在全服务级别,并且自上次活动检查间隔以来建立了通信,则不执行进一步处理。

但是,如果设置了 PREFprimary ON,则在以下任一情况下,SMC 都会尝试与 TapePlex 通信,从第一个定义的通信路径重新开始。

  • TapePlex 当前没有活动的通信路径。

  • TapePlex 在辅助通信路径上活动,并且设置了默认值 PREFprimary ON

  • TapePlex 不在全服务级别。

  • 自上一次活动检查间隔以来,TapePlex 尚未建立通信。

只要通信从一个通信路径切换到另一个通信路径,或者在经过一段时间与 TapePlex 无通信后成功建立通信,都会生成一条 SMC 消息指示通信已切换或处于活动状态。

当 SMC 检测到阻止通信的错误时,将生成以下 SMC 消息之一,并仍在控制台上保持为不可删除消息:

  • 消息 SMC0260 指示本地路径或服务器的特定错误。

  • 消息 SMC0261 指示 TapePlex 没有已定义的未禁用通信路径。

存在其中任何一条消息都表示 SMC 当前无法与 TapePlex 通信,并且无法根据服务器卷信息影响磁带分配。出现这种情况时,分配可能会转向具有与卷兼容的设备类型的磁带机。Oracle 建议设置 ALLOCDef 命令 FAILnoinfo SPECIFIC 参数以让作业在分配过程中失败,以防止特定的磁带分配被转向不正确的设备类型。

挂载监视

SMC 监视子任务的一项重要功能是确保所有挂载都成功自动化。

监视子任务会定期检查所有 UCB 中的暂停挂载状态同,并将此状态与 SMC 发送给设备的服务器的最后挂载请求进行比较。由于 TapePlex 或通信中断而未发送到服务器的挂载会尽可能重新驱动。对于其他类型的挂载,SMC 会发出消息 SMC0231 以指示挂载监视已检测到未完成的挂载,然后执行其他处理进行虚拟和真实磁带挂载。

  • 对于虚拟磁带挂载,SMC 会向服务器发送请求,并接收表示挂载请求已被服务器接受的响应。如果挂载在预定的间隔后仍然暂停,则 SMC 将尝试重新发出挂载请求,并指示在挂载完成或失败之前不应生成任何响应。如果失败,则 SMC 将以失败原因更新 SMC0231 消息(例如,无法从 MVC 卷召回 VTV),并且在挂载成功或作业取消之前,将无法删除该消息。

  • 对于可能由于硬件故障或者操作员以 "I"(忽略)响应 HSC 挂载 WTOR 消息的其他问题导致的真实挂载失败,SMC 会等待预定的间隔,然后尝试重新驱动挂载。

  • 对于真实挂载和虚拟挂载,都是仅尝试一次重新驱动挂载。SMC0231 消息会保留未完成状态以指示暂停挂载未得到满足的原因。

注:

出现下列所有情况时,SMC 都无法支持检测暂停挂载:
  • 已指定 ALLOCDEF DEFER(OFF)

  • 作业输入子系统是 JES3。

  • JES3 LOCAL 处理器上有未完成的挂载。

  • 已指定 ALLOCDEF DEFER(OFF),或者

  • 在 SMC 初始化之前请求了挂载,而挂载请求未请求 DEFER 选项。

可以使用 SMC Display DRives 命令来确定暂停挂载在 SMC 子系统中的当前状态。有关此命令显示的状态的更多信息,请参阅《ELS Command, Control Statement, and Utility Reference》。

恢复过程

由于 SMC 挂载监视器会检查并重新驱动暂停的挂载,因此不必执行手动过程以使系统重新驱动未完成的挂载。但是,如果挂载重新驱动不成功,并且已找到问题的原因,则可使用 SMC RESYNChronize 命令强制由 SMC 再次重新驱动未完成的挂载。如果挂载仍未得到满足,则可能需要执行手动恢复。

注:

出现下列所有情况时,SMC 都无法支持检测暂停挂载:
  • 已指定 ALLOCDEF DEFER(OFF)

  • 作业输入子系统是 JES3。

  • JES3 LOCAL 处理器上有未完成的挂载。

  • 已指定 ALLOCDEF DEFER(OFF),或者

  • 在 SMC 初始化之前请求了挂载,而挂载请求未请求 DEFER 选项。

不活动的 TapePlex 或不活动的 SMC:防止分配错误

当 TapePlex 变得不活动,或者通信错误阻止了 SMC 与 TapePlex 通信,则分配可能会选择与特定卷不兼容的设备。要防止发生这种情况,建议将 ALLOCDef 命令 FAILnoinfo 参数设置为 SPECIFIC,这将使作业在分配时失败,而不是分配到不兼容的设备。

有些软件产品允许挂起可能需要动态分配的处理。例如,如果在本地处理器上安装了数据工具分层存储管理器 (Data Facility Hierarchical Storage Manager, DFSMS/hsm),则可发出命令以阻止此类型的处理,而不必停止 DFSMS/hsm。

在 JES2,可以通过暂停作业队列或清除所有启动器来推迟常用的分配。有关 JES2 操作员命令的更多信息,请参见相应的 IBM 出版物。

在 JES3 中,可以使用以下修改命令在 SMC 不活动的情况下推迟批处理作业的 C/I 进程:

*F X,D=POSTSCAN,MC=00

在重新建立与 TapePlex 的通信后,或者重新启动 SMC 后,可使用以下修改命令将最大计数恢复为其原始值 xx

*F X,D=POSTSCAN,MC=xx

不活动的 TapePlex 或不活动的 SMC:重新驱动挂载

可以使用操作系统工具来确定可能尚未被 SMC 挂载监视或 SMC RESYNChronize 命令成功重新驱动的挂载。

对于 JES3,如果在 JES3 挂载处理过程中丢失了挂载,则发出以下命令:

*I,S,V

发出以下命令以确定作业已等待了多长时间:

*I,J=jjjj,W

其中 jjjj 是作业编号。

发出以下命令以确定其上有作业在等待的卷和磁带机:

*CALL,DISPLAY,J=jjjj

如果在 MVS 处理过程中丢失了挂载,则在请求挂载的系统上发出以下 MVS 命令以确定是否有任何磁带机有暂停的挂载请求:

D R,L

发出以下命令以确定要挂载的卷序列号:

D U,,,uuuu,1

其中 uuuu 是其挂载已暂停的设备的地址。

如果 SMC 不活动但 TapePlex 活动,则可使用 HSC Mount 命令请求 HSC 执行挂载:

M vvvvv,dddd

有关 HSC Mount 命令的更多信息,请参阅《ELS Command, Control Statement, and Utility Reference》。

JES3 全局/局部注意事项

在 JES3 环境中,请在局部或全局处理器上 JES3 失败时考虑以下恢复准则。

局部处理器上 JES3 不活动

如果在局部处理器上 JES3 发生故障,则除非活动作业需要 JES3 服务,否则将继续执行。对于动态分配请求,仍将发生磁带机排除。

要恢复,可重新启动 JES3(LOCAL 启动)。SMC 继续处理,不需要恢复。

全局处理器上 JES3 不活动

如果 JES3 在全局处理器上发生故障,则正在执行的作业将继续执行。对于动态分配请求,仍将发生磁带机排除。

要恢复,可重新启动 JES3 或者调用动态系统交换 (Dynamic System Interchange, DSI) 处理。

当全局处理器变得不活动或者需要维护时,可以使用 DSI 将 JES3 全局功能重新分配给某个 JES3 局部处理器。其中一个 JES3 局部处理器会成为新的 JES3 全局处理器。通过将全局功能重新分配给某个局部处理器,JES3 环境继续处理。SMC 继续处理,不需要恢复。

有关跨主机恢复的更多信息,请参阅《ELS Programming Reference》。

SMC 恢复过程 (JES2)

本节介绍了以下问题情形的恢复过程:

不活动 SMC - 活动 TapePlex

如果 SMC 在一个或多个 TapePlexes 仍然活动的情况下发生故障,则不执行以下功能:

  • 分配处理

  • 挂载/卸载/交换消息自动化

发生这种情况时,请重新启动 SMC。

有些软件产品允许挂起可能需要动态分配的处理。例如,如果在本地处理器上安装了数据工具分层存储管理器 (Data Facility Hierarchical Storage Manager, DFSMS/hsm),则可发出命令以阻止此类型的处理,而不必停止 DFSMS/hsm。

通过暂停作业队列或者清除所有启动器,可以推迟常用的分配。有关 JES2 操作员命令的更多信息,请参见相应的 IBM 出版物。

如果指定了 SMC MOUNTDef AUTOPendmount (ON) 选项,则将重新驱动未完成的挂载消息。

活动 SMC - 不活动 TapePlex

如果 TapePlex 发生故障或终止,则属于该 TapePlex 的卷和磁带机将成为 SMC 的未知对象。以下功能将都不能执行:

  • 影响分配的卷查找

  • 自动化挂载处理

如果发生这种情况,请重新启动 TapePlex 并发出 SMC RESYNC 命令。SMC 会重新建立与 TapePlex 的通信并自动完成所有未完成的挂载,不考虑 SMC MOUNTDef AUTOPendmount 设置。有关更多信息,请参见不活动 TapePlex 的挂载请求自动化

有些软件产品允许挂起可能需要动态分配的处理。例如,如果在本地处理器上安装了数据工具分层存储管理器 (Data Facility Hierarchical Storage Manager, DFSMS/hsm),则可发出命令以阻止此类型的处理,而不必停止 DFSMS/hsm。

通过暂停作业队列或者清除所有启动器,可以推迟常用的分配。有关 JES2 操作员命令的更多信息,请参见相应的 IBM 出版物。

注:

可以提供一个备份路径,指向在发现局部 HSC 不活动时自动激活的远程 TapePlex。有关更多信息,请参见第 3 章 SMC 和 StorageTek TapePlex 管理

不活动 TapePlex 的挂载请求自动化

当对应 TapePlex 被激活时,将自动重新驱动对属于不活动的 TapePlex 的磁带机的 MVS 挂载请求。

活动 TapePlex 的 MVS 挂载请求丢失

MVS 挂载请求在发生 LMU 错误时可能会丢失。如果您怀疑丢失了挂载,可使用此过程。

  1. 在请求挂载的系统上发出以下 MVS 命令以确定磁带机是否有暂停的挂载请求:

    D R,L

  2. 在同一个系统上发出以下 MVS 命令以确定要挂载的 VOLSER:

    D U,,,uuuu,1

  3. 如果将磁带机定义到了某个 HSC TapePlex,可对 HSC 活动的 MVS 系统上的卷发出 HSC Mount 命令。

SMC 恢复过程 (JES3)

本节介绍了以下问题情形的恢复过程:

不活动 SMC - 活动 TapePlex 子系统

如果 SMC 在一个或多个 TapePlexes 仍然活动的情况下发生故障,则不执行以下功能:

  • 分配处理

  • 挂载/卸载/交换消息自动化

发生这种情况时,请重新启动 SMC。

有些软件产品允许挂起可能需要动态分配的处理。例如,如果在本地处理器上安装了数据工具分层存储管理器 (Data Facility Hierarchical Storage Manager, DFSMS/hsm),则可发出命令以阻止此类型的处理,而不必停止 DFSMS/hsm。

要在 SMC 不活动的情况下推迟批处理作业的 C/I 进程,可以使用以下 Modify 命令:

*F X,D=POSTSCAN,MC=00

在重新启动了 SMC 后,将最大计数恢复为其原始值 xx:

*F X,D=POSTSCAN,MC=xx

如果启动 HSC 和 MVS/CSC 时使用了 AMPND 启动参数,则在重新启动 SMC 并且发生了 MVS 分配或挂载事件时,将重新驱动未完成的挂载消息。或者,也可以发出 SMC RESYNChronize 命令在这些情况下重新驱动暂停的挂载。

活动 SMC - 不活动 TapePlex

如果 TapePlex 发生故障或终止,则属于该 TapePlex 的卷和磁带机将成为 SMC 的未知对象。以下功能将都不能执行:

  • 影响分配的卷查找

  • 自动化挂载处理

如果发生这种情况,请重新启动 TapePlex 并发出 SMC RESYNC 命令。SMC 会重新建立与 TapePlex 的通信并自动完成所有未完成的挂载,不考虑 SMC MOUNTDef AUTOPendmount 设置。有关更多信息,请参见不活动 TapePlex 的挂载请求自动化

有些软件产品允许挂起可能需要动态分配的处理。例如,如果在本地处理器上安装了数据工具分层存储管理器 (Data Facility Hierarchical Storage Manager, DFSMS/hsm),则可发出命令以阻止此类型的处理,而不必停止 DFSMS/hsm。

注:

可以提供一个备份路径,指向在发现局部 HSC 不活动时自动激活的远程 TapePlex。有关更多信息,请参见第 1 章 简介

局部处理器上 JES3 不活动

如果在局部处理器上 JES3 发生故障,则不需要 JES3 服务的活动作业将继续执行。对于动态分配请求,仍将发生磁带机排除。

要恢复,可重新启动 JES3(LOCAL 启动)。SMC 继续处理,不需要恢复。

全局处理器上 JES3 不活动

如果在全局处理器上 JES3 发生故障,则不需要 JES3 服务的活动作业将继续执行。对于动态分配请求,仍将发生磁带机排除。

要恢复,可重新启动 JES3 或者调用动态系统交换 (Dynamic System Interchange, DSI) 处理。

当全局处理器变得不活动或者需要维护时,可以使用 DSI 将 JES3 全局功能重新分配给某个 JES3 局部处理器。其中一个 JES3 局部处理器会成为新的 JES3 全局处理器。通过将全局功能重新分配给某个局部处理器,JES3 环境继续处理。SMC 继续处理,不需要恢复。

有关跨主机恢复的更多信息,请参阅《ELS Programming Reference》或《MVS/CSC System Programmer’s Guide》。

不活动 TapePlex 的挂载请求自动化

当对应 TapePlex 被激活时,将自动重新驱动对属于不活动的 TapePlex 的磁带机的 MVS 挂载请求。

活动 TapePlex 的 JES3 挂载请求丢失

JES3 挂载请求在发生 LMU 错误时可能会丢失。如果您怀疑丢失了挂载,可使用此过程。

  1. 发出以下 JES3 命令以确定哪些作业在等待卷挂载:

    *I,S,V

  2. 发出以下 JES3 命令以确定作业已等待了多长时间:

    *I,J=nnnn,W

  3. 发出以下 JES3 命令以确定其上有作业在等待的卷和磁带机:

    *CALL,DISPLAY,J=nnnn

  4. 如果将有暂停挂载的磁带机定义到了某个 HSC TapePlex,可对 HSC 活动的 MVS 系统上的卷发出 HSC Mount 命令。

活动 TapePlex 的 MVS 挂载请求丢失

MVS 挂载请求在发生 LMU 错误时可能会丢失。如果您怀疑丢失了挂载,可使用此过程。

  1. 在请求挂载的系统上发出以下 MVS 命令以确定磁带机是否有暂停的挂载请求:

    D R,L

  2. 在同一个系统上发出以下 MVS 命令以确定要挂载的 VOLSER:

    D U,,,uuuu,1

  3. 如果将磁带机定义到了某个 HSC TapePlex,可对 HSC 活动的 MVS 系统上的卷发出 HSC Mount 命令。