7 Funciones de supervisión y procedimientos de recuperación

El SMC ofrece varias funciones de supervisión internas diseñadas para garantizar que el subsistema SMC y todas las comunicaciones de cliente/servidor funcionan correctamente.

La subtarea de supervisión del SMC realiza periódicamente las siguientes acciones, según los parámetros establecidos en el comando MONitor del SMC:

  • Comprueba las comunicaciones de TapePlex cuando no hay rutas de comunicación activas o cuando la ruta de comunicación actual no es la ruta preferida.

  • Comprueba las comunicaciones de TapePlex cuando no hubo comunicación con el TapePlex durante un tiempo.

  • Garantiza que la salida IEFJFRQ del SMC esté activa, cuando el SMC influye en la asignación de z/OS.

  • Elimina los token de comunicación inactivos.

  • Redirige montajes pendientes.

  • De manera opcional, informa sobre subagrupaciones nuevas que alcanzaron su bajo valor de umbral nuevo.

Si no introduce un comando MONitor, se supervisan todas las acciones anteriores, excepto los umbrales nuevos. Además, de forma predeterminada, el SMC siempre intenta revertir la ruta de comunicación principal (primer servidor definido) después de una interrupción.

Consulte la Referencia de comandos, sentencias de control y utilidades de ELS para obtener más información sobre el comando MONitor del SMC.

Supervisión de comunicaciones

Si la supervisión del SMC está activa, el estado de cada TapePlex se comprueba periódicamente.

Si el TapePlex parece estar activo, se comunica con la ruta de servidor principal o local (o tiene PREFprimary establecido en OFF), se encuentra en un nivel de servicio completo y estableció comunicaciones desde el último intervalo de comprobación activo, no se realiza ningún procesamiento adicional.

Sin embargo, en cualquiera de las siguientes circunstancias, el SMC intenta comunicarse con el TapePlex y se reinicia en la primera ruta de comunicación definida si PREFprimary está configurado en ON.

  • El TapePlex no tiene una ruta de comunicación activa actual.

  • El TapePlex está activo en una ruta de comunicación secundaria y PREFprimary está configurado en el valor por defecto ON.

  • El TapePlex no se encuentra en un nivel de servicio completo.

  • El TapePlex no estableció comunicaciones desde el último intervalo de comprobación activo.

Cuando la comunicación se trasfiere de una ruta de comunicación a otra o cuando la comunicación se establece satisfactoriamente tras un breve período de no comunicación con el TapePlex, se muestra un mensaje del SMC que indica que la comunicación se transfirió o está activa.

Cuando el SMC detecta un error que impide la comunicación, se muestra uno de los siguientes mensajes del SMC, que permanece en la consola y no puede suprimirse:

  • El mensaje SMC0260 indica un error específico para una ruta o servidor local.

  • El mensaje SMC0261 indica que no hay rutas de comunicación activadas y definidas para un TapePlex.

La presencia de alguno de estos mensajes indica que el SMC no puede comunicarse con un TapePlex y no puede influir en la asignación de cintas sobre la base de la información de volumen del servidor. Cuando ocurre esta situación, es posible que la asignación se dirija a unidades con un tipo de dispositivo que no es compatible con el volumen. Oracle recomienda establecer el parámetro FAILnoinfo SPECIFIC del comando ALLOCDef para cancelar la asignación de trabajos e impedir que las asignaciones de cintas específicas se dirijan a tipos de dispositivos incorrectos.

Supervisión de montaje

Una función importante de la subtarea de supervisión del SMC es garantizar que todos los montajes se hayan automatizado satisfactoriamente.

La subtarea de supervisión comprueba periódicamente todos los UCB para detectar estados de montaje pendientes y compara este estado con la última solicitud de montaje enviada por el SMC al servidor para el dispositivo. Los montajes que no se enviaron al servidor debido a interrupciones de TapePlex o de comunicación se redirigen lo antes posible. Para otros tipos de montaje, el SMC emite el mensaje SMC0231 para indicar que la supervisión del montaje detectó un montaje pendiente y, luego, lleva a cabo un procesamiento diferente para montajes de cintas virtuales y reales.

  • Para montajes de cintas virtuales, el SMC envía la solicitud al servidor y recibe una respuesta que indica que el servidor aceptó la solicitud de montaje. Si el montaje sigue estando pendiente después de un intervalo predeterminado, el SMC intenta volver a emitir la solicitud de montaje e indica que no debe generarse ninguna respuesta hasta que se complete o se cancele el montaje. Si se produce un error, el SMC actualiza el mensaje SMC0231 con el motivo de error (por ejemplo, que no pudo recuperarse un VTV de un volumen MVC) y el mensaje no puede suprimirse hasta que se complete satisfactoriamente el montaje o se cancele el trabajo.

  • En el caso de errores de montaje real, que pueden ocurrir como consecuencia de interrupciones de hardware u otros problemas a los que el operador respondió "I" (ignorar) en un mensaje WTOR de montaje del HSC, el SMC espera que transcurra un intervalo predeterminado y, a continuación, intenta redirigir el montaje.

  • Para montajes virtuales y reales, se realiza un solo intento por redirigir un montaje. El mensaje SMC0231 sigue estando pendiente para indicar el motivo por el cual no se cumplió con un montaje pendiente.

Nota:

El SMC no admite la detección de montajes pendientes si se cumplen todas las siguientes condiciones:
  • ALLOCDEF DEFER(OFF) se especificó.

  • El subsistema de la entrada de trabajo es JES3.

  • El montaje está pendiente un procesador LOCAL JES3.

  • ALLOCDEF DEFER(OFF) se especificó. O bien:

  • Se solicitó el montaje antes de que se inicializara el SMC y la solicitud de montaje no solicitó la opción DEFER.

Puede usar el comando Display DRives del SMC para determinar el estado actual de un montaje pendiente dentro del subsistema SMC. Consulte la Referencia de comandos, sentencias de control y utilidades de ELS para obtener más información sobre los estados mostrados por este comando.

Procedimientos de recuperación

Dado que la supervisión de montaje del SMC comprueba y redirige los montajes pendientes, no es necesario realizar procedimientos manuales para que el sistema redirija un montaje pendiente. Sin embargo, si la redirección de un montaje no fue satisfactoria y se resolvió la causa del problema, puede usar el comando RESYNChronize del SMC para forzar una nueva redirección de los montajes pendientes por parte del SMC. Si el montaje sigue siendo no satisfactorio, es posible que deba realizar una recuperación manual.

Nota:

El SMC no admite la detección de montajes pendientes si se cumplen todas las siguientes condiciones:
  • ALLOCDEF DEFER(OFF) se especificó.

  • El subsistema de la entrada de trabajo es JES3.

  • El montaje está pendiente un procesador LOCAL JES3.

  • ALLOCDEF DEFER(OFF) se especificó. O bien:

  • Se solicitó el montaje antes de que se inicializara el SMC y la solicitud de montaje no solicitó la opción DEFER.

TapePlex inactivo o SMC inactivo: prevención de errores de asignación

Cuando un TapePlex se vuelve inactivo, o los errores de comunicación impiden que el SMC se comunique con un TapePlex, es posible que la asignación seleccione un dispositivo no compatible con un volumen específico. Para evitar que ocurra esto, se recomienda configurar el parámetro FAILnoinfo del comando ALLOCDef en SPECIFIC, que cancela la asignación de trabajos e impide que se realicen asignaciones a dispositivos no compatibles.

Determinados productos de software permiten suspender el procesamiento que puede requerir una asignación dinámica. Por ejemplo, si el gestor de almacenamiento jerárquico de la utilidad de datos (DFSMS/hsm) está instalado en el procesador local, puede ejecutar comandos para impedir este tipo de procesamiento sin detener DFSMS/hsm.

En JES2, puede suspender la cola de trabajos o depurar todos los iniciadores para posponer las asignaciones comunes. Consulte la correspondiente publicación de IBM para obtener más información sobre los comandos de operador de JES2.

En JES3, puede usar el siguiente comando de modificación para posponer el proceso C/I para trabajos por lotes mientras el SMC está inactivo:

*F X,D=POSTSCAN,MC=00

Una vez que se restablece la comunicación con el TapePlex, o se reinicia el SMC, use el siguiente comando de modificación para restaurar el recuento máximo al valor original, xx:

*F X,D=POSTSCAN,MC=xx

TapePlex inactivo o SMC inactivo: redirección de montajes

Puede usar las funciones del sistema operativo para determinar los montajes que posiblemente no se redirigieron satisfactoriamente mediante los comandos Mount Monitor o RESYNChronize del SMC.

Para JES3, si se pierde el montaje durante el procesamiento de JES3, ejecute el siguiente comando:

*I,S,V

Ejecute el siguiente comando para determinar cuánto tiempo esperó el trabajo:

*I,J=jjjj,W

Donde jjjj es el número de trabajo.

Ejecute el siguiente comando para determinar en qué volumen y unidad espera el trabajo:

*CALL,DISPLAY,J=jjjj

Si se pierde un montaje durante el procesamiento de MVS, ejecute el siguiente comando de MVS en el sistema que solicita el montaje para determinar si hay unidades con una solicitud de montaje pendiente:

D R,L

Ejecute el siguiente comando para determinar qué VOLSER se debe montar:

D U,,,uuuu,1

Donde uuuu es la dirección del dispositivo con un montaje pendiente.

Si el SMC está inactivo pero el TapePlex está activo, puede usar el comando Mount del HSC para solicitar que el HSC realice el montaje:

M vvvvv,dddd

Consulte la Referencia de comandos, sentencias de control y utilidades de ELS para obtener más información sobre el comando Mount del HSC.

Consideraciones globales/locales de JES3

En un entorno JES3, tenga en cuenta las siguientes directrices de recuperación cuando JES3 falla en un procesador local o global.

JES3 inactivo en un procesador local

Cuando JES3 falla en un procesador local, los trabajos activos se siguen ejecutando a menos que requieran servicios JES3. La exclusión de unidades se sigue realizando para solicitudes de asignación dinámica.

Para recuperación, reinicie JES3 (inicio de LOCAL). El SMC continúa el procesamiento y no requiere recuperación.

JES3 inactivo en un procesador global

Cuando JES3 falla en un procesador global, los trabajos en ejecución se siguen ejecutando. La exclusión de unidades se sigue realizando para solicitudes de asignación dinámica.

Para realizar la recuperación, reinicie JES3 o invoque el procesamiento de intercambio de sistema dinámico (DSI).

Puede usar el DSI para reasignar la función global de JES3 a un procesador local de JES3 cuando el procesador global se vuelve inactivo o requiere mantenimiento. Uno de los procesadores locales de JES3 se convierte en el nuevo procesador global de JES3. Al reasignar la función global a un procesador local, el entorno JES3 continúa el procesamiento. El SMC continúa el procesamiento y no requiere recuperación.

Consulte la Referencia de programación de ELS para obtener más información sobre la recuperación entre hosts.

Procedimientos de recuperación del SMC (JES2)

En esta sección, se describen los procedimientos de recuperación para los siguientes escenarios de problemas:

SMC inactivo - TapePlex activo

Cuando el SMC falla mientras uno o varios sistemas TapePlex permanecen activos, no se llevan a cabo las siguientes funciones:

  • Procesamiento de asignaciones

  • Automatización de mensajes de montaje/desmontaje/intercambio

Si esto ocurre, reinicie el SMC.

Determinados productos de software permiten suspender el procesamiento que puede requerir una asignación dinámica. Por ejemplo, si el gestor de almacenamiento jerárquico de la utilidad de datos (DFSMS/hsm) está instalado en el procesador local, puede ejecutar comandos para impedir este tipo de procesamiento sin detener DFSMS/hsm.

Puede suspender la cola de trabajos o depurar todos los iniciadores para posponer las asignaciones comunes. Consulte la correspondiente publicación de IBM para obtener más información sobre los comandos de operador de JES2.

Si se especificó la opción AUTOPendmount (ON) de MOUNTDef del SMC, se redirigen los mensajes de montaje pendientes.

SMC activo - TapePlex inactivo

Cuando un TapePlex falla o finaliza, los volúmenes y las unidades pertenecientes a ese TapePlex se vuelven desconocidas para el SMC. Las siguientes funciones no se llevan a cabo:

  • Consulta de volúmenes para influir en la asignación

  • Procesamiento de montaje automatizado

Si esto ocurre, reinicie el TapePlex y ejecute el comando RESYNC del SMC. El SMC restablece la comunicación con el TapePlex y automatiza los montajes pendientes, independientemente de la configuración AUTOPendmount de MOUNTDef del SMC. Consulte Automatización de solicitudes de montaje para sistemas TapePlex inactivos a continuación para obtener más información.

Determinados productos de software permiten suspender el procesamiento que puede requerir una asignación dinámica. Por ejemplo, si el gestor de almacenamiento jerárquico de la utilidad de datos (DFSMS/hsm) está instalado en el procesador local, puede ejecutar comandos para impedir este tipo de procesamiento sin detener DFSMS/hsm.

Puede suspender la cola de trabajos o depurar todos los iniciadores para posponer las asignaciones comunes. Consulte la correspondiente publicación de IBM para obtener más información sobre los comandos de operador de JES2.

Nota:

Puede proporcionar una ruta de respaldo a un TapePlex remoto que se active automáticamente cuando se detecta que el HSC está inactivo. Consulte el Capítulo 3, El SMC y la gestión de TapePlex de StorageTek para obtener más información.

Automatización de solicitudes de montaje para sistemas TapePlex inactivos

Las solicitudes de montaje de MVS para las unidades pertenecientes a sistemas TapePlex inactivos se redirigen automáticamente una vez que se activan los sistemas TapePlex correspondientes.

Solicitudes de montaje de MVS perdidas para sistemas TapePlex activos

Es posible que se pierda una solicitud de montaje de MVS cuando se produce un error de LMU. Use este procedimiento si sospecha que se perdieron montajes.

  1. Ejecute el siguiente comando de MVS en el sistema que solicita el montaje para determinar si hay unidades con una solicitud de montaje pendiente:

    D R,L

  2. Ejecute el siguiente comando de MVS en el mismo sistema para determinar qué VOLSER se debe montar:

    D U,,,uuuu,1

  3. Si la unidad está definida para un TapePlex del HSC, ejecute el comando Mount del HSC para el volumen del sistema MVS en el cual el HSC está activo.

Procedimientos de recuperación del SMC (JES3)

En esta sección, se describen los procedimientos de recuperación para los siguientes escenarios de problemas:

SMC inactivo - subsistema TapePlex activo

Cuando el SMC falla mientras uno o varios sistemas TapePlex permanecen activos, no se llevan a cabo las siguientes funciones:

  • Procesamiento de asignaciones

  • Automatización de mensajes de montaje/desmontaje/intercambio

Si esto ocurre, reinicie el SMC.

Determinados productos de software permiten suspender el procesamiento que puede requerir una asignación dinámica. Por ejemplo, si el gestor de almacenamiento jerárquico de la utilidad de datos (DFSMS/hsm) está instalado en el procesador local, puede ejecutar comandos para impedir este tipo de procesamiento sin detener DFSMS/hsm.

Para posponer el proceso C/I para trabajos por lotes mientras el SMC está inactivo, use el siguiente comando Modify:

*F X,D=POSTSCAN,MC=00

Una vez que se reinicia el SMC, restaure el recuento máximo al valor original (xx):

*F X,D=POSTSCAN,MC=xx

Si el HSC y MVS/CSC se iniciaron con el parámetro de inicio AMPND, los mensajes de montaje pendientes se redirigen cuando se reinicia el SMC y ocurre un evento de montaje o asignación de MVS. De manera alternativa, se puede ejecutar el comando RESYNChronize del SMC para redirigir montajes pendientes en estas circunstancias.

SMC activo - TapePlex inactivo

Cuando un TapePlex falla o finaliza, los volúmenes y las unidades pertenecientes a ese TapePlex se vuelven desconocidas para el SMC. Las siguientes funciones no se llevan a cabo:

  • Consulta de volúmenes para influir en la asignación

  • Procesamiento de montaje automatizado

Si esto ocurre, reinicie el TapePlex y ejecute el comando RESYNC del SMC. El SMC restablece la comunicación con el TapePlex y automatiza los montajes pendientes, sin importar la configuración MOUNTDef AUTOPendmount del SMC. Consulte el Automatización de solicitudes de montaje para sistemas TapePlex inactivos para obtener más información.

Determinados productos de software permiten suspender el procesamiento que puede requerir una asignación dinámica. Por ejemplo, si el gestor de almacenamiento jerárquico de la utilidad de datos (DFSMS/hsm) está instalado en el procesador local, puede ejecutar comandos para impedir este tipo de procesamiento sin detener DFSMS/hsm.

Nota:

Puede proporcionar una ruta de respaldo a un TapePlex remoto que se active automáticamente cuando se detecta que el HSC está inactivo. Consulte el Capítulo 1, Introducción para obtener más información.

JES3 inactivo en un procesador local

Cuando JES3 falla en un procesador local, los trabajos activos que no requieren servicios JES3 se siguen ejecutando. La exclusión de unidades se sigue realizando para solicitudes de asignación dinámica.

Para recuperación, reinicie JES3 (inicio de LOCAL). El SMC continúa el procesamiento y no requiere recuperación.

JES3 inactivo en un procesador global

Cuando JES3 falla en un procesador global, los trabajos activos que no requieren servicios JES3 se siguen ejecutando. La exclusión de unidades se sigue realizando para solicitudes de asignación dinámica.

Para realizar la recuperación, reinicie JES3 o invoque el procesamiento de intercambio de sistema dinámico (DSI).

Puede usar el DSI para reasignar la función global de JES3 a un procesador local de JES3 cuando el procesador global se vuelve inactivo o requiere mantenimiento. Uno de los procesadores locales de JES3 se convierte en el nuevo procesador global de JES3. Al reasignar la función global a un procesador local, el entorno JES3 continúa el procesamiento. El SMC continúa el procesamiento y no requiere recuperación.

Consulte la Referencia de programación de ELS o la Guía del programador de sistemas para MVS/CSC para obtener más información sobre la recuperación entre hosts.

Automatización de solicitudes de montaje para sistemas TapePlex inactivos

Las solicitudes de montaje de MVS para las unidades pertenecientes a sistemas TapePlex inactivos se redirigen automáticamente una vez que se activan los sistemas TapePlex correspondientes.

Solicitudes de montaje de JES3 perdidas para sistemas TapePlex activos

Es posible que se pierda una solicitud de montaje de JES3 cuando se produce un error de LMU. Use este procedimiento si sospecha que se perdieron montajes.

  1. Ejecute el siguiente comando de JES3 para determinar los trabajos en espera de un montaje de volumen:

    *I,S,V

  2. Ejecute el siguiente comando de JES3 para determinar cuánto tiempo esperó un trabajo:

    *I,J=nnnn,W

  3. Ejecute el siguiente comando de JES3 para determinar en qué volumen y unidad espera el trabajo:

    *CALL,DISPLAY,J=nnnn

  4. Si la unidad con un montaje pendiente está definida para un TapePlex del HSC, ejecute el comando Mount del HSC para el volumen del sistema MVS en el cual el HSC está activo.

Solicitudes de montaje de MVS perdidas para sistemas TapePlex activos

Es posible que se pierda una solicitud de montaje de MVS cuando se produce un error de LMU. Use este procedimiento si sospecha que se perdieron montajes.

  1. Ejecute el siguiente comando de MVS en el sistema que solicita el montaje para determinar si hay unidades con una solicitud de montaje pendiente:

    D R,L

  2. Ejecute el siguiente comando de MVS en el mismo sistema para determinar qué VOLSER se debe montar:

    D U,,,uuuu,1

  3. Si la unidad está definida para un TapePlex del HSC, ejecute el comando Mount del HSC para el volumen del sistema MVS en el cual el HSC está activo.