Configurar tareas

En esta sección, se trata la creación y configuración de tareas.

Acerca de las tareas

Las tareas son bloques cortos y funcionales de código que puede agrupar en un flujo como parte de un trabajo o ascender a los propios trabajos.

Las tareas son los principales bloques de construcción de todos los flujos de trabajo en Oracle AI Data Platform Workbench. El tipo de tarea determina el tipo de código que utiliza. Como parte de un trabajo, conecta tareas para determinar su secuencia y prioridad cuando se ejecuta el trabajo.

Tipo de Tarea Descripción
Tarea de bloc de notas Una tarea que se ha guardado en un bloc de notas al que puede acceder
Tarea de Python Tarea que utiliza un fragmento del lenguaje de programación Python
Condición If/else Tarea que utiliza condiciones if/else
Tarea de trabajo anidada Tarea que utiliza un trabajo existente y sus tareas como tarea anidada
Tarea de Jar Tarea que puede ejecutar código Scala o Java compilado en archivos Java Archive (JAR).

Cuando tiene más de una tarea, puede crear juegos de dependencias de tareas en los que el éxito o el fallo de una tarea pueden disparar tareas posteriores en secuencia. Solo puede crear dependencias en trabajos que tengan más de una tarea. Consulte Creación de una tarea de bloc de notas.

Las tareas se pueden ejecutar en paralelo entre sí. Para ello, puede hacer que dos o más tareas dependan del éxito o el fallo de otra tarea en el mismo flujo de trabajo, lo que hace que se ejecuten al mismo tiempo.

Las tareas pueden fallar debido a problemas transitorios, como interrupciones de la red, falta de disponibilidad de recursos o fallos temporales del servicio. En estos casos, AI Data Platform Workbench reintenta automáticamente la tarea en función de las políticas de reintento que configure al crear la tarea. Como parte de estas políticas, debe definir:

  • Recuento de reintentos: número máximo de intentos de reintento.
  • Intervalo de Reintento: Tiempo de espera entre reintentos.

Además de los reintentos de tareas estándar, AI Data Platform Workbench también admite el reintento de timeout. Si una tarea supera su límite de tiempo de ejecución debido a restricciones de recursos o procesamiento lento y desea volver a intentarlo solo para estos escenarios, puede optar por disparar automáticamente un reintento. Estas políticas de reintento mejoran la resiliencia del flujo de trabajo, lo que garantiza que las tareas tengan mayores posibilidades de ejecución correcta sin intervención manual.

Cuándo y cómo utilizar los logs de Compute

Debe comprobar los logs de recursos informáticos si la tarea falla con errores relacionados con los recursos o el sistema, como errores de falta de memoria o un uso de CPU que supera los límites.

Revise los logs de Spark si ve tiempos de espera largos, reintentos inesperados o cuellos de botella de rendimiento del trabajo. Estos logs proporcionan estadísticas sobre los nodos de controlador y trabajador del cluster de recursos informáticos que realiza la copia de seguridad de la tarea y pueden ayudar a identificar el origen de posibles problemas.

Para obtener instrucciones sobre cómo comprobar los logs, consulte Supervisión de una ejecución de trabajo específica.

Debe tener el permiso adecuado de RBAC de nivel informático para ver los metadatos y los logs de la instancia informática asociada al trabajo. Póngase en contacto con el administrador para obtener estos permisos si no puede ver los logs de recursos informáticos. Para obtener más información, consulte Acerca de los permisos.

Creación de una tarea de Python

Puede crear una tarea como parte de un trabajo de flujo de trabajo que utiliza scripts de Python.

  1. En la página inicial, haga clic en Flujo de trabajo.
  2. Haga clic en el trabajo para el que desea realizar una tarea.
  3. Haga clic en Agregar tarea.
  4. Introduzca un nombre de la tarea.
  5. En Tipo de tarea, seleccione Python.
  6. Haga clic en Examinar y navegue hasta el script de Python que desea agregar como tarea. Haga clic en Seleccionar.
  7. Seleccione un cluster de recursos informáticos para la tarea de Python, si aún no hay uno asociado.
  8. Seleccione el número de reintentos que una tarea debe intentar en caso de fallo. Si selecciona más de 0, también debe especificar cuánto tiempo debe esperar la ejecución del trabajo entre reintentos y si se deben intentar reintentos con timeout.

    Opciones de reintento de tarea cuando el número de reintentos es 1 o mayor

  9. En Depende de, seleccione las tareas de las que desee que dependa esta tarea. Seleccione la respuesta condicional a esa dependencia en la lista desplegable Ejecutar si.
  10. Agregue parámetros adicionales proporcionando su clave y su valor. Haga clic en Agregar parámetro para proporcionar varios parámetros.

Crear una tarea de bloc de notas

Las tareas se crean mediante blocs de notas que ha creado en el área de trabajo de AI Data Platform.

  1. En la página inicial, haga clic en Flujo de trabajo.
  2. Haga clic en el trabajo para el que desea realizar una tarea.
  3. Haga clic en Agregar tarea.
  4. Introduzca un nombre de la tarea.
  5. En Tipo de tarea, seleccione Libro de notas.
  6. Haga clic en Examinar y navegue hasta el bloc de notas que desea agregar como tarea. Haga clic en Seleccionar.
  7. Seleccione un cluster de recursos informáticos para la tarea de bloc de notas, si aún no hay uno asociado.
  8. Seleccione el número de reintentos que una tarea debe intentar en caso de fallo. Si selecciona más de 0, también debe especificar cuánto tiempo debe esperar la ejecución del trabajo entre reintentos y si se deben intentar reintentos con timeout.

    Opciones de reintento de tarea cuando el número de reintentos es 1 o mayor

  9. En Depende de, seleccione las tareas de las que desee que dependa esta tarea. Seleccione la respuesta condicional a esa dependencia en la lista desplegable Ejecutar si.
  10. Agregue parámetros adicionales proporcionando su clave y su valor. Haga clic en Agregar parámetro para proporcionar varios parámetros.

Creación de una tarea de trabajo anidada

Puede utilizar otro trabajo de flujo de trabajo y sus tareas incluidas como una tarea anidada dentro de otro flujo de trabajo.

  1. En la página de inicio, haga clic en Flujo de trabajo.
  2. Haga clic en el trabajo para el que desea realizar una tarea.
  3. Haga clic en Agregar tarea.
  4. Introduzca un nombre de la tarea.
  5. En Tipo de tarea, seleccione Tarea de trabajo anidada.
  6. En la lista desplegable Trabajos, seleccione un trabajo existente del que desee realizar una tarea.
  7. Seleccione el número de reintentos que una tarea debe intentar en caso de fallo. Si selecciona más de 0, también debe especificar cuánto tiempo debe esperar la ejecución del trabajo entre reintentos y si se deben intentar reintentos con timeout.

    Opciones de reintento de tarea cuando el número de reintentos es 1 o mayor

  8. En Depende de, seleccione las tareas de las que desee que dependa esta tarea. Seleccione la respuesta condicional a esa dependencia en la lista desplegable Ejecutar si.
  9. Agregue parámetros adicionales proporcionando su clave y su valor. Haga clic en Agregar parámetro para proporcionar varios parámetros.

Crear una tarea If/Else

Puede crear una tarea que utilice condiciones if/else basadas en datos de catálogo para determinar si la tarea se dispara.

  1. En la página inicial, haga clic en Flujo de trabajo.
  2. Haga clic en el trabajo para el que desea realizar una tarea.
  3. Haga clic en Agregar tarea.
  4. Introduzca un nombre de la tarea.
  5. En Tipo de tarea, seleccione Si/Si no.
  6. Introduzca las condiciones que determinan si la tarea se dispara. Haga clic en Icono de agregar Agregar para definir varias condiciones.
  7. Introduzca la expresión de condición.
  8. Seleccione el número de reintentos que una tarea debe intentar en caso de fallo. Si selecciona más de 0, también debe especificar cuánto tiempo debe esperar la ejecución del trabajo entre reintentos y si se deben intentar reintentos con timeout.

    Opciones de reintento de tarea cuando el número de reintentos es 1 o mayor

  9. En Depende de, seleccione las tareas de las que desee que dependa esta tarea. Seleccione la respuesta condicional a esa dependencia en la lista desplegable Ejecutar si.
  10. Agregue parámetros adicionales proporcionando su clave y su valor. Haga clic en Agregar parámetro para proporcionar varios parámetros.

Creación de una Tarea Jar

Puede crear tareas que ejecuten código Scala o Java compilado en archivos Java Archive (JAR).

Note:

Los archivos de biblioteca dependientes deben utilizar versiones de JDK, Scala o Spark compatibles con el tiempo de ejecución del cluster de Oracle AI Data Platform Workbench en el momento de la creación para evitar un comportamiento inesperado.
  1. En la página inicial, haga clic en Flujo de trabajo.
  2. Haga clic en el trabajo para el que desea realizar una tarea.
  3. Haga clic en Agregar tarea.
  4. Introduzca un nombre de la tarea.
  5. En Tipo de tarea, seleccione Tarea JAR.
  6. En Nombre de clase principal, especifique el nombre completo de la clase que contiene el método principal que desea ejecutar. Por ejemplo, ProcessTransaction. Esta clase se debe incluir en uno de los archivos agregados como biblioteca dependiente.
  7. En Bibliotecas dependientes, haga clic en Agregar.
  8. Seleccione un origen para los archivos de biblioteca dependientes. Se debe incluir al menos una biblioteca que contenga el método de clase principal especificado anteriormente.
    • En Espacio de trabajo o Volumen, examine el volumen o el espacio de trabajo de AI Data Platform Workbench, seleccione el archivo o los archivos que desea agregar como biblioteca y haga clic en Agregar.
    • En Cargar archivo en espacio de trabajo, busque el archivo o los archivos que desea cargar como biblioteca en la máquina local y haga clic en Agregar.
  9. En Argumentos de la línea de comandos, proporcione argumentos delimitados por espacios en blanco que desee transferir a la clase principal.
  10. Seleccione el número de reintentos que una tarea debe intentar en caso de fallo. Si selecciona más de 0, también debe especificar cuánto tiempo debe esperar la ejecución del trabajo entre reintentos y si se deben intentar reintentos con timeout.

    Opciones de reintento de tarea cuando el número de reintentos es 1 o mayor

  11. En Depende de, seleccione las tareas de las que desee que dependa esta tarea. Seleccione la respuesta condicional a esa dependencia en la lista desplegable Ejecutar si.
  12. Agregue parámetros adicionales proporcionando su clave y su valor. Haga clic en Agregar parámetro para proporcionar varios parámetros.

Modificación de una tarea

Puede cambiar los atributos existentes de una tarea, como el nombre, el tipo y los parámetros, para modificar la forma en que funciona en el trabajo.

  1. En la página inicial, haga clic en Flujo de trabajo.
  2. Haga clic en el trabajo para el que desea configurar las tareas.
  3. En el separador Tareas, haga clic en la tarea que desea editar.
  4. En el panel Detalles de tarea de la derecha, modifique los atributos de tarea según sea necesario. Los cambios se guardan automáticamente.

Ver logs de tareas

Puede ver los logs de ejecución de tareas individuales en un trabajo.

  1. En la página inicial, haga clic en Flujos de trabajo.
  2. Haga clic en Ejecuciones de trabajos.
  3. Haga clic en el trabajo para el que desea ver los logs de tareas.
  4. Haga clic en los nodos de tarea para ver los logs de esa tarea.

Supresión de tareas

Puede suprimir una tarea eliminando el nodo de tarea de un trabajo.

  1. En la página de inicio, haga clic en Flujo de trabajo.
  2. Haga clic en el trabajo del que desea suprimir tareas.
  3. En el nodo de tarea, haga clic en Acciones y, a continuación, en Eliminar nodo.
  4. Haga clic en Suprimir.