Publicación en OCI Data Flow

Solo se pueden publicar tareas de integración y del cargador de datos en Data Integration desde el servicio Data Integration en el servicio Oracle Cloud Infrastructure Data Flow.

Cuando publica una tarea en OCI Data Flow, se crea un archivo JAR en OCI Object Storage y una aplicación que hace referencia al archivo JAR en el servicio Data Flow.

Después de la publicación, puede ejecutar la aplicación en OCI Data Flow, donde puede seleccionar unidades de computación, y supervisar y diagnosticar ejecuciones de flujos de datos. Si la tarea tiene parámetros asignados, la aplicación OCI Data Flow se crea con los valores de parámetros por defecto. Sin embargo, no puede introducir valores de parámetros al ejecutar la aplicación en OCI Data Flow.

En las siguientes páginas se describe cómo publicar una tarea en OCI Data Flow y las tareas específicas que puede realizar después de la publicación:

Configuración y políticas necesarias

Antes de publicar una tarea en el servicio OCI Data Flow, asegúrese de que dispone de lo siguiente:

  • Un activo de datos de Object Storage en el que publicar los ejecutables

  • Un cubo en Object Storage para el archivo JAR

  • Permisos y políticas de IAM relevantes para acceder a Object Storage, como se describe en Ejemplos de políticas para activar el acceso a OCI Object Storage.

  • Permisos y políticas de IAM relevantes:

    allow any-user to manage dataflow-application in compartment <compartment-name> where ALL {request.principal.type = 'disworkspace', request.principal.id = '<workspace-ocid>'}
    allow any-user to manage dataflow-run in compartment <compartment-name> where ALL {request.principal.type = 'disworkspace', request.principal.id = '<workspace-ocid>'}
    allow group <group-name> to read dataflow-application in compartment <compartment-name>
    allow group <group-name> to manage dataflow-run in compartment <compartment-name>

Punto final privado

Por defecto, la aplicación OCI Data Flow se crea con acceso a la red pública de Internet. Puede optar por publicar utilizando un punto final privado en OCI Data Flow. Por ejemplo, si las tareas utilizan orígenes de datos alojados en redes privadas, puede publicar en OCI Data Flow mediante un punto final privado.

Para publicar en OCI Data Flow mediante un punto final privado, asegúrese de que también tenga lo siguiente:

  • Un punto final privado en OCI Data Flow para que la aplicación lo utilice. Consulte Creación de un punto final privado.

    Para conocer las políticas necesarias para utilizar OCI Data Flow con puntos finales privados, consulte Políticas de puntos finales privados.

  • Política necesaria para publicar desde OCI Data Integration en aplicaciones de OCI Data Flow activadas por puntos finales privados:

    allow any-user to read dataflow-private-endpoint in compartment <compartment-name> where ALL {request.principal.type = 'disworkspace', request.principal.id = '<workspace-ocid>'}
  • Política que permite a un grupo de usuarios que no son administradores mostrar los puntos finales privados existentes en el nivel de compartimento (al publicar desde OCI Data Integration en OCI Data Flow):

    allow group <group-name> to inspect dataflow-private-endpoint in compartment <compartment-name>
  • Los activos de datos utilizados en la tarea que está publicando en OCI Data Flow deben ser:
    • Configurar para que utilicen secretos de OCI Vault que contienen las contraseñas para conectarse a los orígenes de datos. Esto es necesario para transferir credenciales de forma segura entre servicios de OCI. Consulte Secretos de OCI Vault y carteras de Oracle.

      Política necesaria para utilizar secretos en OCI Vault:

      allow any-user to read secret-bundles in compartment <compartment-name> where ALL {request.principal.type = 'disworkspace', request.principal.id = '<workspace-ocid>'}

      La siguiente política permite a un grupo de usuarios que no sean administradores utilizar secretos con Oracle Autonomous Data Warehouse y Oracle Autonomous Transaction Processing:

      allow group <group-name> to read secret-bundles in compartment <compartment-name>
    • Especificar mediante el nombre de dominio completo (FQDN) para los hosts de base de datos. OCI Data Flow no permite conexiones mediante direcciones IP directas.

Nota

  • Las sentencias de política proporcionadas en este tema son solo ejemplos. Asegúrese de escribir políticas que cumplan sus propios requisitos.

  • Las políticas entre arrendamientos son necesarias si los recursos (como objetos y cubos de Object Storage) y el espacio de trabajo de Data Integration están en distintos arrendamientos. Consulte Ejemplos de políticas y el blog Políticas en Oracle Cloud Infrastructure (OCI) Data Integration para identificar las políticas que se ajustan a sus necesidades.

  • Después de agregar componentes de IAM (por ejemplo, grupos dinámicos y sentencias de política), no intente realizar las tareas asociadas inmediatamente. Las nuevas políticas de IAM requieren entre cinco y 10 minutos para que se apliquen.