Creazione di un task di integrazione

Creare un task di integrazione in un progetto o in una cartella in Data Integration. Un task di integrazione consente di eseguire un flusso di dati di Data Integration e configurare i valori dei parametri che si desidera utilizzare in fase di esecuzione.

Data Integration include un progetto predefinito per iniziare. Per creare un progetto o una cartella personale, vedere Progetti e cartelle. Un task di integrazione in un progetto o in una cartella può fare riferimento a un flusso di dati da qualsiasi progetto o cartella nella stessa area di lavoro.

In Data Integration, per impostazione predefinita è possibile eseguire contemporaneamente o in parallelo un task in un determinato momento. Per non consentire esecuzioni di task concorrenti avviate manualmente, selezionare la casella di controllo Disabilita esecuzione simultanea del task quando si crea il task. Quando le esecuzioni simultanee dei task non sono consentite, una richiesta di esecuzione per il task non riesce se è già in corso un'esecuzione del task con stato non finale.

Per aggiornare la configurazione di esecuzione di un task in modo che utilizzi il servizio OCI Data Flow, assicurarsi di aver già creato le risorse dei prerequisiti, ad esempio i bucket di storage degli oggetti e i pool di flussi di dati, come descritto in Impostazione e criteri obbligatori per il servizio OCI Data Flow per l'esecuzione dei task.

    1. Aprire il progetto o la cartella in cui si desidera creare il task.

      Per la procedura di apertura della pagina dei dettagli di un progetto o di una cartella, vedere Visualizzazione dei dettagli di un progetto o Visualizzazione dei dettagli di una cartella.

    2. Nella pagina dei dettagli del progetto o della cartella, fare clic su Task.
    3. Nella sezione Task, fare clic su Crea task e selezionare Integrazione.
    4. Nella pagina Crea task di integrazione, immettere le informazioni di base riportate di seguito.
      1. Nei campi Nome e Identificativo, immettere i valori desiderati oppure lasciare che Data Integration inserisca automaticamente i valori, in base al nome del flusso di dati selezionato per questo task (nel passo successivo).

        Se si desidera che Data Integration compili automaticamente i campi, non modificare o inserire valori prima di selezionare un flusso di dati. È possibile modificare i valori dopo che i campi sono stati popolati con valori basati sul nome del flusso dati selezionato.

        In entrambi i casi, l'identificativo è un valore generato dal sistema in base al nome. È possibile modificare il valore, ma dopo aver creato e salvato il task, non è possibile aggiornare l'identificativo.

      2. (Facoltativo) Immettere una descrizione per il task.
      3. Selezionare la casella di controllo Disabilita esecuzione simultanea del task se si desidera non consentire esecuzioni concorrenti di questo task.
      4. (Facoltativo) Per Progetto o cartella, fare clic su Seleziona e selezionare un progetto o una cartella diversi in cui salvare il task.
    5. Nella sezione Flusso di dati, fare clic su Seleziona e selezionare il flusso di dati eseguito da questo task effettuando le operazioni riportate di seguito.
      1. Nel pannello Selezionare un flusso di dati eseguire una delle azioni riportate di seguito.
        • Selezionare un flusso di dati salvato nel progetto o nella cartella in cui si sta lavorando.
        • Per selezionare un flusso di dati salvato in un altro progetto o cartella, fare clic su Seleziona accanto al nome del progetto o della cartella corrente. Nel pannello Seleziona progetto o cartella visualizzato, selezionare il progetto o la cartella e fare clic su Seleziona. Selezionare quindi il flusso di dati dalla lista dei flussi di dati disponibili.
      2. Fare clic su Seleziona.

        Integrazione dati inizia la convalida del flusso di dati selezionato e si torna alla pagina Crea task di integrazione.

        Se nel flusso di dati sono presenti errori o avvertenze, fare clic sul nome del flusso di dati per aprirlo in una nuova scheda. Risolvere gli errori o le avvertenze e salvare il flusso di dati. Quando si torna alla pagina Crea task di integrazione, Data Integration convalida automaticamente il flusso di dati.

    6. Per salvare l'attività per la prima volta, fare clic su uno dei seguenti pulsanti:
      • Crea: crea e salva il task. È possibile continuare a creare e modificare il task.

      • Crea e chiudi: crea e salva il task, chiude la pagina e torna all'elenco dei task nella pagina dei dettagli del progetto o della cartella.

    7. Salvare periodicamente mentre si lavora facendo clic su uno dei seguenti pulsanti:
      • Salva: esegue il commit delle modifiche dall'ultimo salvataggio. È possibile continuare a modificare dopo il salvataggio.

      • Salva e chiudi: esegue il commit delle modifiche, chiude la pagina e torna all'elenco dei task nella pagina dei dettagli del progetto o della cartella.

      • Salva con nome: esegue il commit delle modifiche (dall'ultimo salvataggio) e le salva in una copia invece di sovrascrivere il task corrente. È possibile fornire un nome per la copia e selezionare un progetto o una cartella diversi per la copia oppure salvare la copia nello stesso progetto o cartella del task esistente.

    8. Nella sezione Esegui configurazione, effettuare una delle operazioni riportate di seguito.
      • Per impostazione predefinita, tutti i task creati in Data Integration sono configurati per l'esecuzione nel servizio OCI Data Integration, come indicato dall'etichetta Servizio di esecuzione task: servizio OCI Data Integration. Non è necessario eseguire ulteriori operazioni di configurazione. Vai al passo 10.

      • Per eseguire questo task nel servizio OCI Data Flow, fare clic su Modifica.

        Nota

        Assicurarsi di aver già creato le risorse e i criteri necessari per l'utilizzo del servizio OCI Data Flow. Vedere Impostazione e criteri obbligatori per il servizio OCI Data Flow per l'esecuzione dei task.

        Se i prerequisiti sono stati soddisfatti, procedere al passo 9 per aggiornare la configurazione di esecuzione del task e, facoltativamente, utilizzare i parametri per le proprietà di esecuzione.

    9. Nella pagina Aggiorna configurazione esecuzione task, fare clic su Servizio Flusso dati OCI. Quindi completare le seguenti selezioni per aggiornare o parametrizzare le proprietà di esecuzione per OCI Data Flow.

      Questi passi devono essere eseguiti solo dopo aver soddisfatto i task dei prerequisiti come descritto in Impostazione e criteri obbligatori per il servizio OCI Data Flow per l'esecuzione dei task.

      1. Selezionare il pool in OCI Data Flow per eseguire questo task.
      2. (Facoltativo) Selezionare l'endpoint privato in OCI Data Flow.
      3. Per Percorso bucket di log, selezionare il bucket di storage degli oggetti da utilizzare per i log di esecuzione dell'applicazione OCI Data Flow.

        Se si tratta della prima volta che si modifica la configurazione di esecuzione del servizio OCI Data Flow del task, e il bucket dis-df-system-bucket esiste già nello storage degli oggetti, Data Integration seleziona automaticamente tale bucket, come indicato da oci://dis-df-system-bucket@<tenancy-name> nel campo di selezione.

      4. Per il percorso del bucket dell'artifact, selezionare il bucket di storage degli oggetti da utilizzare per gli artifact del job di esecuzione di Data Integration, ad esempio i file JAR e ZIP.

        Se si tratta della prima volta che si modifica la configurazione di esecuzione del servizio OCI Data Flow del task, e il bucket dis-df-system-bucket esiste già nello storage degli oggetti, Data Integration seleziona automaticamente tale bucket, come indicato da oci://dis-df-system-bucket@<tenancy-name> nel campo di selezione.

      5. (Facoltativo) Per il compartimento applicazione, selezionare il compartimento per l'applicazione OCI Data Flow creato quando i task del servizio Data Integration vengono eseguiti nel servizio Data Flow.

        Se non viene specificato un compartimento dell'applicazione, viene utilizzato il compartimento dell'applicazione Data Integration.

      6. Immettere il numero minimo di lavoratori (o esecutori) da utilizzare per i job di OCI Data Flow.

        Il valore predefinito è 1. Se anche il valore per Numero massimo di worker è 1, l'allocazione dinamica per i job di OCI Data Flow non viene utilizzata.

      7. Immettere il numero massimo di lavoratori (o esecutori) da utilizzare per i job di OCI Data Flow.

        L'impostazione predefinita è 1, che indica che l'allocazione dinamica non è utilizzata. Se si desidera utilizzare l'allocazione dinamica per i job di OCI Data Flow, specificare un valore maggiore. Questo valore deve essere maggiore o uguale al valore di Numero minimo di lavoratori.

      8. (Facoltativo) Per le proprietà di configurazione Spark di OCI Data Flow, immettere una o più proprietà Spark da utilizzare per l'esecuzione del task.

        Una proprietà Spark è una coppia chiave-valore. Fare clic su Altra proprietà per aggiungere altre coppie chiave-valore, in base alle esigenze.

        Per le proprietà di configurazione Spark che è possibile aggiungere, vedere Proprietà Spark supportate.

      9. (Facoltativo) Dopo aver configurato qualsiasi proprietà di esecuzione task (passi da 9a a 9h), fare clic su Parametrizza sotto il valore di proprietà configurato per assegnare un parametro a tale proprietà.

        Durante la parametrizzazione, Data Integration aggiunge un parametro di tipo String e imposta il valore del parametro predefinito sul valore attualmente configurato per tale proprietà. Viene visualizzata l'etichetta Parameterizzato seguita dal nome di un parametro. Ad esempio: Parametrizzato: OCI_DF_POOL

        Di seguito sono riportati i nomi dei parametri.

        Proprietà esecuzione task Nome parametro
        Dipartimento di Pool OCI_DF_POOL
        Endpoint privato OCI_DF_PRIVATE_ENDPOINT
        Percorso bucket di log OCI_DF_LOG_BUCKET
        Percorso bucket artifact OCI_DF_ARTIFACT_BUCKET
        Compartimento delle applicazioni OCI_DF_APP_COMPARTMENT
        Numero minimo di worker OCI_DF_MIN_WORKERS
        Numero massimo di worker OCI_DF_MAX_WORKERS
        Configurazione OCI Data Flow personalizzata OCI_DF_CUSTOM_OCI_DF_SPARK_CONFIG

        Le azioni per un parametro sono le seguenti:

        • Fare clic su Modifica per aggiungere o modificare la descrizione di un parametro. Impossibile modificare il nome e il tipo del parametro. Una descrizione del parametro, se aggiunta, viene visualizzata come suggerimento nel pannello per modificare i valori dei parametri in fase di progettazione o runtime.
        • Fare clic su Rimuovi se non si desidera più che una proprietà venga parametrizzata.
      10. Fare clic su Salva.
    10. (Facoltativo) Se nel flusso di dati selezionato vengono assegnati parametri, visualizzare e modificare i valori dei parametri predefiniti effettuando le operazioni riportate di seguito.
      1. Nella sezione Configura parametri fare clic su Configura.
      2. Nella pagina Configura parametri, modificare i valori predefiniti in base alle esigenze.

        Quando si modificano i valori predefiniti, tenere presenti le limitazioni riportate di seguito.

        • Se la strategia di estrazione incrementale per un'origine BICC è configurata per utilizzare una data gestita dal parametro di sistema Data Integration SYS.LAST_LOAD_DATE, non è consentito modificare il valore della data durante la fase di progettazione.

        • Se la strategia di estrazione incrementale per un'origine BICC è configurata per utilizzare una data di ultima estrazione con parametri aggiunti, è possibile modificare il valore della data durante la fase di progettazione e di esecuzione.

        • Se un'entità dati di destinazione con parametri è configurata per utilizzare la strategia Unisci, è possibile modificare la selezione della chiave Unisci.

        • Per un asset dati con parametri che richiede una posizione area intermedia: se si seleziona un asset dati per il quale non è specificata una posizione area intermedia predefinita in tale asset dati, Data Integration visualizza una notifica di avvertenza. Quando viene visualizzata la notifica, scegliere una delle seguenti opzioni:
          • Aggiornare l'asset dati aggiungendo una posizione area intermedia predefinita.
          • Scegliere un asset dati diverso con una posizione area intermedia predefinita.

      3. Fare clic su Configura o Annulla.
        Viene nuovamente visualizzata la pagina Crea task di integrazione.
    11. (Facoltativo) Nella sezione Convalida task, fare clic su Convalida per controllare le configurazioni dei parametri.

      Se vengono visualizzati errori o avvertenze, fare clic su View messages. Risolvere eventuali errori prima di pubblicare il task.

    12. Al termine della configurazione del task, fare clic su Crea e chiudi o su Salva e chiudi.
    Pubblicare il task di integrazione in un'applicazione in Data Integration prima di eseguire il task o pianificarne l'esecuzione. È inoltre possibile pubblicare il task di integrazione in OCI Data Flow, se applicabile. Per informazioni sulla pubblicazione, vedere Pubblicazione dei task.
  • Per creare un task di integrazione, utilizzare il comando oci data-integration task create-integration-task e i parametri necessari:

    oci data-integration task create-integration-task [OPTIONS]

    Per un elenco completo dei flag e delle opzioni variabili per i comandi CLI, vedere Command Line Reference.

  • Eseguire l'operazione CreateTask con il sottotipo di risorsa appropriato per creare un task di integrazione.