Ricevi notifiche per gli eventi di raccolta Data Catalog

In questa esercitazione è possibile impostare il servizio Oracle Cloud Infrastructure Events per l'invio di un messaggio di posta elettronica ogni volta che un job di raccolta Data Catalog inizia, riesce o non riesce in un compartimento specifico. I task chiave includono come:

  • Crea argomenti e sottoscrizioni.
  • Scrivere regole per ricevere notifiche via e-mail per gli eventi.
  • Crea bucket con dati.
  • Raccogliere i dati in Data Catalog.

Informazioni preliminari

Per eseguire correttamente questa esercitazione, è necessario che:

Se si dispone di diritti amministrativi per l'account, saltare il resto di questa sezione. In caso contrario, chiedere all'amministratore di aggiungere il criterio seguente all'account:
allow group <the-group-your-username-belongs> to manage all-resources in compartment catalog-compartment

Per ulteriori esempi, vedere Policy comuni.

Nota

Nella sezione successiva, è possibile creare un compartimento per le istanze del Data Catalog, denominato catalog-compartment.

1. Impostazione di una notifica

In questa sezione è possibile impostare il servizio Notifiche per registrare la posta elettronica per una sottoscrizione personalizzata. Successivamente, utilizzi questa sottoscrizione per ricevere notifiche nel tuo account di posta elettronica.

Crea un compartimento

Creare un compartimento per le istanze, gli eventi e le notifiche di Data Catalog.

  1. Aprire il menu di navigazione e selezionare Identità e sicurezza. In Identità selezionare Compartimenti.
  2. Selezionare Crea compartimento.
  3. Inserire le seguenti informazioni:
    • Nome: catalog-compartment
    • Descrizione: Compartment for data catalogs.
    • Compartimento padre: <your-tenancy>(root)
  4. Selezionare Crea compartimento.

Creazione di un compartimento per le risorse del Data Catalog riuscita.

Creare un argomento
  1. Apri il menu di navigazione e seleziona Servizi per sviluppatori. In Integrazione applicazione, selezionare Notifiche.
  2. Nel pannello più a sinistra, per Compartimento, selezionare catalog-compartment.
    Aggiornare la navigazione più a sinistra se la sezione Compartimento non contiene l'elenco catalog-compartment.
    Nota

    Assicurarsi di selezionare questo compartimento per tutte le risorse create in questa esercitazione.
  3. Selezionare Crea argomento.
  4. Inserire le seguenti informazioni:
    • Nome: catalog-topic
    • Descrizione: Topic for data catalog harvest events.
  5. Selezionare Crea.
Creazione di un argomento per le notifiche riuscita.
Creazione di una sottoscrizione
  1. Nell'elenco degli argomenti del servizio Notifiche selezionare catalog-topic.
  2. Selezionare Crea sottoscrizione.
  3. Inserire le seguenti informazioni:
    • Protocollo: e-mail
    • E-mail: <your-email>
  4. Selezionare Crea.
  5. Controlla il tuo account e-mail per una e-mail con l'oggetto, noreply@notification.<your-region>.oci.oraclecloud.com
  6. Selezionare il collegamento Conferma sottoscrizione nel messaggio e-mail.
    Viene visualizzata una pagina nel browser con il messaggio:

    È stata eseguita la sottoscrizione a <your-email> all'argomento: argomento catalogo.

  7. Nella console, attendere che lo stato della sottoscrizione passi da in sospeso a attivo.
Creazione della sottoscrizione e-mail per l'argomento riuscita.

2. Impostazione di una regola evento

In questa sezione, è possibile impostare una regola nel servizio Eventi per l'invio di un messaggio di posta elettronica ogni volta che un job di raccolta viene avviato, eseguito correttamente o non riesce nel compartimento.

Creare una regola
  1. Aprire il menu di navigazione e selezionare Osservabilità e gestione. In Servizio eventi, selezionare Regole.
  2. Selezionare Crea regola.
  3. Inserire le seguenti informazioni:
    • Nome visualizzato: catalog-harvest-rule
    • Descrizione: Receive an email when a harvest job starts, succeeds or fails in the catalog-compartment.
    • Condizioni delle regole:
      • Condizione: tipo di evento
      • Nome servizio: Data Catalog
      • Tipo di evento: raccolta - Inizio
      • Tipo di evento: raccolta - fine
      Nota

      Assicurarsi di selezionare sia Harvest-Begin che Harvest-End.
  4. Selezionare + Altra condizione.
  5. Inserire le seguenti informazioni:
    • Condizioni delle regole:
      • Condizione: attributo
      • Nome attributo: CompartmentName
      • Valori attributo: catalog-compartment

    La Logica regola viene popolata automaticamente:

    MATCH event WHERE (
    eventType EQUALS ANY OF (
    com.oraclecloud.datacatalog.harvestjob.end,
    com.oraclecloud.datacatalog.harvestjob.begin
    )
    AND (
    compartmentName MATCHES ANY OF (
    laleh-catalog-compartment
    )
    )
    )
  6. Nella sezione Azioni, immettere le informazioni riportate di seguito.
    • Tipo di azione: notifiche
    • Compartimento Notifiche: catalog-compartment
    • Argomento: catalog-topic
  7. Selezionare Crea regola.
Creazione di una regola evento per i job di raccolta Data Catalog riuscita.

3. Creare un bucket con i dati

In questa sezione, puoi creare un bucket nel servizio di storage degli oggetti. Successivamente, aggiungi i dati al bucket.

Creare un bucket

Creare un bucket nel servizio di storage degli oggetti.

  1. Aprire il menu di navigazione e selezionare Memorizzazione. In Storage degli oggetti e storage di archivio selezionare Bucket.
  2. Selezionare Crea bucket.
  3. Inserire le seguenti informazioni:
    • Nome: bucket-catalogo
    • Lasciare il valore predefinito per altri campi.
  4. Selezionare Crea bucket.
Creazione di un bucket per i dati riuscita.
Aggiungi dati al bucket
  1. Nel servizio Storage degli oggetti, nella lista dei bucket, selezionare catalog-bucket.
  2. Selezionare Carica.
  3. Selezionare le due immagini preparate nella sezione Procedure preliminari.
  4. Selezionare Carica, quindi Chiudi.
    Le due immagini vengono visualizzate nella lista di Oggetti.
Aggiunta dei dati al bucket riuscita.
Concedi accesso a Data Catalog al bucket
In questa sezione, si fornisce al servizio Data Catalog l'accesso alle risorse di storage degli oggetti in catalog-compartment. Questo criterio consente alle istanze di Data Catalog di scaricare i metadati da catalog-bucket.
  1. Aprire il menu di navigazione e selezionare Identità e sicurezza. In Identità selezionare Criteri.
  2. Selezionare Crea criterio.
  3. Inserire le seguenti informazioni:
    • Nome: catalog-policy
    • Descrizione: Allow Data Catalog to access Object Storage resources.
    • Nella sezione Costruzione guidata criteri, selezionare Personalizza (Avanzate).
  4. Incollare il seguente criterio nella Costruzione guidata criteri:
    allow service datacatalog to read object-family in compartment catalog-compartment
  5. Selezionare Crea.
Creazione di un criterio per Data Catalog per accedere alle risorse di storage degli oggetti, inclusi i bucket, riuscita.

4. Raccogli il bucket

In questa sezione è possibile creare un'istanza di Data Catalog. Successivamente, connetti l'istanza del Data Catalog al bucket e raccogli i metadati dal bucket. Infine, è possibile rivedere le notifiche e-mail per i job di raccolta.

Raccogliere le informazioni necessarie

Preparare le informazioni necessarie e copiarle in un blocco note.

Raccogliere le seguenti informazioni dalla console:

  • ID compartimento: <compartment-ocid>
    • Nella barra di ricerca della console, immettere catalog-compartment.
    • Selezionare catalog-compartment nei risultati della ricerca.
    • Copiare l'OCID.
  • Area (OCI): <region-identifier>
    • Dalla barra di navigazione superiore, trovare <your-region>. Esempio: US West (Phoenix).
    • Sulla barra di navigazione in alto, andare all'icona Profilo e selezionare Tenancy: <your tenancy>.
    • Selezionare Gestisci aree.
    • Nell'elenco delle aree, trovare <region-identifier> per <your-region>. Esempio: us-phoenix-1.
  • URL: <object-storage-swift-URI>
    • Copiare la stringa seguente:
      https://swiftobjectstorage.<region-identifier>.oraclecloud.com
    • Sostituire <region-identifier> con le informazioni raccolte per l'area.
  • Spazio di nomi: <object-storage-namespace>
    • Nella barra di navigazione in alto, andare all'icona Profilo e selezionare Tenancy: <your tenancy>.
    • Copiare il valore per Spazio di nomi dello storage degli oggetti.
Creare un'istanza di Data Catalog
  1. Aprire il menu di navigazione e selezionare Analytics e AI. In Data Lake selezionare Data Catalog.
  2. Selezionare Crea Data Catalog.
  3. Inserire le seguenti informazioni:
    • Crea nel compartimento: catalog-compartment
    • Nome: catalog-instance-1
    • Lasciare il valore predefinito per altri campi.
  4. Selezionare Crea Data Catalog.
Creazione di un'istanza di Data Catalog riuscita.
Crea un asset dati
  1. Nel servizio Data Catalog selezionare catalog-instance-1 nell'elenco delle istanze di Data Catalog.
  2. Nella casella Azioni rapide selezionare Crea asset dati.
  3. Inserire le seguenti informazioni:
    • Nome: object-storage-data-asset
  4. Per Tipo, selezionare Storage oggetti Oracle
  5. Utilizzare le informazioni della sezione Raccogliere informazioni obbligatorie per i campi riportati di seguito.
    • URL: https://swiftobjectstorage.<region-identifier>.oraclecloud.com
    • Spazio di nomi: <object-storage-namespace>
  6. Selezionare Crea.
Creazione di un asset dati nell'istanza del Data Catalog riuscita.
Connetti a bucket
Connettere catalog-bucket a catalog-instance-1.
  1. Nella Home page di catalog-instance-1, andare alla casella Aggiornato di recente e selezionare object-storage-data-asset.
  2. In Connessioni, selezionare Aggiungi connessione.
  3. Inserire le seguenti informazioni:
    • Nome: catalog-bucket-connection
  4. Per Tipo, selezionare S2S Principal
  5. Utilizzare le informazioni della sezione Raccogliere informazioni obbligatorie per i campi riportati di seguito.
    • Area OCI: <region-identifier>
    • OCID compartimento: <compartment-ocid>
  6. Selezionare Impostare come connessione predefinita per l'asset dati.
  7. Selezionare Test connessione.
  8. Selezionare Aggiungi.
Connessione di un bucket all'istanza del Data Catalog riuscita.
Raccogliere il secchio
  1. Nella Home page di catalog-instance-1, andare alla casella Aggiornato di recente e selezionare object-storage-data-asset.
  2. Selezionare Raccolta.
  3. Per Selezionare un passo di connessione, selezionare catalog-bucket-connection, quindi selezionare Successivo.
  4. Nel passo Seleziona entità dati, effettuare le operazioni riportate di seguito.
    • Visualizzare il contenuto del bucket: selezionare catalog-bucket.
    • Aggiungere i metadati per tutte le immagini al catalogo: selezionare Aggiungi tutto.
    • Selezionare Next.
  5. Compilare o selezionare i seguenti campi:
    • Nome job: harvest-catalog-bucket
    • Includi file non riconosciuti: selezionato
    • Lasciare il valore predefinito per altri campi.
  6. Selezionare Crea job.
  7. Selezionare il job harvest-catalog-bucket.
  8. Confermare il seguente riepilogo:
    • Stato: Succeeded
    • Entità dati raccolte: 2
    • File raccolti non riconosciuti: 2 (le immagini sono file non riconosciuti).
Creazione riuscita di un job di raccolta per il bucket nell'istanza del Data Catalog.
Rivedi la tua email
  1. Controlla il tuo account email per un'email con il seguente oggetto:

    OCI Event Notification :com.oraclecloud.datacatalog.harvestjob.begin

  2. Rivedere il contenuto dell'e-mail.

    Da: noreply@notification.<region-identifier>.oci.oraclecloud.com

    Corpo del messaggio di posta elettronica di esempio:

    {
      "eventType" : "com.oraclecloud.datacatalog.harvestjob.end",
      "cloudEventsVersion" : "0.1",
      "eventTypeVersion" : "2.0",
      "source" : "DataCatalog",
      "eventTime" : "<time-harvest-job-began>",
      "contentType" : "application/json",
      "data" : {
        "compartmentId" : "ocid1.compartment.oc1..aaaaxxxx",
        "compartmentName" : "catalog-compartment",
        "resourceName" : "",
        "resourceId" : "ocid1.datacatalog.oc1.iad.aaaaxxxx",
        "additionalDetails" : {
          "harvestStatus" : "IN_PROGRESS",
          "dataAssetKey" : "<data-asset-key>",
          "dataAssetName" : "object-storage-data-asset",
          "connectionKey" : "<connection-key",
          "jobKey" : "<job-key>",
          "jobUrl" : "",
          "jobDefinitionKey" : "<job-definition-key>",
          "connectionName" : "catalog-bucket-connection",
          "jobDefinitionName" : "harvest-catalog-bucket",
          "jobExecutionKey" : "<job-execution-key>"
        }
      },
      "eventID" : "<event-ocid>",
      "extensions" : {
        "compartmentId" : "ocid1.compartment.oc1..aaaaxxxx"
      }
    }
    
  3. Trovare il valore per "harvestStatus".
    "harvestStatus" : "IN_PROGRESS"
  4. Controlla il tuo account email per un'email con l'oggetto:
    OCI Event Notification :com.oraclecloud.datacatalog.harvestjob.end
  5. Rivedere il contenuto dell'e-mail.

    Da: noreply@notification.<region-identifier>.oci.oraclecloud.com

    Corpo del messaggio di posta elettronica di esempio:

    {
      "eventType" : "com.oraclecloud.datacatalog.harvestjob.end",
      "cloudEventsVersion" : "0.1",
      "eventTypeVersion" : "2.0",
      "source" : "DataCatalog",
      "eventTime" : "<time-harvest-job-ended>",
      "contentType" : "application/json",
      "data" : {
        "compartmentId" : "ocid1.compartment.oc1..aaaaxxxx",
        "compartmentName" : "catalog-compartment",
        "resourceName" : "",
        "resourceId" : "ocid1.datacatalog.oc1.iad.aaaaxxxx",
        "additionalDetails" : {
          "harvestStatus" : "SUCCEEDED",
          "dataAssetKey" : "<data-asset-key>",
          "dataAssetName" : "object-storage-data-asset",
          "connectionKey" : "<connection-key",
          "jobKey" : "<job-key>",
          "jobUrl" : "",
          "jobDefinitionKey" : "<job-definition-key>",
          "connectionName" : "catalog-bucket-connection",
          "jobDefinitionName" : "harvest-catalog-bucket",
          "jobExecutionKey" : "<job-execution-key>"
        }
      },
      "eventID" : "<event-ocid>",
      "extensions" : {
        "compartmentId" : "ocid1.compartment.oc1..aaaaxxxx"
      }
    }
    
  6. Trovare il valore per "harvestStatus".
    "harvestStatus" : "SUCCEEDED"
    Stato completato:
    Nota

    Il valore "harvestStatus" per un evento harvestjob.begin è "IN_PROGRESS" e per un evento harvestjob.end è "SUCCEEDED" o "FAILED".