Raccolta dallo storage degli oggetti Oracle

La raccolta è un processo che estrae i metadati tecnici dagli asset di dati nel Data Catalog. Un asset dati rappresenta un'origine dati. Ad esempio: un database, un'area di memorizzazione degli oggetti, un'area di memorizzazione di file o documenti, una coda di messaggi o un'applicazione.

In questa esercitazione:

  1. Consenti a Data Catalog di accedere a qualsiasi oggetto nello storage degli oggetti Oracle, in qualsiasi bucket, in qualsiasi compartimento all'interno della tenancy in cui viene creato il criterio.
  2. Creare un asset dati dello storage degli oggetti Oracle.
  3. Aggiungere una connessione predefinita per l'asset dati.
  4. Raccogliere l'asset dati eseguendo immediatamente il job di raccolta.
Importante

È possibile raccogliere i file di storage degli oggetti come entità dati logiche.

Informazioni preliminari

Per eseguire correttamente questa esercitazione, è necessario disporre dei seguenti elementi:

1. Crea un criterio di accesso

È possibile creare un criterio per consentire a Data Catalog di accedere alle risorse di storage degli oggetti.

È necessario disporre almeno dell'autorizzazione READ per tutti i singoli tipi di risorsa objectstorage-namespaces, buckets e objects oppure per il tipo di risorsa aggregata di storage degli oggetti object-family.

Per creare un criterio di accesso per concedere l'autorizzazione READ al tipo di risorsa aggregata di storage degli oggetti object-family, effettuare le operazioni riportate di seguito.

  1. Aprire il menu di navigazione e selezionare Identità e sicurezza. In Identità selezionare Criteri.
  2. Nella pagina Criteri, fare clic su Crea criterio.
  3. Nel pannello Crea criterio, immettere i dettagli riportati di seguito.
    • Nome: immettere un nome univoco per il criterio. Il nome deve essere univoco in tutti i criteri nella tenancy. Impossibile modificare il nome in un secondo momento. Ad esempio, data-catalog-dynamic-group.
    • Descrizione: immettere una descrizione, ad esempio Concedi l'accesso alle risorse di storage degli oggetti in qualsiasi compartimento della tenancy.
    • Compartimento: selezionare un compartimento in cui si desidera creare il criterio.
    • Costruzione guidata criteri: in questa sezione, spostare il dispositivo di scorrimento in Mostra editor manuale e immettere la regola dei criteri. Ad esempio, per il gruppo dinamico data-catalog-dynamic-group, immettere la regola dei criteri seguente:
      allow dynamic-group data-catalog-dynamic-group to read object-family in tenancy
      Nota

      Questo criterio consente l'accesso a qualsiasi oggetto, in qualsiasi bucket, in qualsiasi compartimento all'interno della tenancy in cui viene creato il criterio. Per altri esempi, vedere Esempi di criteri.
  4. Fare clic su Crea.
Creazione del criterio riuscita per consentire a Data Catalog di accedere a tutte le risorse dello storage degli oggetti Oracle.

2. Creare un asset dati

Ora puoi registrare le origini dati dello storage degli oggetti Oracle con Data Catalog come asset dati .

Per creare un asset dati dello storage degli oggetti Oracle, effettuare le operazioni riportate di seguito.

  1. Aprire il menu di navigazione e selezionare Analytics e AI. In Data Lake selezionare Data Catalog.
  2. Fare clic sull'istanza del Data Catalog in cui si desidera creare l'asset dati.
  3. Nella home page dell'istanza di Data Catalog fare clic su Crea asset dati nella casella Azioni rapide.
    Nota

    Dopo aver creato un'istanza di Data Catalog, quando si accede per la prima volta alla scheda Home, viene visualizzato il pulsante Crea asset dati nella casella Asset dati.
  4. Nel pannello Crea asset dati, immettere i dettagli come descritto nella tabella riportata di seguito.
    Campo descrizione;
    Nome

    Immettere un nome per identificare in modo univoco l'asset dati. In seguito sarà possibile modificare il nome.

    Non è possibile utilizzare i seguenti caratteri speciali nel nome:

    & < > " ' / \ = ;

    Nome è un campo in cui è possibile eseguire ricerche in Data Catalog.

    descrizione; Specificare la necessità o lo scopo per la creazione di questo asset dati.
    Digita Selezionare Oracle Object Storage.
    URL Immettere l'URI Swift per la risorsa Oracle Object Storage nel seguente formato: https://swiftobjectstorage.<region-identifier>.oraclecloud.com

    Ad esempio:

    https://swiftobjectstorage.us-phoenix-1.oraclecloud.com/
    Spazio di nomi Immettere lo spazio di nomi dello storage degli oggetti per la risorsa Oracle Cloud Infrastructure Object Storage specificata.

    Per visualizzare la stringa dello spazio di nomi dello storage degli oggetti nella console, nel menu Profilo fare clic su Tenancy:<your_tenancy_name>. Lo spazio di nomi viene elencato in Impostazioni dello storage degli oggetti.

  5. Fare clic su Crea.
Creazione di un asset dati dello storage degli oggetti Oracle riuscita.

3. Aggiungere una connessione

Dopo aver creato l'asset dati dello storage degli oggetti Oracle, è possibile creare una connessione per l'asset dati.

Per aggiungere una connessione per l'asset dati dello storage degli oggetti Oracle, attenersi alla procedura riportata di seguito.

  1. Nella scheda Home fare clic su Asset dati.
  2. Nell'elenco Asset dati selezionare l'asset dati dello storage degli oggetti Oracle creato.
  3. Nella scheda Riepilogo della pagina Dettagli asset dati, in Informazioni connessione, fare clic su Aggiungi connessione.
  4. Nel pannello Aggiungi connessione, immettere i dettagli come descritto nella tabella riportata di seguito.
    Campo descrizione;
    Nome Immettere un nome univoco per la connessione.
    descrizione; Immettere una breve descrizione della connessione.
    Digita Selezionare una delle seguenti opzioni:
    • Principal risorsa: il principal risorsa è il tipo di connessione consigliato. Prima di creare una connessione al principal risorsa per l'asset dati dello storage degli oggetti Oracle, è necessario creare un criterio per consentire a Data Catalog di accedere alla risorsa dello storage degli oggetti.
    • Richiesta preautenticata: selezionare questo tipo di connessione per raccogliere un bucket di storage degli oggetti pubblico o privato per il quale si ha accesso tramite una richiesta preautenticata. Quando si seleziona questo tipo di connessione, viene visualizzato il campo URL richiesta preautenticata: immettere l'URL della richiesta preautenticata per accedere al bucket di storage degli oggetti. Per ulteriori informazioni sull'uso di questo tipo di connessione, vedere Utilizzo delle richieste preautenticate.
    Area OCI Immettere l'identificativo dell'area per la risorsa di storage degli oggetti.

    Per visualizzare l'identificativo dell'area personale nella console, nel menu Profilo fare clic su Tenancy: <your_tenancy_name>. Nel banner di informazioni Gestisci aree fare clic su Gestisci aree. Vengono elencati i nomi e gli identificativi delle aree.

    Compartimento Selezionare il compartimento per la risorsa di storage degli oggetti in uso.

    Per visualizzare il compartimento, nella console aprire il menu di navigazione, fare clic su Identità e sicurezza. In Identità fare clic su Compartimenti. Fare clic sul collegamento del compartimento per la risorsa di storage degli oggetti. Nella pagina Dettagli compartimento, copiare l'OCID nella scheda Informazioni compartimento.

    Impostare come connessione predefinita per l'asset dati. Selezionare questa casella di controllo per impostare questa connessione come connessione predefinita per l'asset dati.
    Verifica connessione Fare clic sul pulsante per eseguire il test della connessione.
  5. Fare clic su Aggiungi.

4. Raccogliere l'asset di dati

Ora puoi raccogliere l'asset dati dello storage degli oggetti Oracle.

Per raccogliere l'asset dati dello storage degli oggetti Oracle, effettuare le operazioni riportate di seguito.

  1. Nella pagina dei dettagli dell'asset dati, fare clic su Carica.
    Viene visualizzata la pagina Seleziona connessione con la connessione predefinita selezionata.
  2. Fare clic su Successivo.
    Viene visualizzata la pagina Seleziona entità dati.
  3. Nella sezione Bucket disponibile, aggiungere le entità dati che si desidera raccogliere. Per aggiungere un'entità dati, fare clic sull'icona Aggiungi accanto ad essa. Per raccogliere tutte le entità dati, fare clic su Aggiungi tutto.
    Le altre operazioni che è possibile eseguire in questa pagina sono le seguenti:
    • Per trovare un'entità dati dalle entità dati disponibili, utilizzare la casella Bucket filtro/entità dati.
    • Utilizzare le icone di navigazione della pagina per sfogliare tutte le entità dati.
    • Per rimuovere un'entità dati selezionata dal job di raccolta, fare clic sull'icona di rimozione accanto all'entità dati.
    • Per rimuovere tutte le entità dati selezionate, fare clic su Rimuovi tutto.
  4. Fare clic su Successivo.
    Viene visualizzata la pagina Crea job.
  5. In questa pagina effettuare le operazioni riportate di seguito.
    1. Nome job: immettere un nome univoco per identificare il job di raccolta.
    2. Descrizione job: immettere una descrizione.
    3. Raccolta incrementale: selezionare questa casella di controllo se si desidera che le esecuzioni successive di questo job di raccolta raccolgano solo le entità dati che sono state modificate dalla prima esecuzione del job di raccolta.
    4. Includi file non riconosciuti: selezionare questa casella di controllo per raccogliere un'entità dati logica composta solo da file archiviati o da qualsiasi altro file non supportato in Data Catalog. Ad esempio, .log, .txt, .sh, .jar e .pdf.
    5. Includi solo file corrispondenti: selezionare questa casella di controllo se si desidera che Data Catalog raccolga solo i file che corrispondono ai pattern di nomi file assegnati. Quando si seleziona questa casella di controllo, i file che non corrispondono ai pattern di nomi file assegnati vengono ignorati durante la raccolta. Sono stati aggiunti al conteggio ignorato.
    6. Ora di esecuzione: in questa sezione, selezionare una delle seguenti opzioni:
      • Esegui job ora: crea un job di raccolta e lo esegue immediatamente.
      • Pianifica esecuzione job: visualizza altri campi per pianificare il job di raccolta. Immettere un nome e una descrizione per la pianificazione. Specificare la frequenza di esecuzione del job. Le tue scelte sono orarie, giornaliere, settimanali e mensili. Infine, selezionare l'ora di inizio e di fine per il job.
      • Salva configurazioni job per uso futuro: crea un job per la raccolta dell'asset dati, ma il job non viene eseguito. È possibile eseguire o pianificare il job nella pagina Job in un secondo momento.
  6. Fare clic su Create Job.
    Creazione del job per la raccolta dell'asset dati dello storage degli oggetti Oracle riuscita. Il job viene elencato nella pagina Job.
Raccolta dell'asset dati riuscita a seconda della pianificazione selezionata. È possibile rivedere i dettagli del job di raccolta facendo clic sul nome del job nella pagina Job.