Raccolta dallo storage degli oggetti Oracle

La raccolta è un processo che estrae i metadati tecnici dagli asset di dati nel Data Catalog. Un asset dati rappresenta un'origine dati. Ad esempio: un database, un'area di memorizzazione degli oggetti, un'area di memorizzazione di file o documenti, una coda di messaggi o un'applicazione.

In questa esercitazione:

  1. Consenti a Data Catalog di accedere a qualsiasi oggetto nello storage degli oggetti Oracle, in qualsiasi bucket, in qualsiasi compartimento all'interno della tenancy in cui viene creato il criterio.
  2. Creare un asset dati dello storage degli oggetti Oracle.
  3. Aggiungere una connessione predefinita per l'asset dati.
  4. Raccogliere l'asset dati eseguendo immediatamente il job di raccolta.
Importante

È possibile raccogliere i file di storage degli oggetti come entità dati logiche.

Informazioni preliminari

Per eseguire correttamente questa esercitazione, è necessario disporre dei seguenti elementi:

1. Crea un criterio di accesso

È possibile creare un criterio per consentire a Data Catalog di accedere alle risorse di storage degli oggetti.

È necessario disporre almeno dell'autorizzazione READ per tutti i singoli tipi di risorsa objectstorage-namespaces, buckets e objects oppure per il tipo di risorsa aggregata di storage degli oggetti object-family.

Per creare un criterio di accesso per concedere l'autorizzazione READ al tipo di risorsa aggregata di storage degli oggetti object-family, effettuare le operazioni riportate di seguito.

  1. Aprire il menu di navigazione e selezionare Identità e sicurezza. In Identità selezionare Criteri.
  2. Nella pagina Criteri selezionare Crea criterio.
  3. Nel pannello Crea criterio, immettere i dettagli riportati di seguito.
    • Nome: immettere un nome univoco per il criterio. Il nome deve essere univoco in tutti i criteri nella tenancy. Impossibile modificare il nome in un secondo momento. Ad esempio, data-catalog-dynamic-group.
    • Descrizione: immettere una descrizione, ad esempio Concedi l'accesso alle risorse di storage degli oggetti in qualsiasi compartimento della tenancy.
    • Compartimento: selezionare un compartimento in cui si desidera creare il criterio.
    • Costruzione guidata criteri: in questa sezione, spostare il dispositivo di scorrimento in Mostra editor manuale e immettere la regola dei criteri. Ad esempio, per il gruppo dinamico data-catalog-dynamic-group, immettere la regola dei criteri seguente:
      allow dynamic-group data-catalog-dynamic-group to read object-family in tenancy
      Nota

      Questo criterio consente l'accesso a qualsiasi oggetto, in qualsiasi bucket, in qualsiasi compartimento all'interno della tenancy in cui viene creato il criterio. Per altri esempi, vedere Esempi di criteri.
  4. Fare clic su Crea.
Creazione del criterio riuscita per consentire a Data Catalog di accedere a tutte le risorse dello storage degli oggetti Oracle.

2. Creare un asset dati

Ora puoi registrare le origini dati dello storage degli oggetti Oracle con Data Catalog come asset dati .

Per creare un asset dati dello storage degli oggetti Oracle, effettuare le operazioni riportate di seguito.

  1. Aprire il menu di navigazione e selezionare Analytics e AI. In Data Lake selezionare Data Catalog.
  2. Fare clic sull'istanza del Data Catalog in cui si desidera creare l'asset dati.
  3. Nella home page dell'istanza di Data Catalog selezionare Crea asset dati nella casella Azioni rapide.
    Nota

    Dopo aver creato un'istanza di Data Catalog, quando si accede per la prima volta alla scheda Home, viene visualizzato il pulsante Crea asset dati nella casella Asset dati.
  4. Nel pannello Crea asset dati, immettere i dettagli come descritto nella tabella riportata di seguito.
    Campo descrizione;
    Nome

    Immettere un nome per identificare in modo univoco l'asset dati. In seguito sarà possibile modificare il nome.

    Non è possibile utilizzare i seguenti caratteri speciali nel nome:

    & < > " ' / \ = ;

    Nome è un campo in cui è possibile eseguire ricerche in Data Catalog.

    descrizione; Specificare la necessità o lo scopo per la creazione di questo asset dati.
    Digita Selezionare Oracle Object Storage.
    URL Immettere l'URI Swift per la risorsa Oracle Object Storage nel seguente formato: https://swiftobjectstorage.<region-identifier>.oraclecloud.com

    Ad esempio:

    https://swiftobjectstorage.us-phoenix-1.oraclecloud.com/
    Spazio di nomi Immettere lo spazio di nomi dello storage degli oggetti per la risorsa Oracle Cloud Infrastructure Object Storage specificata.

    Per visualizzare la stringa dello spazio di nomi dello storage degli oggetti nella console, selezionare Tenancy:<your_tenancy_name> dal menu Profilo. Lo spazio di nomi è elencato in Impostazioni di storage degli oggetti.

  5. Fare clic su Crea.
Creazione di un asset dati dello storage degli oggetti Oracle riuscita.

3. Aggiungere una connessione

Dopo aver creato l'asset dati dello storage degli oggetti Oracle, è possibile creare una connessione per l'asset dati.

Per aggiungere una connessione per l'asset dati dello storage degli oggetti Oracle, attenersi alla procedura riportata di seguito.

  1. Nella scheda Home selezionare Asset dati.
  2. Nell'elenco Asset dati selezionare l'asset dati dello storage degli oggetti Oracle creato.
  3. Nella scheda Riepilogo della pagina dei dettagli dell'asset dati, in Informazioni connessione, selezionare Aggiungi connessione.
  4. Nel pannello Aggiungi connessione, immettere i dettagli come descritto nella tabella riportata di seguito.
    Campo descrizione;
    Nome Immettere un nome univoco per la connessione.
    descrizione; Immettere una breve descrizione della connessione.
    Digita Selezionare una delle seguenti opzioni:
    • Principal risorsa: il principal risorsa è il tipo di connessione consigliato. Prima di creare una connessione al principal risorsa per l'asset dati dello storage degli oggetti Oracle, è necessario creare un criterio per consentire a Data Catalog di accedere alla risorsa dello storage degli oggetti.
    • Richiesta preautenticata: selezionare questo tipo di connessione per raccogliere un bucket di storage degli oggetti pubblico o privato per il quale si ha accesso tramite una richiesta preautenticata. Quando si seleziona questo tipo di connessione, viene visualizzato il campo URL richiesta preautenticata: immettere l'URL della richiesta preautenticata per accedere al bucket di storage degli oggetti. Per ulteriori informazioni sull'uso di questo tipo di connessione, vedere Utilizzo delle richieste preautenticate.
    Area OCI Immettere l'identificativo dell'area per la risorsa di storage degli oggetti.

    Per visualizzare l'identificativo dell'area nella console, selezionare Tenancy: <your_tenancy_name> dal menu Profilo. Nel banner informazioni Gestisci aree selezionare Gestisci aree. Vengono elencati i nomi e gli identificativi dell'area.

    Compartimento Selezionare il compartimento per la risorsa di storage degli oggetti in uso.

    Per visualizzare il compartimento, nella Console aprire il menu di navigazione, selezionare Identità e sicurezza. In Identità, selezionare Compartimenti. Fare clic sul collegamento del compartimento per la risorsa di storage degli oggetti. Nella pagina Dettagli compartimento, copiare l'OCID nella scheda Informazioni compartimento.

    Impostare come connessione predefinita per l'asset dati. Selezionare questa casella di controllo per impostare questa connessione come connessione predefinita per l'asset dati.
    Verifica connessione Fare clic sul pulsante per eseguire il test della connessione.
  5. Fare clic su Aggiungi.

4. Raccogliere l'asset di dati

Ora puoi raccogliere l'asset dati dello storage degli oggetti Oracle.

Per raccogliere l'asset dati dello storage degli oggetti Oracle, effettuare le operazioni riportate di seguito.

  1. Nella pagina dei dettagli dell'asset dati, selezionare Raccolta.
    Viene visualizzata la pagina Seleziona connessione con la connessione predefinita selezionata.
  2. Fare clic su Successivo.
    Viene visualizzata la pagina Seleziona entità dati.
  3. Nella sezione Bucket disponibile aggiungere le entità dati che si desidera raccogliere. Per aggiungere un'entità dati, selezionare l'icona Aggiungi accanto. Per raccogliere tutte le entità dati, selezionare Aggiungi tutto.
    Le altre operazioni che è possibile eseguire in questa pagina sono le seguenti:
    • Per trovare un'entità dati dalle entità dati disponibili, utilizzare la casella Bucket filtro/entità dati.
    • Utilizzare le icone di navigazione della pagina per sfogliare tutte le entità dati.
    • Per rimuovere un'entità dati selezionata dal job di raccolta, selezionare l'icona Rimuovi accanto all'entità dati.
    • Per rimuovere tutte le entità dati selezionate, selezionare Rimuovi tutto.
  4. Fare clic su Successivo.
    Viene visualizzata la pagina Crea job.
  5. In questa pagina effettuare le operazioni riportate di seguito.
    1. Nome job: immettere un nome univoco per identificare il job di raccolta.
    2. Descrizione job: immettere una descrizione.
    3. Raccolta incrementale: selezionare questa casella di controllo se si desidera che le esecuzioni successive di questo job di raccolta raccolgano solo le entità dati modificate dalla prima esecuzione del job di raccolta.
    4. Includi file non riconosciuti: selezionare questa casella di controllo per raccogliere un'entità dati logica composta solo da file archiviati o qualsiasi altro file non supportato in Data Catalog. Ad esempio, .log, .txt, .sh, .jar e .pdf.
    5. Includi solo file corrispondenti: selezionare questa casella di controllo se si desidera che Data Catalog raccolga solo i file che corrispondono ai pattern di nomi file assegnati. Quando si seleziona questa casella di controllo, i file che non corrispondono ai pattern di nomi file assegnati vengono ignorati durante la raccolta. Vengono aggiunti al conteggio ignorati.
    6. Ora di esecuzione: in questa sezione, selezionare una delle seguenti opzioni:
      • Esegui job ora: crea un job di raccolta e lo esegue immediatamente.
      • Pianifica esecuzione job: visualizza altri campi per pianificare il job di raccolta. Immettere un nome e una descrizione per la pianificazione. Specificare la frequenza di esecuzione del job. Le tue scelte sono orarie, giornaliere, settimanali e mensili. Infine, selezionare l'ora di inizio e di fine per il job.
      • Salva configurazioni job per uso futuro: crea un job per la raccolta dell'asset dati, ma il job non viene eseguito. È possibile eseguire o pianificare il job nella pagina Job in un secondo momento.
  6. Selezionare Crea job.
    Creazione del job per la raccolta dell'asset dati dello storage degli oggetti Oracle riuscita. Il job viene elencato nella pagina Job.
Raccolta dell'asset dati riuscita a seconda della pianificazione selezionata. È possibile rivedere i dettagli del job di raccolta selezionando il nome del job nella pagina Job.