Esegui query sui dati esterni in Oracle Compute Cloud at Customer

Descrive package e strumenti per consentire alle distribuzioni di Autonomous Database in Exadata Cloud@Customer di caricare, eseguire query e gestire dati non strutturati creando tabelle esterne e tabelle partizionate esterne dagli oggetti nei data lake.

Puoi utilizzare il package DBMS_CLOUD per configurare le distribuzioni di Autonomous Database su Exadata Cloud@Customer per accedere ai dati non strutturati memorizzati nel bucket di storage degli oggetti Oracle Compute Cloud at Customer (C3).

Panoramica

Hai bisogno di una piattaforma di dati in grado di estrarre insight aziendali da dati strutturati e non strutturati. La combinazione di dati strutturati disponibili in un data warehouse e dati non strutturati disponibili in un data lake è nota come data lakehouse.

Un Autonomous Data Lakehouse consente l'analisi dei dati su dati strutturati e non strutturati. I dati strutturati vengono memorizzati in un Autonomous Data Warehouse, mentre i dati non strutturati vengono memorizzati in un data lake configurato in bucket di storage degli oggetti C3. Autonomous Data Warehouse può eseguire query, caricare e gestire gli oggetti nel data lake utilizzando un package di database denominato DBMS_CLOUD. Questo package consente ad Autonomous Database di creare tabelle partizionate esterne ed esterne su oggetti data lake quali file csv, txt, Avro e Parquet. Puoi creare Autonomous Data Lakehouse combinando le funzionalità delle distribuzioni di Autonomous Database su Exadata Cloud@Customer e Oracle C3.

Un Autonomous Data Lakehouse dispone di due componenti principali: un Autonomous Data Warehouse e un data lake. L'Autonomous Data Warehouse viene creato utilizzando le distribuzioni di Autonomous Database su Exadata Cloud@Customer, mentre il data lake viene creato utilizzando i bucket di storage degli oggetti C3. Autonomous Database ospita i dati relazionali strutturati, mentre il data lake ospita raccolte di dati non strutturati sotto forma di txt, csv, Avro, Parquet e altri tipi di file. Puoi eseguire query su Autonomous Database e il database determina dove trovare i risultati, sia nei dati strutturati che nei dati non strutturati o in una combinazione dei due. Puoi utilizzare il package DBMS_CLOUD per configurare le distribuzioni di Autonomous Database su Exadata Cloud@Customer per caricare, eseguire query e gestire dati non strutturati creando tabelle partizionate esterne ed esterne dagli oggetti nei data lake.

Prerequisiti

Seguire i passi riportati di seguito per configurare i bucket di storage degli oggetti C3 e per eseguire il provisioning di vari componenti di Autonomous Database. È necessario completare questi passi prima di configurare Autonomous Database per comunicare con i bucket di storage degli oggetti C3.
  • Creare un C3 bucket di storage degli oggetti.
  • Crea un utente e un gruppo. Aggiungere l'utente al gruppo e configurare i criteri necessari per consentire all'utente di gestire i file (aggiungere/leggere/rimuovere) nel bucket di storage degli oggetti C3.
    Esempio:
    Allow group <group_name> to manage objects in tenancy where
    target.bucket.name='<new_bucket_name_created>'
  • Creare una chiave API per l'utente creato. Dal processo di generazione della chiave API, prendere nota delle seguenti informazioni: user_ocid, tenancy_ocid, fingerprint, region. Inoltre, salvare i file della chiave PEM pubblica e privata creati durante il processo di generazione della chiave API. Queste informazioni sono necessarie per configurare il pacchetto DBMS_CLOUD in un secondo momento.
  • Scaricare la catena di autorità di certificazione https come illustrato di seguito. Questa catena di autorità di certificazione consente alle applicazioni client di autenticare il bucket di storage degli oggetti C3 tramite il protocollo https. I certificati https vengono solitamente salvati in un file crt, ad esempio c3_ca.crt. Ottenere la catena di autorità di certificazione puntando un browser al seguente URL: https://iaas.domainname/cachain, dove domainname è il nome del dominio DNS configurato durante la distribuzione dell'infrastruttura C3.
  • Crea una nuova VM di computazione. Una volta avviata la nuova VM, copiare il file di chiavi PEM privato e il file di certificato C3 https creato nei passi precedenti nella VM.
  • Creare una risorsa infrastruttura Exadata.
  • Crea un cluster VM Autonomous.
  • Crea un Autonomous Container Database (ACD).
  • Crea un Autonomous Database.

Configurazione di Autonomous Database per comunicare con il bucket di storage degli oggetti C3

Devi completare i due task riportati di seguito affinché Autonomous Database comunichi con il bucket di storage degli oggetti C3:
  • Aggiungere il certificato https dello storage degli oggetti C3 al wallet TCPS di Autonomous VM Cluster Grid Infrastructure. Ad esempio, la posizione del wallet è /var/opt/oracle/dbaas_acfs/grid/tcps_wallets. Ciò è necessario affinché Autonomous Database possa autenticare la connessione https allo storage degli oggetti C3.
  • Aggiungere una voce alla tabella C##CLOUD$SERVICE_dbms_cloud_store nell'ACD creato in precedenza. Indica al package DBMS_CLOUD che il bucket di storage degli oggetti C3 è un'area di memorizzazione cloud valida. Un comando SQL di esempio per eseguire questa operazione è:
    SQL>INSERT INTO C##CLOUD$SERVICE.dbms_cloud_store VALUES('ORACLE_BMC','<objectstorage.mydomain.com>',null,1);
In Autonomous Database, non puoi completare i due task precedenti come utente normale. Le operazioni di Oracle Cloud devono eseguire questi due task per conto dell'utente normale. Per eseguire i due task, è necessario eseguire il login a My Oracle Support (MOS) per creare una nuova richiesta di supporto per Oracle Cloud Operations. È necessario aggiungere le seguenti informazioni al ticket. Questi valori verranno visualizzati dopo aver completato i passi descritti in .
  • OCID della risorsa dell'infrastruttura Exadata
  • OCID del cluster VM Autonomous
  • OCID dell'ACD
  • C3 URL di storage degli oggetti
  • C3 File certificato https dello storage degli oggetti

Dopo che Cloud Operations ha completato i task sopra riportati, eseguire il login ad Autonomous Database. Utilizzare la procedura DBMS_CLOUD.CREATE_CREDENTIAL per fornire a Autonomous Database le informazioni di autenticazione necessarie per connettersi al bucket di storage degli oggetti C3. Per ulteriori informazioni, vedere CREATE_CREDENTIAL.