Consulta de datos externos en Oracle Compute Cloud at Customer
Describe paquetes y herramientas para permitir que los despliegues de bases de datos de IA autónomas en Exadata Cloud@Customer carguen, consulten y gestionen datos no estructurados mediante la creación de tablas externas y tablas particionadas externas a partir de objetos en Data Lakes.
Puede utilizar el paquete DBMS_CLOUD para configurar despliegues de base de datos de IA autónoma en Exadata Cloud@Customer para acceder a los datos no estructurados almacenados en el cubo de almacenamiento de objetos de Oracle Compute Cloud at Customer (C3).
Visión general
Necesitas una plataforma de datos que pueda extraer información empresarial de datos estructurados y no estructurados. La combinación de datos estructurados disponibles en un almacén de datos y datos no estructurados disponibles en un lago de datos se conoce como Data Lakehouse.
Un lakehouse de datos autónomo permite el análisis de datos tanto de datos estructurados como no estructurados. Los datos estructurados se almacenan en un lakehouse de IA autónomo, mientras que los datos no estructurados se almacenan en un lago de datos configurado en cubos de almacenamiento de objetos C3. Autonomous AI Lakehouse puede consultar, cargar y gestionar objetos en el lago de datos mediante un paquete de base de datos denominado DBMS_CLOUD. Este paquete permite a la base de datos de IA autónoma crear tablas particionadas externas y externas en objetos de lago de datos como archivos csv, txt, Avro y Parquet. Puede crear almacenes de datos autónomos combinando las capacidades de los despliegues de bases de datos de IA autónomas en Exadata Cloud@Customer y Oracle C3.
Una instancia de Autonomous Data Lakehouse tiene dos componentes principales: una instancia de Autonomous AI Lakehouse y una instancia de Data Lake. El lakehouse de IA autónoma se crea mediante despliegues de base de datos de IA autónoma en Exadata Cloud@Customer, mientras que el lago de datos se crea mediante cubos de almacenamiento de objetos C3. La base de datos de IA autónoma aloja los datos relacionales estructurados, mientras que el lago de datos aloja recopilaciones de datos no estructurados en forma de txt, csv, Avro, Parquet y otros tipos de archivos. Puede consultar la base de datos de IA autónoma y la base de datos determina dónde encontrar los resultados, ya sea en los datos estructurados, los datos no estructurados o una combinación de los dos. Puede utilizar el paquete DBMS_CLOUD para configurar despliegues de base de datos de IA autónoma en Exadata Cloud@Customer para cargar, consultar y gestionar datos no estructurados mediante la creación de tablas particionadas externas y externas a partir de objetos en Data Lakes.
Requisitos
Siga los pasos que se indican a continuación para configurar cubos de almacenamiento de objetos C3 y aprovisionar varios componentes de la base de datos de IA autónoma. Debe finalizar estos pasos antes de configurar la base de datos de IA autónoma para comunicarse con los cubos de Object Storage C3.
-
Crear un cubo de Object Storage C3.
-
Crear un usuario y un grupo. Agregue el usuario al grupo y configure las políticas necesarias para permitir al usuario gestionar archivos (agregar/leer/eliminar) en el cubo de almacenamiento de objetos C3.
Por ejemplo:
Allow group <group_name> to manage objects in tenancy where target.bucket.name='<new_bucket_name_created>' -
Cree una clave de API para el usuario creado. En el proceso de generación de claves de API, tenga en cuenta la siguiente información:
user_ocid,tenancy_ocid,fingerprint,region. Además, guarde los archivos de clave PEM pública y privada creados durante el proceso de generación de claves de API. Esta información es necesaria para configurar el paqueteDBMS_CLOUDmás adelante. -
Descargue la cadena de autoridad de certificación https como se muestra a continuación. Esta cadena de autoridad de certificación permite a las aplicaciones cliente autenticar el cubo de almacenamiento de objetos C3 mediante el protocolo https. Los certificados https normalmente se guardan en un archivo crt, por ejemplo
c3_ca.crt. Obtenga la cadena de autoridad de certificación apuntando un explorador a la siguiente URL:https://iaas.domainname/cachain, dondedomainnamees el nombre del dominio DNS configurado durante el despliegue de la infraestructura de C3. -
Cree una nueva máquina virtual informática. Una vez que se inicie la nueva máquina virtual, copie el archivo de clave PEM privada y el archivo de certificado HTTPS C3 creado en los pasos anteriores en la máquina virtual.
-
Cree un recurso de infraestructura deExadata.
-
Cree un cluster de VM autónomo.
-
Creación de una base de datos de contenedores autónoma (ACD).
-
Cree una base de datos de IA autónoma.
Configuración de una base de datos de IA autónoma para comunicarse con el cubo de Object Storage C3
Debe completar las dos tareas siguientes para que la base de datos de IA autónoma se comunique con el cubo de almacenamiento de objetos C3:
-
Agregue el certificado https de Object Storage C3 a la cartera de TCPS de Autonomous VM Cluster Grid Infrastructure. Por ejemplo, la ubicación de la cartera es
/var/opt/oracle/dbaas_acfs/grid/tcps_wallets. Esto es necesario para que la base de datos de IA autónoma pueda autenticar la conexión https al almacenamiento de objetos C3. -
Agregue una entrada a la tabla
C##CLOUD$SERVICE_dbms_cloud_storeen la ACD creada anteriormente. Esto indica al paqueteDBMS_CLOUDque el cubo de C3 Object Storage es un almacén en la nube válido. Un comando SQL de ejemplo para ello es:SQL>INSERT INTO C##CLOUD$SERVICE.dbms_cloud_store VALUES('ORACLE_BMC','<objectstorage.mydomain.com>',null,1);
En las bases de datos de IA autónomas, no puede completar las dos tareas anteriores como usuario normal. Las operaciones de Oracle Cloud deben ejecutar estas dos tareas en nombre del usuario común. Debe conectarse a My Oracle Support (MOS) para crear una nueva solicitud de soporte para que las operaciones de Oracle Cloud realicen las dos tareas. Debe agregar la siguiente información al ticket. Obtendrá estos valores después de completar los pasos de .
-
OCID del recurso de la infraestructura de Exadata
-
OCID del cluster de VM autónomo
-
OCID de ACD
-
URL de almacenamiento de objetos C3
-
Archivo de certificado https de almacenamiento de objetos C3
Después de que Cloud Operations complete las tareas anteriores, conéctese a la base de datos de IA autónoma. Utilice el procedimiento DBMS_CLOUD.CREATE_CREDENTIAL para proporcionar a la base de datos de IA autónoma la información de autenticación necesaria para conectarse al cubo de almacenamiento de objetos C3. Consulte CREATE_CREDENTIAL para obtener más información.