Catalogues externes

Les catalogues externes sont des catalogues où les données proviennent d'un emplacement en dehors de l'atelier Oracle AI Data Platform.

Icône de tutoriel Sprint LiveLabs

Les catalogues externes se connectent à des sources telles qu'Oracle Autonomous AI Lakehouse, Oracle AI Database et Oracle Autonomous AI Transaction Processing pour extraire des données dans l'atelier Plate-forme de données d'IA. Les catalogues externes utilisent les données d'identification fournies lors de la création du catalogue externe pour interroger la source externe. Pour plus d'informations sur les sources de données, voir Sources internes.

Par exemple, si vous créez un catalogue externe pour une instance Autonomous AI Lakehouse où les données d'identification d'utilisateur Autonomous AI Lakehouse utilisées ont accès à schema1 mais pas à schema2, seul schema1 s'affiche dans le catalogue externe. Les utilisateurs disposant d'autorisations pour le catalogue externe peuvent uniquement interroger le schéma auquel l'utilisateur Autonomous AI Lakehouse a accès.

Note :

L'atelier Plate-forme de données IA ne prend pas en charge la collecte de données à partir de schémas et de tables partagés entre des bases de données enfichables ou à partir de schémas et de tables gérés par Oracle.

Autorisations requises pour Autonomous AI Lakehouse et Autonomous AI Transaction Processing

Lorsque vous créez un catalogue externe dans l'atelier Plate-forme de données IA, les données d'identification d'utilisateur que vous utilisez pour vous connecter doivent avoir au moins les autorisations suivantes :
  • CREATE SESSION pour se connecter à la base de données
  • SÉLECTIONNEZ l'accès aux objets requis (tables/vues/tables externes) au moyen d'autorisations de privilège minimal ou d'un rôle de lecture dédié
  • LIRE, ÉCRIRE sur DIRECTORY DATA_PUMP_DIR
Si vous insérez des données ou créez une nouvelle table dans le catalogue externe, assurez-vous que l'utilisateur fait partie de DWROLE. Pour plus d'informations, consultez la documentation sur Oracle Autonomous AI Transaction Processing, Gérer les privilèges d'utilisateur sur Autonomous AI Database - Connexion à un outil client.

Limitations

Les catalogues externes prennent en charge les interrogations et les instructions LMD. Le langage LDD n'est pas pris en charge, même lorsque les données d'identification utilisées pour créer le catalogue externe sont autorisées à exécuter des énoncés LDD.

Créer un catalogue externe

Vous pouvez connecter un catalogue à partir de l'atelier Plate-forme de données d'intelligence artificielle à une source externe.

  1. Cliquez sur Créer dans le volet de navigation de gauche et sélectionnez Catalogue. Vous pouvez également naviguer jusqu'au catalogue principal et cliquer sur Icône Créer un catalogue Créer un catalogue dans le catalogue principal.
  2. Remplissez les champs de nom et de description.
  3. Dans la liste déroulante Type de catalogue, sélectionnez Catalogue externe.
  4. Sélectionnez le type de source externe.
    • Pour Oracle Autonomous AI Lakehouse, fournissez un fichier de portefeuille ou la configuration de l'instance.
    • Pour Oracle Autonomous AI Transaction Processing, fournissez un fichier de portefeuille ou la configuration de l'instance.
    • Pour Oracle AI Database, fournissez un fichier de portefeuille ou la configuration de l'instance.
    • Pour Kafka, indiquez le serveur d'amorçage. Séparez plusieurs serveurs par une virgule. (Disponible bientôt)
  5. Entrez le nom d'utilisateur et le mot de passe.
  6. SSL est activé par défaut. Désélectionnez la case pour désactiver SSL.
  7. Cliquez sur Créer.
    Les catalogues externes qui extraient des données à partir d'une source externe affichent une icône circulaire.
    Vue arborescente du catalogue principal avec l'icône de rotation En cours à côté du catalogue mis en surbrillance

    Vous pouvez également surveiller la progression à partir des exécutions de travail.

Créer un catalogue externe pour les réseaux privés

Vous pouvez créer un catalogue externe qui accède aux sources de données dans un réseau privé.

  1. Cliquez sur Créer dans le volet de navigation de gauche et sélectionnez Catalogue. Vous pouvez également naviguer jusqu'au catalogue principal et cliquer sur Icône Créer un catalogue Créer un catalogue dans le catalogue principal.
  2. Remplissez les champs de nom et de description.
  3. Dans la liste déroulante Type de catalogue, sélectionnez Catalogue externe.
  4. Sélectionnez le type de source externe.
    • Pour Oracle Autonomous AI Lakehouse, fournissez un fichier de portefeuille ou la configuration de l'instance.
    • Pour Oracle Autonomous AI Transaction Processing, fournissez un fichier de portefeuille ou la configuration de l'instance.
    • Pour Oracle AI Database, fournissez un fichier de portefeuille ou la configuration de l'instance.
    • Pour Oracle Exadata Database Service, indiquez l'hôte, le port et le nom du service (SID).
    • Pour Kafka, indiquez le serveur d'amorçage. Séparez plusieurs serveurs par une virgule. (Disponible bientôt)
  5. Entrez le nom d'utilisateur et le mot de passe.
  6. SSL est activé par défaut. Désélectionnez la case pour désactiver SSL.
  7. Sélectionnez Activer un réseau privé.
  8. Sélectionnez l'espace de travail avec la configuration de réseau privé souhaitée.
    Pour plus d'informations sur la configuration d'un espace de travail configuré pour les réseaux privés, voir Créer un espace de travail avec accès réseau privé activé.
  9. Cliquez sur Créer.
    Les catalogues externes qui extraient des données à partir d'une source externe affichent une icône circulaire.
    Vue arborescente du catalogue principal avec l'icône de rotation En cours à côté du catalogue mis en surbrillance

    Vous pouvez également surveiller la progression à partir des exécutions de travail.

Actualiser les catalogues de données externes

Vous pouvez déclencher une actualisation de tous les catalogues externes pour mettre à jour leur contenu à partir de la source.

  1. Dans la page d'accueil, cliquez sur Catalogue principal.
  2. Sélectionnez le catalogue externe à actualiser.
  3. Cliquez sur Icône d'actualisation Actualiser.
    Lorsque vous cliquez sur Actualiser, les flux de travail commencent en arrière-plan pour extraire et mettre à jour les métadonnées des catalogues externes. Les catalogues qui extraient des données à partir d'une source externe affichent une icône circulaire.
    Vue arborescente du catalogue principal avec l'icône de rotation En cours à côté du catalogue mis en surbrillance

    Vous pouvez également surveiller la progression à partir des exécutions de travail.

Modifier une description de catalogue externe

Vous pouvez modifier la description des catalogues externes après leur création si leur contenu ou leur objectif a changé.

  1. Dans la page d'accueil, cliquez sur Catalogue principal.
  2. À côté de votre catalogue externe, cliquez sur Icône Actions à trois points Actions et cliquez sur Modifier la description.

    Menu à trois points Actions pour un catalogue ouvert avec l'option Modifier la description mise en surbrillance

  3. Apportez vos modifications à la description du catalogue et cliquez sur Enregistrer.

Renommer un catalogue externe

Vous pouvez renommer vos catalogues externes pour fournir une étiquette descriptive lorsque le contenu ou l'objectif du catalogue a changé.

Vous ne pouvez pas renommer le catalogue par défaut.
  1. Dans la page d'accueil, cliquez sur Catalogue principal.
  2. À côté de votre catalogue, cliquez sur Icône Actions à trois points Actions et cliquez sur Renommer.

    Menu à trois points Actions ouvert pour le catalogue avec Renommer en surbrillance

  3. Apportez vos modifications au nom du catalogue et cliquez sur Enregistrer.

Modifier une configuration de catalogue externe

Vous pouvez modifier la configuration d'un catalogue externe pour mettre à jour le mot de passe requis.

  1. Dans la page d'accueil, cliquez sur Catalogue principal.
  2. À côté de votre catalogue, cliquez sur Icône Actions à trois points Actions et cliquez sur Modifier la configuration.
  3. Entrez le nouveau mot de passe du catalogue externe et cliquez sur Enregistrer.

Accéder aux tables de catalogue externes dans le carnet

Vous pouvez accéder aux tables des catalogues externes de vos carnets à l'aide de noms en trois parties.

La poussée vers le bas est activée par défaut et les opérations telles que les agrégations, la projection, les filtres, l'élagage de colonne, le topN, la limite, le décalage, les opérateurs booléens, logiques et relationnels sont poussées vers la source.
  1. Naviguez jusqu'à l'interface de code de votre carnet.
  2. Pour lire les données de votre table de catalogue externe, utilisez :
    df = spark.read.table("<<catalog_name>>.<<schema_name>>.<<table_name>>")
  3. Pour écrire des données dans votre catalogue externe, il existe quatre options :
    Option#1
    df.write.saveAsTable("<<catalog_name>>.<<schema_name>>.<<table_name>>")
    
    Option#2
    df.write.mode("append").insertInto("<<catalog_name>>.<<schema_name>>.<<table_name>>")
    
    Option#3
    df.write.mode("overwrite").saveAsTable("<<catalog_name>>.<<schema_name>>.<<table_name>>")
    
    Option#4
    df.write.option('write.mode', 'MERGE').option('write.merge.keys','merge column(s)').insertInto('<<catalog_name>>.<<schema_name>>.<<table_name>>')

Supprimer un catalogue externe

Vous pouvez supprimer des catalogues externes pour supprimer toutes les métadonnées stockées localement.

La suppression d'un catalogue externe ne supprime que les métadonnées stockées localement. Les données de la source de données ne sont pas touchées.

  1. Dans la page d'accueil, cliquez sur Catalogue principal.
  2. À côté de votre catalogue, cliquez sur Icône Actions à trois points Actions, puis sur Supprimer.

    Menu à trois points Actions ouvert pour le catalogue avec suppression mise en surbrillance

  3. Sélectionnez Confirmer la suppression des catalogues.
  4. Cliquez sur Supprimer.