Collecter à partir de bases de données d'IA autonomes avec accès privé
La collecte est un processus qui extrait les métadonnées techniques de votre source de données vers votre catalogue de données. Ce tutoriel décrit les étapes à suivre pour effectuer une collecte à partir d'une source de données qui n'est accessible qu'en privé.
Dans ce tutoriel, vous allez :
- Créer les politiques nécessaires pour collecter une base de données autonome avec URL privée.
- Obtenir les informations d'accès à la base de données autonome.
- Créer un point d'extrémité privé dans le catalogue de données.
- Attacher le point d'extrémité privé à votre catalogue de données.
- Créer une ressource de données.
- Ajouter une connexion pour la ressource de données.
- Collecter la ressource de données.
Pour plus d'informations, voir Configuration d'un réseau privé.
Avant de commencer
Pour suivre ce tutoriel avec succès, vous devez disposer des éléments suivants :
- Un compte Oracle Cloud Infrastructure Voir Inscription à Oracle Cloud Infrastructure.
- L'accès aux ressources de catalogue de données. Voir Préalables et Exemples de politiques.
- Une instance de catalogue de données déjà créée. Voir Création d'une instance de catalogue de données.
Si la base de données autonome à partir de laquelle effectuer la collecte existe déjà, vous pouvez utiliser les détails de cette base de données pour suivre ce tutoriel. Si vous n'avez pas de base de données autonome avec accès privé mais que vous voulez essayer ce tutoriel, vous pouvez suivre les instructions ci-dessous pour configurer les ressources requises.
Configuration des ressources requises pour ce tutoriel
Vous créez des politiques dans Oracle Cloud Infrastructure pour permettre l'accès aux diverses ressources.
Pour pouvoir créer un réseau privé dans votre location, vous devez disposer des autorisations de réseau appropriées.
Au cours de cette configuration, vous allez créer une politique pour pouvoir effectuer toutes les opérations de réseau dans tous les compartiments de votre location.
Effectuez les étapes suivantes :
Un réseau en nuage virtuel est un réseau privé virtuel configuré dans une région Oracle Cloud Infrastructure unique. Un réseau en nuage virtuel comporte un seul bloc CIDR IPv4 contigu de votre choix.
La taille de réseau en nuage virtuel autorisée est comprise entre /16 et /30. Identifiez le bloc CIDR avant de créer un réseau en nuage virtuel. Vous ne pourrez pas modifier le CIDR ultérieurement Pour référence, cliquez ici pour accéder à un calculateur CIDR.
Pour créer un réseau en nuage virtuel, procédez comme suit :
- Ouvrez le menu de navigation , sélectionnez Service de réseau, puis Réseaux en nuage virtuels.
- Cliquez sur Créer un réseau en nuage virtuel.
- Entrez un nom pour identifier le RPV et sélectionnez le compartiment dans lequel vous êtes autorisé à travailler.
- Entrez le bloc CIDR du réseau en nuage virtuel. Pour ce tutoriel, vous pouvez entrer 10.0.0.0/16.
- Sélectionnez Résolution de DNS et entrez une étiquette DNS.
- Cliquez sur Créer un réseau en nuage virtuel.
Le VCN est créé et la page Détails des réseaux en nuage virtuels du VCN s'affiche.
Par défaut, une table de routage, une option DHCP et une liste de sécurité sont automatiquement créées pour le réseau en nuage virtuel. Vous utilisez ces composants par défaut lorsque vous créez un sous-réseau privé.
Les sous-réseaux sont des divisions que vous créez dans un réseau en nuage virtuel. Chaque sous-réseau se compose d'un intervalle contigu d'adresses IP qui ne chevauchent pas celles des autres sous-réseaux du VCN. Vous créez un sous-réseau privé lorsque vous ne voulez pas que les ressources créées dans le sous-réseau aient des adresses IP publiques.
Pour créer un sous-réseau privé, procédez comme suit :
- Cliquez sur Créer un sous-réseau dans la page Détails des réseaux en nuage virtuels du VCN que vous avez créé à l'étape précédente.
- Entrez un nom pour le sous-réseau privé.
- Conservez la sélection régionale par défaut pour le type de sous-réseau.
- Entrez le bloc CIDR du sous-réseau privé. Pour ce tutoriel, vous pouvez entrer 10.0.0.0/24.
- Sélectionnez la table de routage par défaut.
- Sélectionnez Sous-réseau privé pour l'accès au sous-réseau.
- Sélectionnez Utiliser les noms d'hôte DNS dans ce sous-réseau pour la résolution DNS.
- Entrez une étiquette DNS.
- Sélectionnez les options DHCP et les listes de sécurité par défaut.
- Cliquez sur Créer un sous-réseau.
Le sous-réseau est créé et affiché dans la page sous-réseaux du compartiment que vous avez choisi.
Lorsque vous créez une base de données autonome dans un réseau en nuage virtuel, vous devez spécifier le groupe de sécurité réseau (NSG) de la base de données. Un groupe de sécurité de réseau comprend des règles de sécurité qui ne s'appliquent qu'à un groupe de cartes vNIC.
Sans règles de sécurité, aucun trafic n'est autorisé à destination et en provenance des cartes vNIC du réseau en nuage virtuel.
Pour créer un groupe de sécurité de réseau avec une règle de trafic entrant, procédez comme suit :
- Cliquez sur Groupes de sécurité de réseau dans la page Détails des réseaux en nuage virtuels du VCN que vous avez créé précédemment.
- Cliquez sur Créer un groupe de sécurité de réseau.
- Entrez le nom du groupe.
- Assurez-vous d'avoir les autorisations requises pour travailler dans le compartiment sélectionné et cliquez sur Suivant.
- Sélectionnez Trafic entrant pour Direction.
- Sélectionnez CIDR pour Type de source et entrez le CIDR du sous-réseau privé dans CIDR source. Pour ce tutoriel, vous pouvez entrer 10.0.0.0/24.
- Sélectionnez TCP pour Protocole IP.
- Entrez 1522 dans Intervalle de ports de destination.
- Cliquez sur + Une autre règle.
- Sélectionnez Trafic sortant pour Direction.
- Sélectionnez CIDR pour Type de destination et entrez le CIDR du sous-réseau privé dans CIDR de destination. Pour ce tutoriel, vous pouvez entrer 10.0.0.0/24.
- Conservez Tous les protocoles pour Protocole IP.
- Cliquez sur Créer.
Dans ce tutoriel, la base de données autonome est créée dans le même sous-réseau que celui utilisé dans le catalogue de données pour configurer le réseau privé pour la collecte. Pour ce scénario, vous avez créé les règles de trafic entrant et sortant spécifiant le CIDR du sous-réseau privé.
Votre base de données autonome peut se trouver dans un sous-réseau privé différent de celui utilisé dans le catalogue de données pour configurer le réseau privé pour la collecte. Dans ce cas, vous devez créer les règles de trafic entrant et sortant précisant le CIDR du réseau en nuage virtuel.
Effectuez les étapes suivantes pour créer une base de données autonome avec accès privé.
Par exemple, pour créer une base de données autonome avec un type de charge de travail Entrepôt de données :
- Ouvrez le menu de navigation et cliquez sur Oracle Database. Sous Autonomous Database, cliquez sur Autonomous Data Warehouse.
- Cliquez sur Créer une base de données autonome.
- Assurez-vous d'avoir l'autorisation de travailler dans le compartiment sélectionné et entrez un nom d'affichage et un nom de base de données pour la base de données autonome.
- Conservez Data Warehouse comme type de charge de travail.
- Conservez Serverless comme type de déploiement.
- Configurez la base de données avec la version 19c, 1 ECPU, 1 To de stockage, puis activez l'ajustement automatique.
- Entrez un mot de passe pour l'utilisateur administrateur. Vous avez besoin de ce mot de passe pour vous connecter à cette base de données plus loin dans ce tutoriel.
- Dans la section Sélection de l'accès au réseau, sélectionnez Accès au point d'extrémité privé seulement.
- Sélectionnez le réseau en nuage virtuel, le sous-réseau et le groupe de sécurité de réseau que vous avez créés au cours des étapes précédentes.
- Entrez un Préfixe de nom d'hôte. Ce texte apparaît dans l'URL privée de la base de données.
- Conservez l'option BYOL pour le type de licence.
- Cliquez sur Créer une base de données autonome.
Lorsque vous créez un réseau en nuage virtuel, une liste de sécurité associée est créée par défaut. Vous pouvez ajouter des règles de sécurité à cette liste de sécurité par défaut ou créer une liste de sécurité pour autoriser le trafic entrant et sortant pour votre VCN. Dans ce tutoriel, vous allez ajouter des règles de sécurité à la liste de sécurité par défaut.
Pour créer une liste de sécurité avec les règles de sécurité requises, procédez comme suit :
- Ouvrez le menu de navigation , sélectionnez Service de réseau, puis Réseaux en nuage virtuels.
- Cliquez sur le VCN que vous avez créé avant de voir les détails du VCN.
- Cliquez sur Listes de sécurité dans la page Détails du réseau en nuage virtuel du VCN que vous avez créé précédemment.
- Cliquez sur Liste de sécurité par défaut pour <your vcn>.
- Cliquez sur Règles de trafic sortant.
- Cliquez sur Ajouter des règles sortantes.
- Entrez le CIDR de votre sous-réseau privé. Pour ce tutoriel, entrez 10.0.0.0/24.
- Sélectionnez Tous les protocoles pour Protocole IP.
- Cliquez sur Ajouter des règles sortantes.
- Cliquez sur Règles de trafic entrant.
- Cliquez sur Ajouter des règles de trafic entrant.
- Entrez le CIDR de votre sous-réseau privé. Pour ce tutoriel, entrez 10.0.0.0/24.
- Sélectionnez TCP pour Protocole IP.
- Entrez 1521–1522 dans Intervalle de ports de DESTINATION
- Cliquez sur Ajouter des règles de trafic entrant.
Dans ce tutoriel, la base de données autonome est créée dans le même sous-réseau que celui utilisé dans le catalogue de données pour configurer le réseau privé pour la collecte. Pour ce scénario, vous avez créé les règles de trafic entrant et sortant spécifiant le CIDR du sous-réseau privé.
Votre base de données autonome peut se trouver dans un sous-réseau privé différent de celui utilisé dans le catalogue de données pour configurer le réseau privé pour la collecte. Dans ce cas, vous devez créer les règles de trafic entrant et sortant précisant le CIDR du réseau en nuage virtuel.
1. Créer des politiques d'accès
Pour configurer le catalogue de données pour l'accès au réseau privé d'une source de données, vous devez avoir accès aux ressources de réseau et de catalogue de données.
Si vos accès vous autorisent déjà à effectuer toutes les opérations de catalogue de données et de réseau dans les compartiments requis, vous pouvez ignorer cette étape.
Pour créer la politique requise pour configurer un réseau privé dans le catalogue de données, procédez comme suit :
2. Obtenir les détails de la source de données
Vous avez besoin des informations de connexion au réseau privé et à la base de données pour la base de données autonome que vous souhaitez collecter.
Obtenez les informations suivantes pour la base de données autonome :
| Informations requises | Instructions pour obtenir les informations |
|---|---|
| Pour configurer le réseau privé, vous avez besoin du nom du VCN et du sous-réseau, ainsi que de l'URL privée de la base de données. |
Note : Si vous avez plus de base de données dans ce réseau (même VCN et sous-réseau) que vous voulez collecter, notez également l'URL privée de ces bases de données. |
| Pour créer la ressource de données, vous avez besoin du nom de la base de données. | Dans la page de détails de la base de données autonome, notez le nom de la base de données dans la section Informations générales. |
| Pour ajouter une connexion, vous avez besoin du portefeuille de base de données et des données d'identification de connexion. |
Vous avez également besoin des données d'identification (nom d'utilisateur et mot de passe) pour la base de données que vous avez spécifiées lorsque vous avez créé la base de données autonome. Si vous n'avez pas créé la base de données autonome, demandez les données d'identification à votre administrateur. Lors de la collecte, vous ne pouvez voir que les entités de base de données auxquelles vous avez accès. |
3. Créer un point d'extrémité privé
Vous créez un point d'extrémité privé de catalogue de données pour configurer les détails d'accès au réseau pour les sources de données (bases de données autonomes) que vous souhaitez collecter.
Pour créer un point d'extrémité privé dans le catalogue de données, procédez comme suit :
ACTIVE.Si le statut du point d'extrémité privé passe à FAILED, assurez-vous que vous avez correctement créé les politiques d'accès et configuré votre réseau privé.
4. Attacher un point d'extrémité privé
Vous attachez un point d'extrémité privé à un catalogue de données afin de permettre la création de ressources de données pour les sources de données disponibles dans le réseau privé.
Pour attacher un point d'extrémité privé à un catalogue de données, procédez comme suit :
- Cliquez sur Catalogues de données.
- Cliquez sur le menu Actions du catalogue de données auquel vous voulez attacher le point d'extrémité privé et sélectionnez Attacher un point d'extrémité privé.
- Sélectionnez le point d'extrémité privé que vous avez créé à l'étape précédente et cliquez sur Attacher.
Updating, et le point d'extrémité privé est attaché. Une fois le point d'extrémité privé attaché, le statut du catalogue de données passe à Active.5. Créer une ressource de données de base de données d'intelligence artificielle autonome
Vous êtes maintenant prêt à enregistrer votre base de données autonome IP privée dans le catalogue de données en tant que ressource de données. Dans ce tutoriel, vous allez créer une ressource de données Autonomous Data Warehouse.
Pour créer une ressource de données de base de données autonome, procédez comme suit :
6. Ajouter une connexion
Après avoir enregistré une source de données en tant que ressource de données dans votre catalogue de données, vous devez créer une connexion à la ressource de données pour effectuer la collecte. Vous pouvez créer plusieurs connexions à votre source de données. Au moins une connexion est nécessaire pour la collecte d'une ressource de données.
Pour les types de source de données de base de données autonome, vous pouvez utiliser des clés secrètes dans le service de chambre forte pour Oracle Cloud Infrastructure afin de stocker le mot de passe dont vous avez besoin pour vous connecter à la source à l'aide d'une connexion. En utilisant le service de chambre forte OCI, vous fournissez l'OCID de la clé secrète lors de l'entrée des détails de connexion, de sorte que vous n'avez pas à entrer le mot de passe réel lorsque vous créez la ressource de données. Vous pouvez également utiliser des clés secrètes pour le portefeuille et les mots de passe Oracle au lieu de charger le portefeuille lorsque vous créez votre ressource de données.
Une chambre forte est un conteneur pour clés et clés secrètes. Les clés secrètes servent à stocker les données d'identification comme les mots de passe requis pour se connecter à des sources de données. Vous utilisez une clé de chiffrement dans une chambre forte pour chiffrer et importer le contenu d'une clé secrète dans la chambre forte. Le contenu des clés secrètes est encodé en base64. Le catalogue de données utilise la même clé pour extraire et déchiffrer les clés secrètes lors de la connexion d'une ressource de données à la source de données. Pour plus d'informations sur la chambre forte, les clés et les clés secrètes, voir Aperçu du service de chambre forte. Pour plus d'informations sur la copie de l'OCID de la clé secrète, voir Voir les détails des clés secrètes.
- Fournir un mot de passe de portefeuille lorsque vous téléchargez le portefeuille.
- Supprimez le fichier
.p12du fichier zip de portefeuille téléchargé. - Utiliser n'importe quel encodeur base64 pour encoder le fichier zip de portefeuille modifié en base64.
- Copier les données encodées en base64 dans une clé secrète dans une chambre forte.
- Créer une clé secrète pour le mot de passe de la base de données.
Pour ajouter une connexion pour la ressource de données de base de données autonome, procédez de la façon suivante :
7. Collecter la ressource de données
Vous pouvez maintenant collecter votre ressource de base de données autonome. Votre base de données autonome doit contenir les données à partir desquelles vous souhaitez collecter les métadonnées techniques. Si vous avez utilisé les instructions de configuration de ce tutoriel, vous pouvez collecter des métadonnées à partir des données par défaut disponibles dans votre base de données autonome.
Pour collecter votre ressource de données de base de données autonome, procédez comme suit :
Étape suivante
Vous pouvez maintenant explorer la ressource de données, créer un glossaire et lier des termes et des marqueurs à des objets de données.