Configuration manuelle d'une location du service de science des données
Dans ce tutoriel, vous allez configurer votre location pour le service de science des données et la tester en créant une session de carnet.
Ce tutoriel est destiné aux administrateurs car ils disposent des autorisations d'accès requises.
Ce tutoriel décrit comment effectuer les opérations suivantes :
1. Création d'un groupe d'utilisateurs experts en science des données.
2. Création d'un compartiment pour votre travail.
3. (Facultatif) Création d'un VCN et d'un sous-réseau.
Avant de commencer
Pour suivre ce tutoriel, vous devez disposer des éléments suivants :
-
Un compte Oracle Cloud Infrastructure (OCI) payant ou un nouveau compte avec des promotions Oracle Cloud. Voir Demander et gérer des promotions pour un essai gratuit d'Oracle Cloud.
- Privilège d'administrateur pour le compte OCI.
-
Au moins un utilisateur de votre location qui souhaite accéder au service de science des données. Cet utilisateur doit être créé dans IAM.
1. Création d'un groupe d'utilisateurs experts en science des données
Créez un groupe d'utilisateurs dans lequel les experts en science des données pourront travailler.
2. Création d'un compartiment pour votre travail
Créez un compartiment pour vos ressources de science des données.
- Suivez les étapes sous Création d'un compartiment pour créer un compartiment.
- Nommez le nouveau compartiment data-science-work et entrez une description.
- Vérifiez que le compartiment apparaît dans la liste des compartiments.
3 (Facultatif) Création d'un VCN et d'un sous-réseau
Cette étape est facultative. Lorsque vous créez une session de carnet à l'étape 6. Création d'une session de carnet, vous pouvez choisir de créer un réseau par défaut avec la configuration appropriée pour les sessions de carnet.
Vous pouvez ignorer la création d'un réseau et la configuration de sous-réseaux et de passerelles si vous sélectionnez le réseau par défaut lors de la création d'un carnet. Si le réseau par défaut est configuré dans un carnet, vous ne pouvez pas le modifier lors de la réactivation du carnet.
Cette section présente les utilisateurs qui ont besoin d'accéder à leurs réseaux en nuage virtuels, comment créer un VCN et versions ultérieures, comment sélectionner le sous-réseau recommandé pour les sessions de carnet. Par exemple, si vous exécutez le tutoriel Programmation des exécutions de travail du service de science des données, vous créez ce réseau et vous l'utilisez à la fois pour la session de carnet dans le service de science des données et pour l'espace de travail dans le service d'intégration de données.
Pour l'accès sortant à l'Internet public, nous recommandons d'utiliser un sous-réseau privé avec une route vers une passerelle NAT. Une passerelle NAT permet aux instances d'un sous-réseau privé d'accéder à Internet. Le VCN que vous créez à cette étape crée un sous-réseau privé avec accès sortant à Internet au moyen de la passerelle NAT du VCN.
4. Création de politiques
Avant que les utilisateurs démarrent leurs sessions de carnet, vous devez configurer les politiques du service de science des données.
Explication des politiques :
-
Pour autoriser le service de science des données à attacher votre VCN à votre session de carnet et à acheminer le trafic sortant depuis l'environnement du carnet, ajoutez :
allow service datascience to use virtual-network-family in compartment data-science-work
-
Pour permettre au groupe
data-scientists
d'effectuer des opérations sur toutes les ressources du service de science des données dans le compartimentdata-science-work
(projets, sessions de carnet, modèles, déploiements de modèle, demandes de travail, tâches et exécutions de travail), ajoutez :allow group data-scientists to manage data-science-family in compartment data-science-work
-
Pour permettre aux scientifiques de données d'utiliser le VCN que vous avez créé et de l'attacher à leur session de carnet, ajoutez :
allow group data-scientists to use virtual-network-family in compartment data-science-work
-
Pour permettre à ces scientifiques de créer et de gérer des seaux, tels que leur ajouter des artefacts et des environnements Conda, ajoutez :
allow group data-scientists to manage buckets in compartment data-science-work allow group data-scientists to manage objects in compartment data-science-work
Au lieu de spécifier les ressources à gérer telles que les seaux, les objets ou la famille de réseau virtuel, pour autoriser les droits d'administration des experts en science des données à leur compartiment, dans lesquels ils peuvent gérer toutes les ressources des services OCI, remplacez les cinq politiques précédentes par les deux politiques suivantes :
allow group data-scientists to manage all-resources in compartment data-science-work
allow service datascience to use virtual-network-family in compartment data-science-work
5. Création d'un groupe dynamique avec des politiques
Créez un groupe dynamique pour les ressources du service de science des données et autorisez ce groupe à accéder à d'autres ressources OCI, telles que les services de stockage d'objets et de journalisation.
Pour autoriser les ressources OCI à accéder à d'autres, vous devez d'abord les ajouter à un groupe dynamique au lieu d'un groupe d'utilisateurs. Ensuite, vous écrivez des politiques pour permettre au groupe dynamique d'accéder aux ressources spécifiées. Ici, votre groupe dynamique dispose de trois ressources pour le service de science des données : sessions de carnet, d déploiements de modèle et exécutions de travail.
Vous pouvez utiliser ce groupe dynamique pour donner aux sessions de carnet et aux déploiements de modèle qui se trouvent dans le compartiment data-science-work
, l'accès à d'autres ressources OCI de la location.
Explication des politiques :
-
Pour permettre aux sessions de carnet d'effectuer des opérations de CRUD sur les entrées du catalogue de modèles, les projets et les ressources de session de carnet, ajoutez :
allow dynamic-group data-science-dynamic-group to manage data-science-family in compartment data-science-work
-
Pour permettre aux sessions de carnet d'effectuer des opérations de CRUD sur les applications et les exécutions du service de flux de données, ajoutez :
allow dynamic-group data-science-dynamic-group to manage dataflow-family in compartment data-science-work
-
Pour permettre aux sessions de carnet de répertorier et de lire les compartiments et les noms d'utilisateur qui se trouvent dans la location, ajoutez :
allow dynamic-group data-science-dynamic-group to read compartments in tenancy allow dynamic-group data-science-dynamic-group to read users in tenancy
-
Pour permettre aux déploiements de modèle d'envoyer des journaux au service de journalisation, ajoutez :
allow dynamic-group data-science-dynamic-group to use log-content in compartment data-science-work
-
Pour permettre aux exécutions de travail de créer des journaux et d'enregistrer leurs détails dans le service de journalisation, ajoutez :
allow dynamic-group data-science-dynamic-group to use log-groups in compartment data-science-work
-
Pour permettre aux sessions de carnet et aux déploiements de modèle de lire et d'écrire des fichiers dans les seaux de stockage d'objets, dans le compartiment
data-science-work
, ajoutez :allow dynamic-group data-science-dynamic-group to manage object-family in compartment data-science-work
- La politique précédente permet aux déploiements de modèle d'accéder à n'importe quel seau du compartiment data-science-work.
- Pour accorder aux déploiements de modèle l'accès en lecture à des seaux spécifiques à l'extérieur du compartiment data-science-work, indiquez le nom de ces derniers et leurs compartiments dans votre politique.
- Exemple : Pour permettre aux déploiements de modèle d'accéder aux environnements Conda publiés à partir du seau
published-conda-env
et aux artefacts de modèle à partir du seaumodel-artifacts
, ajoutez :allow dynamic-group data-science-dynamic-group to read objects in compartment <another-compartment> where ANY {target.bucket.name='published-conda-envs', target.bucket.name='model-artifacts'}
- Si vos énoncés de politique mentionnent une location ou incluent des compartiments en dehors du compartiment
data-science-work
, dans la boîte de dialogue Créer une politique, pour l'option Compartiment, sélectionnez <your-tenancy> (root). De cette façon, en plus de votre compartiment, la politique peut inclure des règles pour les autres compartiments de la location.
6. Création d'une session de carnet
En dernier lieu, créez une session de carnet et testez l'accès au réseau Internet public.
Étape suivante
Vous avez configuré une location du service de science des données et créé un projet correspondant qui inclut une session de carnet. Vous pouvez maintenant passer aux tâches suivantes :