Configuration manuelle d'une location Data Science
Dans ce tutoriel, vous allez configurer votre location pour Data Science et la tester en créant une session de bloc-notes.
Ce tutoriel est destiné aux administrateurs car ils disposent des droits d'accès requis.
Dans ce tutoriel, vous allez effectuer les opérations suivantes :
1. Création d'un groupe d'analystes de données.
2. Création d'un compartiment pour votre travail.
3. (Facultatif) Création d'un VCN et d'un sous-réseau.
Avant de commencer
Pour effectuer ce tutoriel, vous devez disposer des éléments suivants :
-
Un compte Oracle Cloud Infrastructure (OCI) a payé ou un nouveau compte avec promotions Oracle Cloud. Reportez-vous à Demande et gestion des promotions Oracle Cloud gratuites.
- Des privilèges administrateur pour le compte OCI.
-
Au moins un utilisateur dans la location qui a besoin d'accéder au service Data Science. Cet utilisateur doit être créé dans IAM.
1. Création d'un groupe d'analystes de données
Créez un groupe d'utilisateurs pour les analystes de données.
2. Création d'un compartiment pour votre travail
Créez un compartiment pour les ressources de science des données.
- Suivez les étapes décrites dans Création d'un compartiment pour créer un compartiment.
- Donnez un nom au nouveau compartiment data-science-work et entrez une description.
- Vérifiez que le compartiment apparaît dans la liste des compartiments.
3 (Facultatif) Création d'un VCN et d'un sous-réseau
Cette opération est facultative. Lorsque vous créez une session de bloc-notes à l'étape 6. Création d'une session de bloc-notes, vous pouvez choisir de créer un réseau par défaut avec la configuration appropriée pour les sessions de bloc-notes.
Vous pouvez ignorer la création d'un réseau et la configuration de sous-réseaux et de passerelles si vous sélectionnez la mise en réseau par défaut lors de la création d'un bloc-notes. Si la mise en réseau par défaut est configurée dans un bloc-notes, vous ne pouvez pas la modifier lors de la réactivation du bloc-notes.
Cette section indique aux utilisateurs qui ont besoin d'accéder à leurs réseaux cloud virtuels, comment créer un VCN et versions ultérieures, comment sélectionner le sous-réseau recommandé pour les sessions de bloc-notes. Par exemple, si vous exécutez le tutoriel Programmation des exécutions de travail Data Science, créez ce réseau et utilisez-le à la fois pour la session de bloc-notes dans Data Science et pour l'espace de travail dans le service Data Integration.
Pour l'accès sortant au réseau Internet public, nous vous recommandons d'utiliser un sous-réseau privé doté d'un routage vers une passerelle NAT. La passerelle NAT fournit l'accès à Internet aux instances d'un sous-réseau privé. Le VCN que vous créez à cette étape crée un sous-réseau privé avec un accès sortant à Internet via la passerelle NAT du VCN.
4. Création de stratégies
Avant que les utilisateurs démarrent leurs sessions de bloc-notes, vous devez configurer les stratégies Data Science.
Explication des stratégies :
-
Pour permettre au service Data Science d'attacher votre VCN à votre session de bloc-notes et d'acheminer le trafic sortant à partir de l'environnement de bloc-notes, ajoutez :
allow service datascience to use virtual-network-family in compartment data-science-work
-
Pour autoriser le groupe
data-scientists
à effectuer des opérations sur toutes les ressources Data Science du compartimentdata-science-work
(projets, sessions de bloc-notes, modèles, déploiements de modèle, demandes de travail, travaux et traitements de travail), ajoutez :allow group data-scientists to manage data-science-family in compartment data-science-work
-
Pour permettre à ces data scientists d'utiliser le VCN, vous l'avez créé et attaché à leur session de bloc-notes, ajoutez :
allow group data-scientists to use virtual-network-family in compartment data-science-work
-
Pour permettre à ces analystes de créer et de gérer des compartiments, par exemple en ajoutant des artefacts et des environnements conda aux compartiments, ajoutez :
allow group data-scientists to manage buckets in compartment data-science-work allow group data-scientists to manage objects in compartment data-science-work
Au lieu de spécifier les ressources à gérer, telles que les buckets, les objets ou la famille de réseaux virtuels, afin d'autoriser les droits d'administration des analystes de données sur leur compartiment, dans lequel ils peuvent gérer toutes les ressources des services OCI, remplacez les cinq stratégies précédentes par les deux stratégies suivantes :
allow group data-scientists to manage all-resources in compartment data-science-work
allow service datascience to use virtual-network-family in compartment data-science-work
5. Création d'un groupe dynamique avec des stratégies
Créez un groupe dynamique pour les ressources Data Science et autorisez-le à accéder à d'autres ressources OCI, telles qu'Object Storage et Logging.
Pour accorder des droits d'accès à d'autres ressources OCI, vous devez d'abord ajouter les ressources à un groupe dynamique plutôt qu'à un groupe d'utilisateurs. Ecrivez ensuite des stratégies pour permettre au groupe dynamique d'accéder aux ressources indiquées. Ici, le groupe dynamique dispose de trois ressources Data Science : des sessions de bloc-notes, des déploiements de modèle et des traitements de travail.
Vous pouvez utiliser ce groupe dynamique pour accorder aux sessions de bloc-notes et aux déploiements de modèle qui se trouvent dans le compartiment data-science-work
un accès à d'autres ressources OCI dans la location.
Explication des stratégies :
-
Pour permettre aux sessions de bloc-notes d'effectuer des opérations CRUD sur les entrées des ressources de session de bloc-notes, de projet et de catalogue de modèles, ajoutez les éléments suivants :
allow dynamic-group data-science-dynamic-group to manage data-science-family in compartment data-science-work
-
Pour permettre aux sessions de bloc-notes d'effectuer des opérations CRUD sur les applications et les exécutions Data Flow, ajoutez :
allow dynamic-group data-science-dynamic-group to manage dataflow-family in compartment data-science-work
-
Pour permettre aux sessions de bloc-notes de répertorier et de lire les compartiments et les noms utilisateur qui sont dans la location, ajoutez les éléments suivants :
allow dynamic-group data-science-dynamic-group to read compartments in tenancy allow dynamic-group data-science-dynamic-group to read users in tenancy
-
Pour permettre aux déploiements de modèle d'envoyer des journaux au service Logging, ajoutez :
allow dynamic-group data-science-dynamic-group to use log-content in compartment data-science-work
-
Pour permettre aux exécutions de travail de créer des journaux et d'enregistrer les détails de traitement de travail dans le service Logging, ajoutez :
allow dynamic-group data-science-dynamic-group to use log-groups in compartment data-science-work
-
Pour permettre aux sessions de bloc-notes et aux déploiements de modèle de lire et d'écrire des fichiers dans les buckets Object Storage, dans le compartiment
data-science-work
, ajoutez ce qui suit :allow dynamic-group data-science-dynamic-group to manage object-family in compartment data-science-work
- La stratégie précédente permet aux Déploiements de modèle d'accéder à n'importe quel bucket du compartiment data-science-work.
- Pour accorder aux déploiements de modèle un accès en lecture à des buckets spécifiques en dehors au compartiment data-science-work, indiquez les noms des buckets et leurs compartiments dans la stratégie.
- Par exemple, pour permettre aux déploiements de modèle d'accéder aux environnements conda publiés du bucket
published-conda-env
et aux artefacts de modèle du bucketmodel-artifacts
, ajoutez :allow dynamic-group data-science-dynamic-group to read objects in compartment <another-compartment> where ANY {target.bucket.name='published-conda-envs', target.bucket.name='model-artifacts'}
- Si vos instructions de stratégie mentionnent la location ou incluent des compartiments en dehors du compartiment
data-science-work
, sélectionnez <your-tenancy> (root) dans la boîte de dialogue Créer une stratégie pour l'option Compartiment. De cette façon, en plus de votre compartiment, la stratégie peut inclure des règles pour d'autres compartiments dans la location.
6. Création d'une session de bloc-notes
Enfin, créez une session de bloc-notes et testez son accès au réseau Internet public.
Etapes suivantes
Vous avez configuré une location Data Science et créé un projet Data Science qui inclut une session de bloc-notes. Vous pouvez maintenant passer aux tâches suivantes :