Data Science-Mandanten manuell konfigurieren
In diesem Tutorial richten Sie Ihren Mandanten für Data Science ein und testen ihn, indem Sie eine Notizbuchsession erstellen.
Dieses Tutorial richtet sich an Admin-Benutzer, da ihnen die erforderlichen Zugriffsberechtigungen erteilt wurden.
In diesem Tutorial werden Sie:
1. Data-Scientist-Benutzergruppe erstellen.
2. Compartment für Ihre Arbeit erstellen.
3. (Optional) VCN und Subnetz erstellen
Bevor Sie beginnen
Voraussetzungen für dieses Tutorial:
-
Ein kostenloser Oracle Cloud Infrastructure-(OCI-)Account oder ein neuer Account mit Oracle Cloud-Promotions. Siehe Kostenlose Oracle Cloud-Promotions anfordern und verwalten.
- Administratorberechtigung für den OCI-Account.
-
Mindestens einen Benutzer in Ihrem Mandanten, der auf den Data-Science-Service zugreifen möchte. Dieser Benutzer muss in IAM erstellt werden.
1. Data-Scientist-Benutzergruppe erstellen
Erstellen Sie eine Benutzergruppe für die Data Scientists.
2. Compartment für Ihre Arbeit erstellen
Erstellen Sie ein Compartment für Ihre Data Science-Ressourcen.
- Führen Sie die Schritte unter Compartment erstellen aus, um ein Compartment zu erstellen.
- Geben Sie dem neuen Compartment den Namen data-science-work und eine Beschreibung ein.
- Vergewissern Sie sich, dass das Compartment in der Compartment-Liste angezeigt wird.
3 (Optional) VCN und Subnetz erstellen
Dieser Schritt ist optional. Wenn Sie in Schritt 6 eine Notizbuchsession erstellen. Beim Erstellen einer Notizbuchsession können Sie ein Standardnetzwerk mit dem richtigen Setup für Notizbuchsessions erstellen.
Sie können das Erstellen eines Netzwerks und das Einrichten von Subnetzen und Gateways überspringen, wenn Sie beim Erstellen eines Notizbuchs das Standardnetzwerk auswählen. Wenn das Standardnetzwerk in einem Notizbuch konfiguriert ist, können Sie es beim erneuten Aktivieren des Notizbuchs nicht ändern.
In diesem Abschnitt wird Benutzern gezeigt, die Zugriff auf ihre VCNs benötigen, wie Sie ein VCN erstellen und später das empfohlene Subnetz für Notizbuchsessions auswählen. Beispiel: Wenn Sie das Tutorial Data Science-Jobläufe planen ausführen, erstellen Sie dieses Netzwerk und verwenden es sowohl für die Notizbuchsession in Data Science als auch für den Workspace im Data Integration-Service.
Für den Egress-Zugriff auf das öffentliche Internet wird empfohlen, ein privates Subnetz mit einer Route zu einem NAT-Gateway zu verwenden. Ein NAT-Gateway ermöglicht Instanzen in einem privaten Subnetz Zugriff auf das Internet. Das in diesem Schritt erstellte VCN erstellt ein privates Subnetz mit Egress-Zugriff auf das Internet über das NAT-Gateway des VCN.
4. Policys erstellen
Bevor Benutzer ihre Notizbuchsessions starten, müssen Sie die Data Science-Policys konfigurieren.
Erläuterung zu den Richtlinien:
-
Um zu ermöglichen, dass der Data Science-Service das VCN an die Notebook-Session anhängen und Egress-Traffic aus der Notebook-Umgebung weiterleiten kann, fügen Sie Folgendes hinzu:
allow service datascience to use virtual-network-family in compartment data-science-work
-
Damit die Gruppe
data-scientists
Vorgänge für alle Data Science-Ressourcen im Compartmentdata-science-work
ausführen kann (Projekte, Notizbuchsessions, Modelle, Modell-Deployments, Arbeitsanforderungen, Jobs und Jobläufe), fügen Sie Folgendes hinzu:allow group data-scientists to manage data-science-family in compartment data-science-work
-
Um zuzulassen, dass diese Data Scientists das von Ihnen erstellte VCN verwenden und an ihre Notebook-Session anschließen, fügen Sie Folgendes hinzu:
allow group data-scientists to use virtual-network-family in compartment data-science-work
-
Um diesen Data Scientists das Erstellen und Verwalten von Buckets zu ermöglichen, wie das Hinzufügen von Artefakten und Conda-Umgebungen zu Buckets, fügen Sie Folgendes hinzu:
allow group data-scientists to manage buckets in compartment data-science-work allow group data-scientists to manage objects in compartment data-science-work
Anstatt anzugeben, welche Ressourcen wie Buckets, Objekte oder virtuelle Netzwerkfamilie verwaltet werden sollen, um Data Scientists administrative Rechte für ihr Compartment zu erteilen, in denen sie alle Ressourcen von OCI-Services verwalten können, ersetzen Sie die vorhergehenden fünf Policys durch die folgenden beiden Policys:
allow group data-scientists to manage all-resources in compartment data-science-work
allow service datascience to use virtual-network-family in compartment data-science-work
5. Eine dynamische Gruppe mit Policys erstellen
Erstellen Sie eine dynamische Gruppe für Data Science-Ressourcen, und ermöglichen Sie dieser dynamischen Gruppe den Zugriff auf andere OCI-Ressourcen, wie Object Storage und Logging.
Um OCI-Ressourcen den Zugriff auf andere OCI-Ressourcen zu erteilen, fügen Sie zunächst die Ressourcen einer dynamischen Gruppe anstelle einer Benutzergruppe hinzu. Anschließend schreiben Sie Policys, damit die dynamische Gruppe auf angegebene Ressourcen zugreifen kann. Hier umfasst Ihre dynamische Gruppe drei Data Science-Ressourcen: Notebook-Sessions, Modell-Deployments und Jobläufe.
Mit dieser dynamischen Gruppe können Sie Notizbuchsessions und Modell-Deployments im Compartment data-science-work
Zugriff auf andere OCI-Ressourcen im Mandanten gewähren.
Erläuterung zu den Richtlinien:
-
Um zuzulassen, dass Notizbuchsessions CRUD-Vorgänge für Einträge im Modellkatalog, in Projekten und Notizbuchsession-Ressourcen ausführen, fügen Sie Folgendes hinzu:
allow dynamic-group data-science-dynamic-group to manage data-science-family in compartment data-science-work
-
Um die Ausführung von CRUD-Vorgängen an Datenflussanwendungen zu ermöglichen und diese auszuführen, fügen Sie Folgendes hinzu:
allow dynamic-group data-science-dynamic-group to manage dataflow-family in compartment data-science-work
-
Um zu ermöglichen, dass Notizbuchsessions Compartments und Benutzernamen im Mandanten auflisten und lesen können, fügen Sie Folgendes hinzu:
allow dynamic-group data-science-dynamic-group to read compartments in tenancy allow dynamic-group data-science-dynamic-group to read users in tenancy
-
Um zuzulassen, dass Modellbereitstellungen Logs an den Logging-Service senden, fügen Sie Folgendes hinzu:
allow dynamic-group data-science-dynamic-group to use log-content in compartment data-science-work
-
Um die Erstellung von Logs zu ermöglichen und Joblaufdetails im Logging-Service aufzuzeichnen, fügen Sie Folgendes hinzu:
allow dynamic-group data-science-dynamic-group to use log-groups in compartment data-science-work
-
Um zuzulassen, dass Notizbuchsessions und Modell-Deployments Dateien in Objektspeicher-Buckets lesen und schreiben, fügen Sie Folgendes im Compartment
data-science-work
hinzu:allow dynamic-group data-science-dynamic-group to manage object-family in compartment data-science-work
- Die vorherige Policy lässt zu, dass Modell-Deployments auf einen beliebigen Bucket im Compartment data-science-work zugreifen.
- Um Modell-Deployments Lesezugriff auf bestimmte Buckets außerhalb des Compartments data-science-work zu erteilen, geben Sie die Bucket-Namen und die Compartments in Ihrer Policy an.
- Beispiel: Um Modellbereitstellungen den Zugriff auf veröffentlichte Conda-Umgebungen aus dem Bucket
published-conda-env
und Modellartefakte aus dem Bucketmodel-artifacts
zu ermöglichen, fügen Sie Folgendes hinzu:allow dynamic-group data-science-dynamic-group to read objects in compartment <another-compartment> where ANY {target.bucket.name='published-conda-envs', target.bucket.name='model-artifacts'}
- Wenn Ihre Policy-Anweisungen den Mandanten erwähnen oder Compartments außerhalb des Compartments
data-science-work
einschließen, wählen Sie im Dialogfeld Policy erstellen für die Option Compartment die Option <your-tenancy> (root) aus. Auf diese Weise kann die Policy neben Ihrem Compartment Regeln für andere Compartments im Mandanten enthalten.
6. Notizbuchsession erstellen
Erstellen Sie schließlich eine Notizbuchsession, und testen Sie deren Zugriff auf das öffentliche Internet.
Weitere Schritte
Sie haben erfolgreich einen Data Science-Mandanten eingerichtet und ein Data Science-Projekt erstellt, das eine Notizbuchsession umfasst. Jetzt können Sie mit den folgenden Aufgaben fortfahren: