Dataset importieren

So importieren Sie ein Dataset in Data Labeling:

    1. Öffnen Sie das Navigationsmenü, und klicken Sie auf Analysen und KI. Klicken Sie unter Maschinelles Lernen auf Data Labeling.
    2. Klicken Sie auf Datasets.
    3. Klicken Sie auf Dataset importieren.
    4. Auf der Seite Ordner importieren geben Sie an, ob Sie einen lokalen Ordner in Object Storage hochladen, um ein Dataset zu erstellen (gehen Sie zu Schritt 5), oder ob Sie Metadaten und Datensätze abrufen möchten, die sich bereits in Object Storage befinden (übergehen Sie zu Schritt 6).
    5. So laden Sie Dateien hoch: Klicken Sie aus einem lokalen Ordner in Object Storage auf Lokalen Ordner hochladen, und führen Sie die folgenden Schritte aus:
      1. Klicken Sie auf Ordner auswählen, um einen Ordner im Dateimanager auszuwählen, der die Dataset-Dateien enthält.
        Hinweis

        In einigen Formaten enthält das Dataset eine Metadatendatei und Datensatzdateien. Die Datensatzdateien können sich in einem Unterordner oder im selben Ordner wie die Metadatendatei befinden.
      2. Wählen Sie den Ordner aus, und klicken Sie auf Hochladen. Der Ordnername und der Pfad zur Metadatendatei werden erkannt und unter Ausgewählter Ordner angezeigt. Klicken Sie auf Bearbeiten, um die Auswahl des Ordners zu ändern, und auf Löschen, um die Auswahl zu löschen.
      3. Geben Sie unter Object_Storage-Speicherort den Objektspeicher-Bucket an, in den Sie die lokalen Dateien laden möchten:
        • Object Storage-URL: Ein schreibgeschütztes Feld, das bereits ausgefüllt ist.
        • Compartment: Wählen Sie das Compartment aus, das den Bucket enthält.
        • Namespace: Wird basierend auf dem ausgewählten Compartment automatisch aufgefüllt.
        • Bucket: Wählen Sie einen Bucket in der Liste aus. Wenn die Liste lang ist, können Sie alle Buckets anzeigen. Wenn Sie darauf klicken, wird ein Fensterbereich mit einer Liste aller verfügbaren Buckets geöffnet. Wenn Sie einen Bucket erstellen müssen, klicken Sie auf den Link in der QuickInfo neben dem Label Bucket. Dadurch gelangen Sie zur Listenseite Buckets im Object Storage-Service. Siehe Bucket erstellen.
        • (Optional) Präfix: Geben Sie eine Präfixzeichenfolge ein, die den Namen oder Pfaden der Dateien hinzugefügt werden soll.
      4. Klicken Sie auf Weiter, und fahren Sie mit Schritt 7 fort.
    6. Um Metadaten und Datensätze abzurufen, die sich bereits in Object Storage befinden, klicken Sie auf Aus Objektspeicher auswählen, und führen Sie die folgenden Schritte aus:
      1. Geben Sie im Object Storage-Speicherort die URL zur Metadatendatei in Object Storage ein, die Sie laden möchten, im Format: https://objectstorage.<region-identifer>.oraclecloud.com/n/<namespace>/b/<bucket>/o/<object>. Diese URL finden Sie auf der Seite mit den Bucket-Details wie folgt:
        • Gehen Sie zu dem Bucket, der die Datei enthält.
        • Klicken Sie unter Objekte auf den Ordner, der die Dataset-Metadatendatei enthält.
        • Suchen Sie die Metadatendatei.
        • Wählen Sie im Menü "Aktion" für die Metadatendatei die Option Objektdetails anzeigen.
        • Kopieren Sie den Wert für URL-Pfad (URI).
        • Fügen Sie sie in Object Storage-URL ein.
        Wenn Sie sie angegeben haben, werden die Felder Namespace, Bucket, Präfix und Objekt aus der URL ausgefüllt.
      2. Wenn sich die Datensatzdateien in einem anderen Verzeichnis als die Metadatendatei befinden, deaktivieren Sie unter Dateispeicherort das Kontrollkästchen Ein Datensatz ist in demselben Metadatenpfad vorhanden, und geben Sie die folgenden Informationen an:
        • Object Storage-URL: Ein schreibgeschütztes Feld, das bereits ausgefüllt ist.
        • Compartment: Wählen Sie das Compartment aus, das den Bucket enthält.
        • Namespace: Wird basierend auf dem ausgewählten Compartment automatisch aufgefüllt.
        • Bucket: Wählen Sie einen Bucket in der Liste aus. Wenn die Liste lang ist, können Sie alle Buckets anzeigen. Wenn Sie darauf klicken, wird ein Fensterbereich mit einer Liste aller verfügbaren Buckets geöffnet.
        • (Optional) Präfix: Geben Sie eine Präfixzeichenfolge ein, die zu den Dateinamen oder Pfaden der Dateien hinzugefügt werden soll.
      3. Klicken Sie auf Weiter.
    7. Auf der Seite Dataset-Details hinzufügen werden die Felder aus der Metadatendatei ausgefüllt. Sie können jedoch beliebige Felder nach Bedarf ausfüllen:
      • Name: Geben Sie dem Dataset einen geeigneten Namen.
      • Beschreibung: (Optional) Geben Sie dem Dataset eine relevante Beschreibung, die Sie bei der Suche verwenden können.
      • Labelanweisungen: (Optional) Geben Sie Anweisungen und Anweisungen für die Teamlabeling der Daten ein.
      • Dataset-Format: Klicken Sie auf Bilder, Text oder Dokumente, je nachdem, ob Sie Bilder, Textteile oder Dokumente labeln möchten.
      • Importformat: Wählen Sie das Dataset-Format aus. Zum Beispiel COCO oder YOLO v5.
      • Anmerkungsklasse: Wählen Sie aus, wie Bilder, Text oder Dokumente mit Anmerkungen versehen werden sollen.
        • Einzelne Labels: Kategorisiert Bilder, Text oder Dokumente in eine Klasse.
        • Mehrere Labels: Kategorisiert Bilder, Text oder Dokumente in eine oder mehrere Klassen.
        • Objekterkennung: Nur für Images. Zeichnet Begrenzungsrahmen um Objekt in den Bildern.
        • Entityextraktion: Nur für Text. Markiert und labelt Text für eine oder mehrere Klassen.
        • Schlüsselwert: Nur für Dokumente. Verwendet die Optical Character Recognition (OCR) von Document Understanding, um Informationen zu identifizieren und aus Dokumenten zu extrahieren.
      • Labels: Geben Sie die Labels ein, die mit dem Dataset verwendet werden sollen. Drücken Sie nach der Eingabe jedes Labels die Eingabetaste.
    8. Klicken Sie auf Weiter.
    9. Prüfen Sie auf der Seite Prüfen die Informationen, die Sie eingegeben haben. Klicken Sie auf Bearbeiten, wenn die Dataset-Details bearbeitet werden müssen. Wenn Sie zurückgehen und Werte ändern müssen, klicken Sie auf Bearbeiten.
    10. Klicken Sie auf Importieren.
      Die Datensätze werden generiert, wenn das Datenset importiert wird. Der Dataset-Status ändert sich in Updating, während die Datensätze generiert werden. Erst nachdem die Datensätze erstellt wurden, werden die verwendeten Dateien auf der Seite mit den Datensetdetails angezeigt.
      Hinweis

      Wenn Sie das falsche Format angegeben haben, verläuft der Import mit einer Fehlermeldung nicht erfolgreich. Klicken Sie in der Fehlermeldung auf Import wiederholen, um das Dialogfeld Import wiederholen anzuzeigen. Hier können Sie die Metadaten-URL oder das Importformat entsprechend aktualisieren und auf Wiederholen klicken, um den Import erneut zu versuchen.
    11. Um das Dataset später mit Resource Manager und Terraform zu importieren, klicken Sie auf Als Stack speichern, um die Ressourcendefinition als Terraform-Konfiguration zu speichern.
      Informationen zum Speichern von Stacks aus Ressourcendefinitionen finden Sie unter Stacks auf der Seite "Ressourcen erstellen" erstellen.
  • Verwenden Sie den Befehl import-pre-annotated-data und die erforderlichen Parameter, um Datensätze und Anmerkungen aus Dataset-Dateien in ein Dataset zu importieren:

    oci data-labeling-service dataset import-pre-annotated [OPTIONS]
    Verwenden Sie den Befehl import-pre-annotated-data-object-storage-import-metadata-path und die erforderlichen Parameter, um Datensätze und Annotationen aus Dataset-Dateien im Objektspeicher in ein Dataset zu importieren:
    oci data-labeling-service dataset import-pre-annotated-data-object-storage-import-metadata-path [OPTIONS]

    Eine vollständige Liste der Flaggen und Variablenoptionen für CLI-Befehle finden Sie in der CLI-Befehlsreferenz.

  • Diese Aufgabe ist in der API nicht verfügbar.