Modell erstellen und trainieren

Verwenden Sie ein Sprachprojekt, um ein Modell zu enthalten, das die beschrifteten Daten beschreibt.

    1. Öffnen Sie das Navigationsmenü, und wählen Sie Analysen und KI aus. Wählen Sie unter KI-Services die Option Sprache aus.
    2. Wählen Sie im linken Navigationsmenü die Option Projekte.
      Die Projektlistenseite wird geöffnet. Alle Projekte im ausgewählten Compartment werden in einer Tabelle angezeigt.
    3. Wählen Sie das Compartment mit dem gewünschten Projekt aus, oder wählen Sie das Compartment aus, in dem Sie ein Projekt erstellen möchten.
    4. Führen Sie einen der folgenden Schritte durch:
      1. Um ein vorhandenes Projekt zu verwenden, klicken Sie auf seinen Namen.
      2. Um ein neues Projekt zu erstellen, klicken Sie auf Projekt erstellen.
    5. Klicken Sie auf der Detailseite des Projekts auf Benutzerdefinierte Modelle erstellen.
    6. Wählen Sie den Modelltyp aus:
    7. Wählen Sie unter Schulungsdaten eine der folgenden Optionen aus, und geben Sie die zusätzlichen Informationen an:
      • Object Storage

        Stellen Sie zunächst sicher, dass das Dataset zulässig ist und in einem Bucket in Object Storage hochgeladen wird. Wählen Sie dann die folgenden Werte aus:

        1. Wählen Sie den Bucket aus, in dem sich das Dataset befindet.

        2. Wählen Sie eine Trainingsdatendatei für das zu verwendende Modell aus. Wählen Sie für Sprach-PII-Entitys eine Laderegel aus.

      • Data Labeling

        Wählen Sie in der Liste ein Dataset für das zu verwendende Modell aus.

    8. (Optional) Klicken Sie auf Compartment ändern, um ein anderes Compartment für den Bucket oder das Dataset auszuwählen.
    9. (Optional) Klicken Sie hier, um ein neues Dataset mit dem Data Labeling-Service zu erstellen.
      1. Geben Sie die Details für das Dataset ein.
      2. Dataset erstellen.
      3. Zurück zum Sprachdienst.

      Weitere Informationen zum Erstellen und Beschriften von Datensets für Data Labeling finden Sie unter Textlabeling, Dokumentlabeling und Erstellen von Datensets für Data Labeling.

    10. (Optional) Um die Validierungs- und Testdaten festzulegen, klicken Sie auf Erweiterte Optionen anzeigen, und wählen Sie dann die zu verwendenden Validierungs- und Test-Datasets aus.

      Ändern Sie das Compartment, wenn sich das Dataset in einem anderen befindet.

      Wenn Sie ein Validierungs-Dataset auswählen, benötigen Sie ein entsprechendes Test-Dataset.

    11. Klicken Sie auf Weiter.
    12. Wählen Sie ein Compartment aus, in dem das benutzerdefinierte Modell gehostet werden soll. Es wird empfohlen, sie im selben Compartment wie das Projekt zu speichern.
    13. (Optional) Geben Sie einen eindeutigen Namen (max. 255 Zeichen) für die Ressource ein.

      Wenn Sie keinen Namen angeben, wird automatisch ein Name generiert. Beispiel: ailanguage<resource>20230825155844.

    14. (Optional) Geben Sie eine Beschreibung (maximal 400 Zeichen) für die Ressource ein.
    15. Klicken Sie auf Weiter.
    16. Prüfen Sie die Auswahl.
    17. (Optional) Klicken Sie auf Bearbeiten, um die Auswahl zu ändern, indem Sie zum Schritt Daten auswählen oder Modelldetails zurückkehren, und führen Sie die Schritte dann erneut aus.
    18. Klicken Sie auf Erstellen und trainieren.
    Dieser Schritt kann je nach Dataset bis zu 30 Minuten dauern. Die Modellmetriken werden aufgefüllt, nachdem das Modell aktiv ist.
  • Verwenden Sie den Befehl oci ai language model create und die erforderlichen Parameter, um ein Modell zu erstellen:

    oci ai language model create --compartment-id <compartment-id>, -c [<name>] ... [OPTIONS]

    Eine vollständige Liste der Flags und Variablenoptionen für CLI-Befehle finden Sie in der CLI-Befehlsreferenz.

  • Führen Sie den Vorgang CreateModel aus, um ein Modell zu erstellen.