Fine-Tuning

Bei der Feinabstimmung wird ein vortrainiertes Modell verwendet und auf einem domänenspezifischen Dataset weitergebildet, um sein Wissen zu verbessern und bessere Antworten in dieser Domain bereitzustellen.

Wenn Sie ein Modell in AI-Schnellaktionen optimieren, erstellen Sie dazu einen Data-Science-Job. Sie benötigen die erforderliche Policy, um mit Data Science-Jobs einen Optimierungsjob zum Optimieren eines Basismodells in KI-Schnellaktionen zu erstellen. Wenn Sie einen Optimierungsjob erstellen, können Sie ein Dataset zum Trainieren des Basismodells auswählen. Foundation-Modelle mit dem Tag Ready to Fine Tune im Model Explorer können verfeinert werden. Sie können ein Dataset aus Object Storage auswählen oder ein Dataset aus dem Speicher des Notizbuchs hochladen, in dem Sie arbeiten. Wenn Sie Datensets aus einem Notizbuch hochladen, werden sie im Object Storage-Bucket gespeichert, in dem das optimierte Modell gespeichert wird. Daher benötigen Sie die Policy, damit die Notizbuchsession Dateien in Object Storage schreiben kann. Das Dataset muss im JSONL-Format vorliegen und die erforderlichen Spalten "prompt" und "completion" enthalten. Optional können Sie eine Spalte "Kategorie" einschließen. Wenn bereits eine Dataset-Datei mit demselben Namen im Bucket vorhanden ist, wird sie durch die neue Datei ersetzt. Das Dataset muss mindestens 100 Datensätze für die Feinabstimmung enthalten.

Sie können festlegen, welcher Prozentsatz des Datasets für die Modellvalidierung verwendet wird. Modellversionsset ist eine Möglichkeit, eine Gruppe von Modellen zu gruppieren, die miteinander verbunden sind. Sie können ein vorhandenes Modellversionsset auswählen, in das das optimierte Modell eingefügt wird, oder ein neues Modell erstellen. Sie können das optimierte Modell in einem Objektspeicher-Bucket speichern, für den Versionierung aktiviert sein muss.

Nachdem Sie die Modellinformationen, das Dataset, das Modellversionsset und den Speicherort des optimierten Modells eingegeben haben, können Sie die Compute-Infrastruktur und das Networking für den Feinabstimmungsjob auswählen. Optional können Sie das Logging einrichten, um den Optimierungsjob zu überwachen. Wir empfehlen die Protokollierung, um Fehler im Job zu beheben. Sie benötigen die erforderliche Policy, um das Logging einzurichten. Einzelknotentraining und Training mit mehreren GPU-Karten werden unterstützt. Sie können die Parameter für die Feinabstimmung des Modells, der Epochen und der Lernrate angeben.

Sie können die Konfigurationen und Parameter prüfen, die Sie für den Feinabstimmungsjob festgelegt haben, bevor der Job erstellt wird.

    1. Navigieren Sie zum Modell-Explorer.
    2. Wählen Sie die Modellkarte für das Fundamentmodell aus, das Sie optimieren möchten.
    3. Wählen Sie Optimieren aus, um das Modell mit dem Dataset zu optimieren.
      Die Seite Optimiertes Modell erstellen wird angezeigt.
    4. Akzeptieren Sie den Standardnamen, oder geben Sie einen Namen für das optimierte Modell ein.
    5. (Optional) Fügen Sie eine Beschreibung hinzu.
    6. Um ein Dataset anzugeben, wählen Sie Vorhandenes Dataset auswählen oder Dataset aus Notizbuchspeicher hochladen aus.
    7. (Optional) Wenn Sie in Schritt 6 die Option Vorhandenes Dataset auswählen ausgewählt haben, wählen Sie das Compartment aus.
    8. (Optional) Wenn Sie in Schritt 6 die Option Vorhandenes Dataset auswählen ausgewählt haben, wählen Sie den Object Storage-Speicherort des Datasets aus.
    9. (Optional) Geben Sie die Validierungsaufteilung an, um anzugeben, welcher Prozentsatz des Datasets für die Validierung verwendet werden soll.
    10. Um ein Modellversionsset anzugeben, wählen Sie Vorhandenes Versionsset auswählen oder Neues Versionsset erstellen aus.
    11. (Optional) Wenn Sie Vorhandenes Versionsset auswählen ausgewählt haben, wählen Sie das Versionsset aus.
    12. (Optional) Wenn Sie Neue Versionen erstellen ausgewählt haben:
      1. Geben Sie den Namen des Versionssets ein.
      2. Optional: Geben Sie der Version eine Beschreibung an
    13. Geben Sie den Object Storage-Bucket an, in dem die Ergebnisse gespeichert werden sollen:
      1. Compartment auswählen.
      2. Wählen Sie den Object Storage-Speicherort aus.
      3. Optional: Geben Sie den Object Storage-Pfad an.
    14. Wählen Sie Weiter aus.
    15. Wählen Sie unter Infrastruktur die zu verwendende Instanzausprägung aus.
    16. Geben Sie unter Repliken die Anzahl der Instanzen der Ausprägung an.
    17. (Optional) Wählen Sie unter Networking das zu verwendende VCN und Subnetz aus.
    18. (Optional) Wählen Sie unter Logging die zu verwendende Loggruppe und das zu verwendende Loglog aus.
    19. Geben Sie unter Parameter die Anzahl der Epochen und die zu verwendende Lernrate an.
    20. Wählen Sie Weiter aus.
      Die Bewertungsseite wird für die Feinabstimmung angezeigt, die Sie erstellen möchten.
    21. Wählen Sie Weiterleiten, um die Feinabstimmung zu starten.
  • Eine vollständige Liste der Parameter und Werte für AI Quick Actions-CLI-Befehle finden Sie unter AI Quick Actions-CLI.

  • Diese Aufgabe kann nicht mit der API ausgeführt werden.