Fine-Tuning
Bei der Feinabstimmung wird ein vortrainiertes Modell verwendet und auf einem domänenspezifischen Dataset weitergebildet, um sein Wissen zu verbessern und bessere Antworten in dieser Domain bereitzustellen.
Wenn Sie ein Modell in AI-Schnellaktionen optimieren, erstellen Sie dazu einen Data-Science-Job. Sie benötigen die erforderliche Policy, um mit Data Science-Jobs einen Optimierungsjob zum Optimieren eines Basismodells in KI-Schnellaktionen zu erstellen. Wenn Sie einen Optimierungsjob erstellen, können Sie ein Dataset zum Trainieren des Basismodells auswählen. Foundation-Modelle mit dem Tag Ready to Fine Tune
im Model Explorer können verfeinert werden. Sie können ein Dataset aus Object Storage auswählen oder ein Dataset aus dem Speicher des Notizbuchs hochladen, in dem Sie arbeiten. Wenn Sie Datensets aus einem Notizbuch hochladen, werden sie im Object Storage-Bucket gespeichert, in dem das optimierte Modell gespeichert wird. Daher benötigen Sie die Policy, damit die Notizbuchsession Dateien in Object Storage schreiben kann. Das Dataset muss im JSONL-Format vorliegen und die erforderlichen Spalten "prompt" und "completion" enthalten. Optional können Sie eine Spalte "Kategorie" einschließen. Wenn bereits eine Dataset-Datei mit demselben Namen im Bucket vorhanden ist, wird sie durch die neue Datei ersetzt. Das Dataset muss mindestens 100 Datensätze für die Feinabstimmung enthalten.
Sie können festlegen, welcher Prozentsatz des Datasets für die Modellvalidierung verwendet wird. Modellversionsset ist eine Möglichkeit, eine Gruppe von Modellen zu gruppieren, die miteinander verbunden sind. Sie können ein vorhandenes Modellversionsset auswählen, in das das optimierte Modell eingefügt wird, oder ein neues Modell erstellen. Sie können das optimierte Modell in einem Objektspeicher-Bucket speichern, für den Versionierung aktiviert sein muss.
Nachdem Sie die Modellinformationen, das Dataset, das Modellversionsset und den Speicherort des optimierten Modells eingegeben haben, können Sie die Compute-Infrastruktur und das Networking für den Feinabstimmungsjob auswählen. Optional können Sie das Logging einrichten, um den Optimierungsjob zu überwachen. Wir empfehlen die Protokollierung, um Fehler im Job zu beheben. Sie benötigen die erforderliche Policy, um das Logging einzurichten. Einzelknotentraining und Training mit mehreren GPU-Karten werden unterstützt. Sie können die Parameter für die Feinabstimmung des Modells, der Epochen und der Lernrate angeben.
Sie können die Konfigurationen und Parameter prüfen, die Sie für den Feinabstimmungsjob festgelegt haben, bevor der Job erstellt wird.
Eine vollständige Liste der Parameter und Werte für AI Quick Actions-CLI-Befehle finden Sie unter AI Quick Actions-CLI.
Diese Aufgabe kann nicht mit der API ausgeführt werden.