Ottimizzazione
Il fine tuning è il processo di adozione di un modello pre-addestrato e di ulteriore addestramento su un set di dati specifico del dominio per migliorarne le conoscenze e fornire risposte migliori in tale dominio.
Quando si ottimizza un modello nelle azioni rapide AI, si sta creando un lavoro di Data Science per farlo. È necessario disporre dei criteri necessari per utilizzare i job di Data Science per creare un job di ottimizzazione per ottimizzare un modello di base nelle azioni rapide AI. Quando si crea un job di ottimizzazione, è possibile selezionare un data set per addestrare il modello di base. I modelli di base con il tag Ready to Fine Tune
in Model Explorer possono essere ottimizzati. È possibile selezionare un data set dallo storage degli oggetti o caricare un data set dallo storage del notebook in cui si sta lavorando. Quando carichi i data set da un notebook, vengono salvati nel bucket di storage degli oggetti in cui viene salvato il modello ottimizzato. Pertanto, è necessario il criterio per consentire alla sessione notebook di scrivere file nello storage degli oggetti. Il data set deve essere in formato JSONL e includere le colonne 'prompt' e 'completion' necessarie. Facoltativamente, è possibile includere una colonna 'categoria'. Se nel bucket esiste già un file di data set con lo stesso nome, viene sostituito dal nuovo file. Il set di dati deve contenere almeno 100 record per l'ottimizzazione.
È possibile impostare la percentuale del data set per la convalida del modello. Il set di versioni del modello è un modo per raggruppare un insieme di modelli correlati. È possibile selezionare un set di versioni del modello esistente per inserire il modello ottimizzato o crearne uno nuovo. Puoi salvare il modello ottimizzato in un bucket di storage degli oggetti per il quale deve essere abilitato il controllo delle versioni.
Dopo aver inserito le informazioni sul modello, il set di dati, il set di versioni del modello e dove salvare il modello ottimizzato, è possibile scegliere l'infrastruttura di calcolo e la rete per il job di tuning. Facoltativamente, è possibile impostare la registrazione per monitorare il processo di ottimizzazione. Si consiglia di eseguire il log per risolvere eventuali errori nel job. Per impostare la registrazione è necessario disporre dei criteri necessari. Sono supportati l'allenamento e l'allenamento a nodo singolo con diverse schede GPU. È possibile specificare i parametri per l'ottimizzazione del modello, delle epoche e del tasso di apprendimento.
È possibile rivedere le configurazioni e i parametri impostati per il job di ottimizzazione prima della creazione del job.
Per un elenco completo dei parametri e dei valori per i comandi CLI delle azioni rapide AI, vedere CLI Azioni rapide AI.
Impossibile eseguire questo task utilizzando l'API.