Choisir une méthode de réglage fin dans l'IA générative
Lorsque vous créez un modèle personnalisé, OCI Generative AI affine les modèles de base préentraînés à l'aide d'une méthode qui correspond au modèle de base.
Certains modèles préentraînés de base OCI Generative AI pris en charge pour le mode de service dédié sont désormais en phase d'abandon et le seront au plus tôt 6 mois après la publication du 1er modèle de remplacement. Vous pouvez affiner et héberger un modèle de base préentraîné sur un cluster d'IA dédié (mode de service dédié) jusqu'à ce que ce modèle soit abandonné. Pour connaître les dates de retrait du mode de service dédié, reportez-vous à la section Retrait des modèles.
Le tableau suivant répertorie la méthode utilisée par Generative AI pour entraîner chaque type de modèle de base :
Modèle de base préentraîné | Méthode de formation |
---|---|
cohere.command-r-16k
|
|
meta.llama-3.1-70b-instruct
|
|
cohere.command (en phase d'abandon) |
|
cohere.command-light (en phase d'abandon) |
|
meta.llama-3-70b-instruct (obsolète prochainement) |
|
Pour plus d'informations sur les hyperparamètres utilisés pour chaque méthode d'entraînement, reportez-vous à Hyperparamètres pour le réglage fin d'un modèle dans l'IA générative.
Choisir entre T-Few
et Vanilla
Pour les modèles cohere.command
et cohere.command-light
, OCI Generative AI propose deux méthodes d'entraînement : T-Few
et Vanilla
. Suivez les instructions ci-après pour choisir la meilleure méthode de formation pour vos cas d'emploi.
Caractéristique | Options et recommandations |
---|---|
Méthodes de formation pour cohere.command et cohere.command-light
|
|
Taille de l'ensemble de données |
L'utilisation de petits ensembles de données pour la méthode |
Complexité |
|
Hébergement |
|