Détails de mesure dans Generative AI
Vous pouvez surveiller les ressources OCI Generative AI via les mesures fournies dans ce service. Vous pouvez également utiliser le service OCI Monitoring pour créer des requêtes et des alarmes personnalisées afin de vous avertir lorsque ces mesures répondent aux déclencheurs spécifiés par une alarme.
Hébergement de mesures de cluster d'IA dédiées
Cette section répertorie les mesures des clusters AI dédiés hébergés. Les clusters dédiés fine-tuning n'affichent pas de mesures.
Nom d'affichage de mesure | Description |
---|---|
Utilisation | Capacité disponible pour un cluster AI dédié affichée en pourcentage dans le temps |
Nombre total d'entrées | Nombre de jetons d'entrée que les modèles de ce cluster d'IA dédié d'hébergement ont traités |
Nombre total de sorties | Nombre de jetons de sortie traités par les modèles sur ce cluster d'IA dédié d'hébergement |
Vous pouvez obtenir les mesures précédentes à partir de la page de détails d'un cluster d'IA dédié hébergé.
Mesures d'adresse
Cette section répertorie les mesures pour les adresses de modèle dans Generative AI.
Nom d'affichage de mesure | Description |
---|---|
Durée totale de traitement | Durée totale de traitement pour qu'un appel se termine |
Nombre d'appels | Nombre de jetons d'entrée que le modèle hébergé sur cette adresse a traités |
Nombre d'erreurs de service | Nombre d'appels avec une erreur interne de service |
Nombre d'erreurs client | Nombre d'appels avec une erreur côté client |
Nombre total d'entrées | Nombre de jetons d'entrée que le modèle hébergé sur cette adresse a traités |
Nombre total de sorties | Nombre de jetons de sortie que le modèle hébergé sur cette adresse a traités |
Taux de succès des appels | Appels réussis divisés par le nombre total d'appels |
Vous pouvez obtenir les mesures précédentes à partir de la page de détails d'une adresse.
Mesures pour les requêtes personnalisées
Vous pouvez créer des requêtes et des alarmes personnalisées pour les mesures d'adresse et de cluster Generative AI via le service Monitoring.
Cette section répertorie les paramètres que vous pouvez utiliser pour créer des requêtes personnalisées pour les mesures d'IA générative à l'aide du service Monitoring.
Paramètre de mesure | Afficher le nom | Description |
---|---|---|
ClientErrorCount |
Nombre d'erreurs client | Nombre d'appels avec une erreur côté client |
InputTokenCount |
Nombre total d'entrées | Nombre de jetons d'entrée traités par les modèles hébergés sur cette ressource |
InvocationLatency |
Durée totale de traitement | Durée totale de traitement pour qu'un appel se termine sur cette ressource |
OutputTokenCount |
Nombre total de sorties | Nombre de jetons de sortie traités par les modèles hébergés sur cette ressource |
ServerErrorCount |
Nombre d'erreurs de service | Nombre d'appels avec une erreur interne de service |
TotalInvocationCount |
Nombre d'appels | Nombre d'appels |
Pour connaître les étapes de création de ces requêtes personnalisées, reportez-vous à Création d'une requête pour les mesures Generative AI.