Détails des mesures dans l'intelligence artificielle générative
Vous pouvez surveiller les ressources d'IA générative OCI au moyen des mesures fournies dans ce service. Vous pouvez également utiliser le service de surveillance pour OCI pour créer des interrogations et des alarmes personnalisées pour vous aviser lorsque ces mesures répondent à des déclencheurs spécifiés par une alarme.
Hébergement - Mesures de grappe dédiée à l'IA
Cette section répertorie les mesures pour l'hébergement des grappes d'intelligence artificielle dédiées. Les grappes dédiées au réglage fin n'affichent pas de mesures.
Nom d'affichage de la mesure | Description |
---|---|
Utilisation | Capacité disponible pour une grappe d'IA dédiée affichée en pourcentage sur une période |
Nombre total d'entrées | Nombre de jetons d'entrée que les modèles de cette grappe d'IA dédiée d'hébergement ont traités |
Nombre total de sorties | Nombre de jetons de sortie que les modèles de cette grappe d'IA dédiée d'hébergement ont traités |
Vous pouvez obtenir les mesures précédentes à partir de la page de détails d'une grappe dédiée à l'IA hôte.
Mesures liées aux points d'extrémité
Cette section répertorie les mesures pour les points d'extrémité de modèle dans l'IA générative.
Nom d'affichage de la mesure | Description |
---|---|
Temps total de traitement | Temps total de traitement d'un appel |
Nombre d'appels | Nombre de jetons d'entrée que le modèle hébergé sur ce point d'extrémité a traités |
Nombre d'erreurs de service | Nombre d'appels avec une erreur interne de service |
Nombre d'erreurs de client | Nombre d'appels avec une erreur côté client |
Nombre total d'entrées | Nombre de jetons d'entrée que le modèle hébergé sur ce point d'extrémité a traités |
Nombre total de sorties | Nombre de jetons de sortie que le modèle hébergé sur ce point d'extrémité a traités |
Taux de réussite des appels | Appels réussis divisés par le nombre total d'appels |
Vous pouvez obtenir les mesures précédentes à partir de la page de détails d'un point d'extrémité.
Mesures pour les interrogations personnalisées
Vous pouvez créer des interrogations et des alarmes personnalisées pour la grappe d'IA générative et les mesures de point d'extrémité au moyen du service de surveillance.
Cette section répertorie les paramètres que vous pouvez utiliser pour créer des interrogations personnalisées pour des mesures d'intelligence artificielle générative à l'aide du service de surveillance.
Paramètre de mesure | Nom d'affichage | Description |
---|---|---|
ClientErrorCount |
Nombre d'erreurs de client | Nombre d'appels avec une erreur côté client |
InputTokenCount |
Nombre total d'entrées | Nombre de jetons d'entrée que les modèles hébergés sur cette ressource ont traités |
InvocationLatency |
Temps total de traitement | Temps total de traitement d'un appel pour cette ressource |
OutputTokenCount |
Nombre total de sorties | Nombre de jetons de sortie que les modèles hébergés sur cette ressource ont traités |
ServerErrorCount |
Nombre d'erreurs de service | Nombre d'appels avec une erreur interne de service |
TotalInvocationCount |
Nombre d'appels | Nombre d'appels |
Pour savoir comment créer ces interrogations personnalisées, voir Création d'une interrogation pour les mesures du service d'intelligence artificielle générative.