Detalhes da Métrica no Serviço Generative AI

Você pode monitorar os recursos do OCI Generative AI por meio das métricas fornecidas neste serviço. Você também pode usar o serviço OCI Monitoring para criar consultas e alarmes personalizados para notificá-lo quando essas métricas atenderem a acionadores especificados pelo alarme.

Métricas do Cluster de IA Dedicado de Hospedagem

Esta seção lista as métricas dos clusters de IA dedicados do serviço hosting. Os clusters dedicados de ajuste fino não exibem métricas.

Nome para Exibição da Métrica Descrição
Utilização A capacidade disponível para um cluster de IA dedicado exibida como porcentagem ao longo do tempo
Número total de entradas Número de tokens de entrada que os modelos neste cluster de IA dedicado de hospedagem processaram
Número total de saída Número de tokens de saída que os modelos neste cluster de IA dedicado de hospedagem processaram

Você pode obter as métricas anteriores na página de detalhes de um cluster de IA dedicado de hospedagem.

Métricas de Ponto Final

Esta seção lista as métricas para pontos finais de modelo no serviço Generative AI.

Nome para Exibição da Métrica Descrição
Tempo total de processamento Tempo total de processamento para uma chamada ser concluída
Número de chamadas Número de tokens de entrada que o modelo hospedado neste ponto final processou
Contagem de Erros de Serviço Número de chamadas com erro interno do serviço
Contagem de Erros do Cliente Número de chamadas com erro do cliente
Número total de entradas Número de tokens de entrada que o modelo hospedado neste ponto final processou
Número total de saída Número de tokens de saída que o modelo hospedado neste ponto final processou
Taxa de sucesso de chamadas Chamadas bem-sucedidas divididas pelo número total de chamadas

Você pode obter as métricas anteriores na página de detalhes de um ponto final.

Métricas para Consultas Personalizadas

Você pode criar consultas e alarmes personalizados para o cluster do serviço Generative AI e as métricas de ponto final por meio do serviço Monitoring.

Esta seção lista os parâmetros que você pode usar para criar consultas personalizadas para métricas do serviço Generative AI usando o serviço Monitoring.

Parâmetro de Métrica Nome para Exibição Descrição
ClientErrorCount Contagem de Erros do Cliente Número de chamadas com erro do cliente
InputTokenCount Número total de entradas Número de tokens de entrada que os modelos hospedados neste recurso processaram
InvocationLatency Tempo total de processamento Tempo total de processamento para uma chamada ser concluída neste recurso
OutputTokenCount Número total de saída Número de tokens de saída que os modelos hospedados neste recurso processaram
ServerErrorCount Contagem de Erros de Serviço Número de chamadas com erro interno do serviço
TotalInvocationCount Número de chamadas Número de chamadas

Para obter as etapas sobre como criar essas consultas personalizadas, consulte Criando uma Consulta para Métricas do Serviço Generative AI.