Métricas de Implantação de Modelo

Saiba como usar métricas para implantações de modelo.

As Métricas estão automaticamente disponíveis para qualquer implantação de modelo do Data Science que você criar no namespace oci_datascience_modeldeploy. Você não precisa ativar o monitoramento nos recursos do OCI para obter essas métricas.

As métricas de implantações de modelo do serviço Data Science incluem estas dimensões:

resourceId

O OCID da implantação do modelo.

statusCode

O código de status de resposta HTTP.

result

Resultado da resposta:

Success
Failure

statusFamily

Família de status do resultado:

Success: 2XX
Failure: 4XX and 5XX

instanceId

O ID da instância.

networkType

Tipos de rede:

BytesIn: Network receive throughput
BytesOut: Network transmission throughput

modelOcid

O OCID do modelo no grupo de modelos implantados. Você pode filtrar os logs de solicitação de previsão específicos do modelo com base no modelOcid no roteador do modelo.


Nomes de Métrica	Nome para Exibição	Unidade	Descrição	Dimensões
`PredictRequestCount`	Contagem de Solicitações de Previsão	Contagem	Número de solicitações de previsão.	`resourceId`
`PredictResponse`	Taxa de Sucesso de Resposta de Previsão	Porcentagem	Taxa de sucesso de resposta de previsão É calculada com base no número de solicitações de previsão bem-sucedidas do número total de solicitações de previsão.	`resourceId` `statusCode` `result` `statusFamily`
`PredictResponse`	Status de Resposta de Previsão	Contagem	Resultado e código de status de resposta de previsão.	`resourceId` `statusCode` `result` `statusFamily`
`PredictLatency`	Latência de Previsão	Milissegundos	Latência de chamadas de previsão.	`resourceId` `result`
`PredictBandwidth`	Utilização de Largura de Banda de Previsão	Porcentagem	Largura de banda provisionada e consumida de previsão. Largura de banda provisionada é a largura de banda esperada pelo cliente definida durante a criação da implantação do modelo. A largura de banda consumida é a largura de banda ativa consumida por todas as solicitações de previsão em andamento para um OCID de implantação de modelo específico. Essa largura de banda é calculada como largura de banda consumida atual em relação à largura de banda total do balanceador de carga provisionado em cada solicitação de previsão.	`resourceId`
`CpuUtilization`	Utilização de CPU	Porcentagem	Nível de atividade da CPU.	`resourceId` `instanceId`
`MemoryUtilization`	Utilização de Memória	Porcentagem	Memória em uso.	`resourceId` `instanceId`
`NetworkBytes`	Bytes de Recebimento e Transmissão da Rede	Bytes/segundo	Throughput de recebimento e transmissão da rede.	`resourceId` `instanceId` `networkType`
`GPUCoreUtilization`	Utilização de GPU	Porcentagem	Mostra quão ocupados os dispositivos GPU estão em um cluster de implantação de modelo.	`resourceId` `instanceId`
`GPUMemoryUtilization`	Utilização de Memória de GPU	Porcentagem	Mostra o consumo médio de memória de todos os dispositivos GPU em um cluster de implantação de modelo.	`resourceId` `instanceId`

Exibindo Métricas de Implantação de Modelo

Você pode exibir os gráficos de métricas padrão usando a página de detalhes de implantação de modelo no serviço Data Science.

Na página de lista Projetos, selecione o projeto que contém as implantações de modelo com as quais você deseja trabalhar. Se precisar de ajuda para localizar a página da lista ou o projeto, consulte Listando Projetos.
Na página de detalhes do projeto, selecione Implantações de modelo.
Selecione a implantação do modelo.
Selecione Métricas.
A página exibe um gráfico para cada métrica emitida para o namespace de métricas do serviço Data Science.

Se você não vir os dados de métricas da sessão de implantação de modelo esperados, consulte dados de métricas ausentes.

Documentação do Oracle Cloud Infrastructure

Métricas de Implantação de Modelo

Exibindo Métricas de Implantação de Modelo