Métricas do Streaming

Exibir gráficos de métricas, criar consultas e revisar detalhes sobre as métricas do serviço Streaming.

Você pode monitorar a integridade e o desempenho de seus streams usando métricas e alarmes. Para obter mais informações, consulte Monitoramento.

Visão Geral

O serviço de Streaming fornece métricas que mostram como o serviço está sendo executado. Essas métricas estão automaticamente disponíveis.

Você pode usar essas métricas para:

  • Entender a latência de produção/consumo de um aplicativo em tempo real.
  • Calcular e validar o preço de uso do serviço.
  • Monitorar alterações no throughput ao longo do tempo.
  • Verificar o horário em que a última mensagem foi consumida.

Para ver as etapas para exibir gráficos de métricas padrão na Console, consulte Exibindo Gráficos de Métricas Padrão para Streams.

Integridade do Stream

Um stream íntegro é um stream ativo: as mensagens são recebidas e consumidas com sucesso.

As gravações no serviço são duráveis. Se você puder produzir no seu stream e se tiver uma resposta bem-sucedida, é porque o stream está íntegro.

Após a ingestão dos dados, eles ficam acessíveis aos consumidores pelo período de retenção configurado. Se as chamadas de API GetMessages retornarem níveis elevados de erros internos do servidor, é porque o serviço não está íntegro.

Um stream íntegro também tem métricas íntegras:

  • A Latência de Mensagens Put é baixa.
  • O Throughput Total de Mensagens Put está próximo de 1 MB por segundo por partição.
  • O número de Registros Limitados de Mensagens Put está próximo de 0.
  • O número de Falhas nas Mensagens Put está próximo de 0.
  • A Latência de Mensagens Get é baixa.
  • O Throughput Total de Mensagens Get está próximo de 2 MB por segundo por partição.
  • O número de Solicitações Limitadas de Mensagens Get está próximo de 0.
  • O número de Falhas de Mensagens Get está próximo de 0.

Alarmes Sugeridos

Produtores

Para os produtores, considere definir alarmes nas seguintes métricas:

  • Latência de Mensagens Put: Um aumento na latência significa que as mensagens estão demorando mais para serem publicadas, o que pode indicar problemas de rede.
  • Throughput Total de Mensagens Colocadas:
    • Um aumento no throughput total pode indicar que o limite de 1 MB por segundo por partição será atingido, e esse evento acionará o mecanismo de limitação.
    • Uma diminuição pode significar que o produtor do cliente está tendo um problema ou está prestes a parar.
  • Registros Limitados de Mensagens Put: É importante ser notificado quando as mensagens forem limitadas.
  • Falha de Mensagens Put: É importante ser notificado se as mensagens put começarem a falhar.

Consumidores

Para os consumidores, considere definir alarmes semelhantes com base nas seguintes métricas:

  • Latência de Mensagens Get
  • Throughput Total de Mensagens Obtidas
  • Solicitações de Mensagens Obtidas Aceleradas
  • Falha de Mensagens Get

Para obter as etapas para criar alarmes, consulte Criando um Alarme com base em um Gráfico de Métricas Padrão e Criando um Alarme com base em um Gráfico de Métricas Personalizado.