OCM (Management Agent for Kubernetes) no Estado Failed Após Falha no Upgrade

Se o URL da imagem do Docker especificado para o agente de gerenciamento estiver incorreto ou inacessível durante um upgrade do Helm do gráfico oci-kubernetes-monitoring, o pod do agente de gerenciamento permanecerá em um estado failed.

Nesse estado, a execução de um upgrade subsequente do Helm com a versão correta da imagem não recupera o pod automaticamente, pois o Kubernetes não reinicia automaticamente os pods que permanecem em um estado Failed após um erro de extração de imagem.

Para resolver este problema:

  1. Faça upgrade da versão Helm com o URL de imagem correto e acessível:
    helm upgrade <release-name> --values <path-to-override-values.yaml> <path-to-helm-chart>
  2. Exclua o pod com falha para que o Kubernetes possa recriá-lo com a versão correta da imagem:
    kubectl delete pod oci-onm-mgmt-agent-0 -n oci-onm

Após a exclusão, o Kubernetes recriará automaticamente o pod usando a configuração corrigida, e o pod deverá ser iniciado com sucesso.