OCM (Management Agent for Kubernetes) no Estado Failed Após Falha no Upgrade
Se o URL da imagem do Docker especificado para o agente de gerenciamento estiver incorreto ou inacessível durante um upgrade do Helm do gráfico oci-kubernetes-monitoring, o pod do agente de gerenciamento permanecerá em um estado failed.
Nesse estado, a execução de um upgrade subsequente do Helm com a versão correta da imagem não recupera o pod automaticamente, pois o Kubernetes não reinicia automaticamente os pods que permanecem em um estado Failed após um erro de extração de imagem.
Para resolver este problema:
- Faça upgrade da versão Helm com o URL de imagem correto e acessível:
helm upgrade <release-name> --values <path-to-override-values.yaml> <path-to-helm-chart> - Exclua o pod com falha para que o Kubernetes possa recriá-lo com a versão correta da imagem:
kubectl delete pod oci-onm-mgmt-agent-0 -n oci-onm
Após a exclusão, o Kubernetes recriará automaticamente o pod usando a configuração corrigida, e o pod deverá ser iniciado com sucesso.