アップグレード失敗後のFailed状態にあるKubernetes (OCMA)の管理エージェント

oci-kubernetes-monitoringチャートのHelmアップグレード中に管理エージェントに指定されたDockerイメージURLが正しくないか、アクセスできない場合、管理エージェント・ポッドはfailed状態のままです。

この状態では、適切なイメージ・バージョンで後続のHelmアップグレードを実行しても、ポッドは自動的にリカバリされません。これは、Kubernetesがイメージ・プル・エラー後にFailed状態のままであるポッドを自動的に再起動しないためです。

この問題を解決するには:

  1. 正しいアクセス可能なイメージURLでHelmリリースをアップグレードします:
    helm upgrade <release-name> --values <path-to-override-values.yaml> <path-to-helm-chart>
  2. 失敗したポッドを削除して、Kubernetesが正しいイメージ・バージョンで再作成できるようにします:
    kubectl delete pod oci-onm-mgmt-agent-0 -n oci-onm

削除後、Kubernetesは修正された構成を使用してポッドを自動的に再作成し、ポッドが正常に起動する必要があります。