アップグレード失敗後のFailed
状態にあるKubernetes (OCMA)の管理エージェント
oci-kubernetes-monitoringチャートのHelmアップグレード中に管理エージェントに指定されたDockerイメージURLが正しくないか、アクセスできない場合、管理エージェント・ポッドはfailed
状態のままです。
この状態では、適切なイメージ・バージョンで後続のHelmアップグレードを実行しても、ポッドは自動的にリカバリされません。これは、Kubernetesがイメージ・プル・エラー後にFailed
状態のままであるポッドを自動的に再起動しないためです。
この問題を解決するには:
- 正しいアクセス可能なイメージURLでHelmリリースをアップグレードします:
helm upgrade <release-name> --values <path-to-override-values.yaml> <path-to-helm-chart>
- 失敗したポッドを削除して、Kubernetesが正しいイメージ・バージョンで再作成できるようにします:
kubectl delete pod oci-onm-mgmt-agent-0 -n oci-onm
削除後、Kubernetesは修正された構成を使用してポッドを自動的に再作成し、ポッドが正常に起動する必要があります。