コンピュート・インスタンスの高可用性構成

コンピュート・インスタンスの場合、高可用性とは、基礎となるインフラストラクチャに障害が発生した場合や、メンテナンスのためにコンポーネントが停止した場合に備えて自動リカバリを意味します。コンピュート・ノード、ハイパーバイザおよびコンピュート・インスタンスの状態は継続的に監視されます。

コンピュート・インスタンスの高可用性(HA)は構成可能です。この項で説明する動作は、標準設定に基づいています。リブート移行、フォルト・ドメインの配置、自動リカバリなどの構成可能なHA設定の詳細は、コンピュート・サービスでの高可用性の構成を参照してください。

デフォルトでは、システムは選択したフォルト・ドメイン内のインスタンスのライブ移行または再起動を試みますが、選択したフォルト・ドメインで十分なリソースが使用できない場合は、他のフォルト・ドメインのインスタンスを再起動することもできます。選択したフォルト・ドメインは、インスタンス構成で指定されたものです。

コンピュート・ノード停止

計画外再起動のためにコンピュート・ノードが停止した場合、コンピュート・ノードが正常に通常の操作に戻ると、そのインスタンスが再起動されます。ただし、この動作は構成可能です。次のポーリング間隔で、実行中である必要があるが別の状態にあるインスタンスが見つかった場合、デフォルトでstartコマンドが再度発行されます。インスタンスがクラッシュし、その状態のままである場合、ハイパーバイザはそれらを最大5回再起動しようとします。計算ノードが使用できなくなる前に実行されていなかったインスタンスは、計算ノードが起動して再度実行中でも停止したままになります。

障害が発生したためにコンピュート・ノードが失われた場合、デフォルトでは、システムは実行中のコンピュート・インスタンスを障害が発生したコンピュート・ノードから他のコンピュート・ノードにライブ移行しようとします。実際の動作は、コンピュート・サービスの高可用性パラメータの構成方法によって異なります。

コンピュートノードは、データネットワークから切断されているか、または約5分間電源切断状態にあると、障害が発生していると見なされます。この5分間のタイムアウトは、コンピュート・ノードをFAIL状態にし、そのエージェントをEVACUATING状態にするためのしきい値です。この状態は、リブート移行を開始する前に必要です。

移行の再起動

再起動移行とは、障害が発生したコンピュート・ノードのすべてのコンピュート・インスタンスが停止され、別のコンピュート・ノードで再起動されることを意味します。移行が完了すると、失敗したコンピュート・ノードのエージェントは、インスタンスが退避されたことを示します。計算ノードが正常にリブートした場合、すべての古いインスタンス構成および関連する仮想ディスクを削除するクリーンアップ・プロセスを実行する必要があります。クリーンアップ後、コンピュート・ノードはコンピュート・インスタンスを再度ホストできます。

リブート移行全体中、インスタンスは「移動中」構成状態のままになります。移行が完了すると、インスタンスの構成状態が「実行中」に変更されます。障害の前に停止されたインスタンスは、どのコンピュート・ノードにも関連付けられていないため、移行されません。

フォルト・ドメイン設定

フォルト・ドメイン・プリファレンスは、インスタンスの移行では厳密には適用されません。つまり、コンピュート・サービスでは、選択したフォルト・ドメインに十分なリソースがない場合、デフォルトでインスタンスを停止し、別のフォルト・ドメインのコンピュート・ノードで再起動できます。コンピュート・サービスで厳密なフォルト・ドメイン強制が構成されている場合、選択したフォルト・ドメイン内の別のコンピュート・ノードに移行できないインスタンスを停止する必要があります。

Computeサービスで自動フォルト・ドメイン解決が有効になっている場合は、別のフォルト・ドメインに移行されたインスタンスを、選択したフォルト・ドメインに戻すことができます。

計画メンテナンス

計画メンテナンスの場合、管理者はまず問題のコンピュート・ノードのプロビジョニングを無効にし、メンテナンス・ロックを適用する必要があります。コンピュート・ノードがプロビジョニング・ロック下にある場合、管理者は実行中のすべてのコンピュート・インスタンスを別のコンピュート・ノードにライブ移行できます。メンテナンス・モードは、コンピュート・ノードで実行中のインスタンスがなくなった場合にのみアクティブ化できます。forceオプションを指定すると、移行できないインスタンスを停止できます。このコンピュート・ノード上のすべてのコンピュート・インスタンス操作は無効になります。メンテナンス・モードのコンピュート・ノードは、プロビジョニングまたはプロビジョニング解除できません。