インスタンス・メンテナンス

Oracle Cloud Infrastructureは、コンピュート・インスタンスの物理インフラストラクチャで定期的なデータ・センター・メンテナンスを実行します。このメンテナンスには、ハードウェアのアップグレードと交換、ホストへの電力供給を停止するメンテナンスの実行などのタスクが含まれます。このトピックでは、インフラストラクチャ・メンテナンス、移行オプション、およびインフラストラクチャ・メンテナンスをモニターするために使用できるステータス・メトリックについて説明します。

コンピュート・インフラストラクチャ・ヘルス・メトリックを使用して、メンテナンス中のインスタンスのステータスをモニターできます。

ノート

専用仮想マシン・ホストについては、専用仮想マシン・ホストのメンテナンス再起動移行の管理を参照してください。

メンテナンス・アクション

Oracle Cloud Infrastructureは、コンピュート・インスタンスに対して、終了していない修復、ライブ移行、スケジュールされたメンテナンス、適切な場所での再構築、手動移行など、様々なメンテナンス・アクションをサポートしています。メンテナンス・アクションは、インスタンスが使用するシェイプなどの特性によって異なります。

メンテナンス・イベント

OCIは、インスタンス・メンテナンス・プロセスを管理するためのメンテナンス・イベントを提供します。メンテナンス・イベントは、インスタンス/ホストにメンテナンスが必要なときに作成されます。イベントは、インスタンスに影響する今後のメンテナンス・アクティビティをユーザーに通知します。メンテナンス・イベントは、OCIコンソールのインスタンス・メンテナンス・リソースに表示されます。また、メンテナンス・イベントは、CLIまたはSDKを使用して管理できます。すべてのインタフェースにより、ユーザーはメンテナンス・ウィンドウの再スケジュール、メンテナンスの進捗の監視、および必要なメンテナンス前またはメンテナンス後のアクションを実行できます。

非終了修理

OCIのNon-Terminating Repair(NTR)により、実行中のインスタンスを終了または退避することなく、基礎となるハードウェアまたはソフトウェア・コンポーネントのメンテナンスと修復が可能になります。この方法は、メンテナンスを続行する前にインスタンスの終了を必要とする従来の終了修復(TR)方法と対照的です。NTRは、サービスの中断を最小限に抑え、OCI上のアプリケーションの可用性を高めます。NTRを使用すると、ダウンタイムの短縮と運用効率の向上により、クラウド・インフラストラクチャの健全性とパフォーマンスを維持できます。

NTRメンテナンス・タイプには次のものがあります。

停止時間の修復:インスタンスはメンテナンスの前に停止されます。
ライブ修復:インスタンスが稼働している間にメンテナンスが発生します。
ライブ・バックグラウンド修復:ユーザー・アクションが不要で、OCIがメンテナンス・イベントを作成し、バックグラウンドで修復を実行するユース・ケース。

終了していない修復の詳細は、Non-Terminating Repairを参照してください。

重要

NTRは、ベア・メタル・シェイプでのみサポートされています。

ライブ移行(停止時間なし)

ライブ移行は、VMの実行中にVMをある物理サーバーから別の物理サーバーに移動するメカニズムです。ライブ移行中、コンピュート・サービスがメモリーとすべての仮想コンポーネントを新しいターゲットVMインスタンスにコピーするため、ソースVMインスタンスは引き続き実行されます。コピーが完了すると、システムが新しいVMに切り替わったときに、わずかな一時停止(通常は数十ミリ秒単位)しか発生しません。混乱は最小限です。

スケジュール済メンテナンス(短い休止時間)

スケジュールされたメンテナンスでは、インスタンスが新しいホストに移動される日付が設定されます。再起動移行を使用して、インスタンスが停止され、正常なホストに移行されて再起動します。移行中に短い停止時間が発生します。メンテナンス期日前にインスタンスを事前に再起動することで、停止時間が発生するタイミングを制御できます。まれに、再起動移行が不可能で、インスタンスが終了します。

リビルド・イン・プレース(長時間停止)

このメンテナンス・アクションではインスタンスは移動されません。スケジュールされた時間に、インスタンスは停止され、同じ物理ハードウェア上で再構築されてから再起動されます。メンテナンス・プロセス中に数時間の停止時間が発生します。

インプレースでの再構築は、MACアドレスや汎用識別番号などの物理ハードウェアに関連付けられたインスタンス・プロパティを保持します。また、インプレースでの再構築は、ローカルにアタッチされたNVMeベースのSSDをDense I/Oインスタンスに保持します。

VMでは、停止時間を最小限に抑え、ローカルにアタッチされたNVMeベースのSSDを削除する場合は、スケジュールされたメンテナンス時間より前に、インスタンスを再起動できます。インスタンスは正常なホストに再起動移行され、SSDは完全に削除されます。移行中に短い停止時間が発生します。

手動移行

前述のアクションが使用できないVMインスタンスの場合、インスタンスを手動で移動する必要があります。この方法では、インスタンスを削除(終了)した後で、保存されているブート・ボリュームから新しいインスタンスを起動する必要があります。追加のVNICを持つインスタンス、セカンダリIPアドレスを持つインスタンス、リモートでアタッチされたブロック・ボリュームを持つインスタンス、Trusted Platform Module (TPM)が有効になっているインスタンス、またはロード・バランサのバックエンド・セットに属しているインスタンスでは、追加のステップが必要です。

まれに、同じ物理ホスト上のVMインスタンスをリカバリできないことがあります。Oracle Cloud Infrastructureから、14日以内にインスタンスを削除(終了)するよう通知されます。期限までにインスタンスを削除しない場合、Oracle Cloud Infrastructureは期限にインスタンスを無効にし、次の7日以内に削除します。ブート・ボリュームおよびリモートでアタッチされたデータ・ボリュームは保持されます。

計画メンテナンス

計画メンテナンスを伴うインスタンスの識別

インスタンスでリブート移行またはリビルドがサポートされている場合は、「メンテナンス」タブをクリックします。メンテナンス詳細ページには、計画メンテナンスの開始がスケジュールされている日時が表示されます。メンテナンスの開始時間と終了時間が「開始予定」列に表示されます。手動移行のみをサポートするインスタンスの場合、Oracle Cloud Infrastructureから通知が送信され、メンテナンス・イベントがメンテナンス詳細ページに表示されます。

メンテナンスがスケジュールされているインスタンスを識別するには、次のいずれかを行います:

コンソールの使用: メンテナンスがスケジュールされている現在のコンパートメント内のインスタンスを確認するには

ナビゲーション・メニューを開き、「コンピュート」をクリックします。「コンピュート」で、「インスタンス・メンテナンス」をクリックします。
メンテナンスがスケジュールされているインスタンスのリストが表示されます。
目的のインスタンスをクリックし、インスタンスの「メンテナンス」タブをクリックします。この開始日時および停止日時は、すべてのメンテナンス・イベントに表示されます。

APIの使用: メンテナンスがスケジュールされているコンパートメント内のインスタンスを確認するには

InstanceMaintenanceEvents操作を使用して、イベントをリストします。特定のコンパートメント内のメンテナンス・イベントを含むすべてのインスタンスをリストするコンパートメント・フィールドを指定します。instanceActionやlifecycleStateなどのオプションを使用して結果をフィルタし、検索を絞り込みます。

検索の使用: メンテナンスがスケジュールされているすべてのインスタンスを検索するには

上部のナビゲーション・バーで、「リソース、サービス、ドキュメントおよびマーケットプレイスの検索」を選択し、「拡張リソース問合せ」を選択します。
「サンプル問合せの選択」をクリックしてから、「次回のメンテナンス再起動がスケジュールされているすべてのインスタンスの問合せ」を選択します。
次に、問合せの例を示します。
```
query
  instancemaintenanceevent resources
    where (timeWindowStart > 'Now' && lifecycleState = 'SCHEDULED')
```
「検索」をクリックします。

一致するインスタンスのリストが表示されます。

「メンテナンス」タブが空の場合、インスタンスはメンテナンス・イベントの影響を受けなくなります。

メンテナンス期限の延長

メンテナンスまたは終了がスケジュールされているインスタンスのメンテナンス期日を拡張できます。標準シェイプまたはフレックス・シェイプを使用するVMおよびベア・メタル・インスタンスで通常スケジュールされる再起動移行メンテナンスでは、期限の拡張がサポートされています。OCIは、期日を延長できる最遅時間の時間を決定します。

コンソールの使用: インスタンスのメンテナンス期日を延長するには

ナビゲーション・メニューを開き、「コンピュート」を選択します。「コンピュート」で、「インスタンス」を選択します。
目的のインスタンスをクリックし、「メンテナンス」タブをクリックして、「再スケジュール」をクリックします。
「期限の延長」をクリックします。
「新しい期限」ボックスで、新しい日時を選択します。
「変更の保存」をクリックします。

メンテナンス期日が延長されました。メンテナンス期日から24時間後以内に、インスタンスは停止され、正常なホストに移行されて、再起動します。移行中に短い停止時間が発生します。

APIの使用: インスタンスのメンテナンス期日を延長するには

GetInstanceMaintenanceReboot操作を使用して、期日を延長できる最遅の時間を確認します。
次のいずれかを実行して、メンテナンス期日を延長します:
- VMおよびベア・メタル・インスタンス: InstanceAction操作を使用して、実行するアクションとして値REBOOTMIGRATEを渡します。timeScheduled属性に更新された期日を指定します。
- VM: UpdateInstance操作を使用して、更新された期日をtimeMaintenanceRebootDue属性に渡します。
メンテナンス期日が延長されました。メンテナンス期日から24時間後以内に、インスタンスは停止され、正常なホストに移行されて、再起動します。移行中に短い停止時間が発生します。

インスタンスのリカバリ

インスタンスの基礎となるインフラストラクチャが異常な場合、Oracle Cloud Infrastructureは自動的にインスタンスのリカバリを試みます。メンテナンス・アクションは、インスタンスのタイプによって異なります。

仮想マシン(VM)インスタンス:可能な場合、インスタンスは正常な物理ホストにライブ移行されます。ライブ移行が不可能な場合、インスタンスは、シェイプに応じて再起動移行またはインプレースで再構築されます。
ベア・メタル・インスタンス:可能な場合、インスタンスは正常な物理ホストに再起動移行されます。再起動移行が不可能な場合、インスタンスを手動で移行する必要があります。

VMインスタンスの計画メンテナンス

インフラストラクチャ・メンテナンス・イベントがVMインスタンスに影響する場合、Oracle Cloud Infrastructureは、メンテナンスが必要な物理的なVMホストから正常的なVMホストへの、実行中のインスタンスの中断を最小限で、サポートされているVMインスタンスをライブ移行します。

VMインスタンスをライブ移行できないか、ライブ移行をサポートしていない場合、Oracle Cloud Infrastructureはメンテナンス期日を14~16日以内にスケジュールし、再起動移行など、必要なメンテナンス・アクションのタイプを説明する通知を送信します。移行中に次のいずれかのイベントが発生した場合、ライブ移行は成功しない可能性があります: インスタンスにアクティビティが多すぎる、APIを使用してインスタンスが変更された、またはインスタンスに関連しない内部エラーが発生した。

VMインスタンスのメンテナンスがスケジュールされている場合、スケジュールされているメンテナンス期日の前に、いつでもインスタンスを事前に再起動して移行できます。事前のリブート移行により、アプリケーションで停止時間が発生する方法とタイミングを制御できます。期日までにインスタンスを事前に再起動しない場合、シェイプに応じて、インスタンスは再起動移行またはインプレースで再構築されます。

VMインスタンスの顧客管理のメンテナンスは、標準I/Oインスタンス・シェイプ(プラットフォーム・イメージやOracle Cloud Infrastructureの外部からインポートしたカスタム・イメージを含む)でサポートされています。

標準シェイプおよびDenseIOシェイプの場合、メンテナンス期日を延長できます。

ノート

セキュリティ関連のメンテナンス・イベントなど、日付を延長できない場合があります。

移行後、デフォルトでは、インスタンスはメンテナンス・イベントの前と同じライフサイクル状態にリカバリされます。インスタンスをリカバリする代替プロセスがある場合は、オプションで、正常なハードウェアに再起動移行した後もインスタンスが停止したままとなるように構成できます。

ベア・メタル・インスタンスの計画メンテナンス

インフラストラクチャ・メンテナンス・イベントはベア・メタル・インスタンスに影響する場合、Oracle Cloud Infrastructureは、メンテナンスが必要な物理ホストから健全なホストに、サポートされているベア・メタル・インスタンスをリブート移行します。Oracle Cloud Infrastructureはメンテナンス期日を14~16日以内にスケジュールし、再起動移行など、必要なメンテナンス・アクションのタイプを説明する通知を送信します。メンテナンス期日から24時間後に、ベア・メタル・インスタンスは停止され、正常なホストに移行されて、再起動します。移行中に短い停止時間が発生します。

ベア・メタル・インスタンスのメンテナンスがスケジュールされている場合、スケジュールされたメンテナンス期日の前に、いつでもインスタンスを事前に再起動できます。事前の再起動により、アプリケーションで停止時間が発生する方法とタイミングを制御できます。期日までにインスタンスを事前に再起動しない場合、インスタンスは再起動移行されます。

ベア・メタル・インスタンスの再起動移行は、Linuxベースのプラットフォーム・イメージを使用する標準インスタンス・シェイプでサポートされています。ベア・メタル・インスタンスの再起動移行は、Windowsまたはカスタム・イメージを使用するインスタンス、保護インスタンス、索引1を持つ物理NICで作成および構成されているセカンダリVNICを持つインスタンス、またはiPXEスクリプトで標準のsanbootコマンドを使用しないインスタンスではサポートされていません。

標準シェイプの場合、メンテナンス期日を延長できます。

スケジュールされた時間よりも前に再起動しない場合は、Oracle Cloud Infrastructureにより、インスタンスの移行または再構築が行われます。移行後、デフォルトでは、インスタンスはメンテナンス・イベントの前と同じライフサイクル状態にリカバリされます。インスタンスを別のプロセスでリカバリできる場合は、正常なハードウェアに再起動移行した後も、インスタンスを停止したままにするよう構成できるオプションがあります。

インフラストラクチャ障害によるVMリカバリ

ソフトウェアやハードウェアの問題が原因でVMインスタンスの基礎となるインフラストラクチャで障害が発生すると、Oracle Cloud Infrastructureは自動的にインスタンスのリカバリを試みます。

標準VMインスタンスは、再起動移行を使用してリカバリされます。これにより、元の物理ホストであるか別の物理ホストであるかに関係なく、正常なホストにVMが自動的にリストアされます。VM障害は、発生から1分以内に検出されます。ホストをすぐにリカバリできない場合は、正常な移動が発生し、VMは別のホストに移動されます。このシナリオでは、正常なホストへの移行と再起動のプロセスが5分以内に自動的に開始されます。再起動時に、プライベートおよびエフェメラル・パブリックIPアドレス、アタッチされたブロック・ボリューム、VNICなどのインスタンス・プロパティは保持されます。

DenseIO VMインスタンスは、同じ物理ホスト上のインスタンスを再起動することでリカバリされます。同じ物理ホスト上でDenseIOインスタンスをリカバリできない場合、Oracle Cloud Infrastructureは14日以内にインスタンスを再起動(移行)または削除(終了)するよう通知します。リブート移行を使用した場合でも、ローカルのNVMeデータは失われます。期限までにインスタンスを削除しない場合、Oracle Cloud Infrastructureは期限にインスタンスを無効にし、次の7日以内に削除します。ブート・ボリュームおよびリモートでアタッチされたデータ・ボリュームは保持されます。

Oracle Cloud Infrastructureは、実行されたリカバリ・アクションのステータスとともに、VMインフラストラクチャの障害イベントを電子メールまたはお知らせによって通知します。インスタンス・ステータス・メトリックをモニターして、予期しない再起動に備えることもできます。

リカバリ後にインスタンスを停止したままにするように構成することで、VMを自動的に再起動しないように選択できます。

インフラストラクチャ・ヘルス・メトリック

メトリック、アラームおよび通知を使用して、コンピュート・インスタンスが実行されるインフラストラクチャのメンテナンス・ステータスをモニターできます。インフラストラクチャ・メンテナンスで考慮するプライマリ・メトリックは、インフラストラクチャ・ヘルス・メトリックです:

インスタンス・ヘルス(稼働時/停止)ステータス: instance_statusメトリックにより、VMインスタンスが実行中の状態のときに使用可能(稼働時)か使用不可(停止)かを確認できます。インスタンスが30分を超えて使用できない場合は、サポートに連絡してください。
インスタンス・メンテナンス・ステータス: maintenance_statusメトリックにより、VMまたはベア・メタル・インスタンスの計画インフラストラクチャ・メンテナンスがスケジュールされているかどうかをモニターできます。
ベア・メタル・インフラストラクチャ・ヘルス・ステータス: health_statusメトリックにより、CPUおよびメモリーなどのハードウェア・コンポーネントを含むベア・メタル・インスタンスのインフラストラクチャのヘルスをモニターできます。

コンソールでのインスタンス・ステータスおよびメンテナンス通知の表示

インスタンスのステータスおよびメンテナンス再起動通知は、コンソールの「インスタンスの詳細」ページで確認できます。これらのフィールドを表示するには:

ナビゲーション・メニューを開き、「コンピュート」を選択します。「コンピュート」で、「インスタンス」を選択します。
関心のあるインスタンスをクリックします。
「インスタンス情報」タブの「インスタンスの詳細」セクションで、「インスタンス・ステータス」フィールドおよび「メンテナンス再起動」フィールドを参照します。
ノート

「インスタンス・ステータス」フィールドは、インスタンスが過去1か月に使用できなかった場合にのみ表示されます。

Oracle Cloud Infrastructureドキュメント