コンピュート・ノードのメンテナンス操作
Private Cloud Applianceソフトウェアのアップグレードやパッチ適用などのメンテナンス操作や、ハードウェアの修復が必要な場合、コンピュート・ノードをメンテナンス・モードにする必要があります。これには、実行中のコンピュート・インスタンスを退避し、他のシステム操作からノードをロックする必要があります。
計算ノードの退避
一部のコンピュート・ノード操作は、コンピュート・ノードに実行中のコンピュート・インスタンスがない場合にのみ実行できます。管理者は、実行中のすべてのインスタンスをコンピュート・ノードから移行できます(コンピュート・ノードの退避とも呼ばれます)。
デフォルトでは、十分なリソースが使用可能な場合、実行中のインスタンスは、同じフォルト・ドメイン内の他のコンピュート・ノードにライブ移行されます。
コンピュート・ノードの退避を実行する前に、同じフォルト・ドメイン内の別のコンピュート・ノードにライブ移行できないインスタンスの動作を確認します。
このトピックおよびコンピュート・インスタンスの高可用性構成では、設定を確認する方法と、様々な設定でインスタンスを処理する方法について説明します。
異なるタイプのコンピュートノード間のライブ移行はサポートされていません。たとえば、Oracle Server X10からOracle Server X11にコンピュート・インスタンスを移行することはできません。
厳密なフォルト・ドメイン強制が設定されているかどうかを確認します。
-
厳密なフォルト・ドメイン強制が無効(サービスWeb UIで「厳密なFD」が「無効」に設定されているか、サービスCLIで
Strict FD Enabledがfalseに設定されている)の場合、同じフォルト・ドメイン内の別のコンピュート・ノードにライブ移行できないインスタンスは、そのフォルト・ドメインで十分なリソースが使用可能な場合に、別のフォルト・ドメインにライブ移行されます。 -
厳密なフォルト・ドメイン強制が有効になっている場合(サービスWeb UIで「厳密なFD」が「有効」に設定されているか、サービスCLIで
Strict FD Enabledがtrueに設定されている場合)、同じフォルト・ドメイン内の別のコンピュート・ノードにライブ移行できないインスタンスは移行されません。これらのインスタンスは、退避するコンピュート・ノードで実行されています。
厳密なフォルト・ドメイン強制を有効または無効にして、同じフォルト・ドメイン内の他のコンピュート・ノードにライブ移行できないインスタンスを、別のフォルト・ドメインにライブ移行するか、コンピュート・ノードから退避しようとした後も同じコンピュート・ノードで実行するかを設定します。
現在のフォルト・ドメインがそれらに対応できず、厳密なフォルト・ドメイン強制が有効になっているか、厳密なフォルト・ドメイン強制が無効になっているが、他のフォルト・ドメインもインスタンスに対応できないため、一部のインスタンスをライブ移行できない場合は、強制オプションを指定して移行操作を再実行できます。forceオプションが指定されている場合、Computeサービスは、ライブ移行に失敗したインスタンスをすべてソフト停止し、退避を続行できるようにします。
停止したインスタンスを再起動します。 インスタンスがコンピュート・サービスによって停止され(管理者が手動で停止していない)、リソースが使用可能になったときにインスタンスを自動的に実行にリストアする場合は、コンピュート・サービスの自動リカバリ・プロパティが有効で、インスタンスの可用性リカバリ・アクションがRESTORE_INSTANCEに設定されていることを確認してください。コンピュート・サービス構成の表示および設定および停止されたインスタンスのリカバリ状態の構成を参照してください。
インスタンスは、管理者がコンピュート・ノードを退避したとき、または計画外のコンピュート・ノードの停止に応答して、強制オプションが使用された場合に、コンピュート・サービスによって停止できます。自動リカバリ設定は、管理メンテナンスまたは計画外の停止後にリソースが使用可能になる前または後にいつでも変更して、コンピュート・サービスによって停止されたインスタンスを再起動できます。インスタンス可用性リカバリ・アクションがSTOP_INSTANCEに設定されている場合、「自動リカバリ」プロパティが有効になっている場合でも、インスタンスは停止したままになります。インスタンスの可用性リカバリ・アクションが後でRESTORE_INSTANCEに変更されると、後続の自動リカバリ・パスによってインスタンスが再起動されます。
再配置されたインスタンスを返します。 インスタンスが別のフォルト・ドメイン(配置済)にライブ移行され、リソースが使用可能になったときに、選択したフォルト・ドメイン(インスタンス構成で指定されたフォルト・ドメイン)にインスタンスを戻す場合は、コンピュート・サービスの「自動解決」プロパティが有効になっていることを確認します。コンピュート・サービス構成の表示および設定およびコンピュート・サービス構成コマンドを参照してください。計算ノードの退避が完了する前または後に「自動解決」プロパティを設定して、置き換えられたインスタンスを再配置できます。
移行操作を実行するには、次の手順を使用します。
- 計算ノードの退避: 開始する前に
-
-
フォルト・ドメインおよび計算ノードのリソースを確認します。「admin-monitor-capacity.htm」を参照してください。この情報に基づいて、次のいずれかを実行するかどうかを決定します。
-
不要になったインスタンスを終了します。
-
使用するリソースが少なくなるようにインスタンスを再構成します。たとえば、別のシェイプを指定します。
-
一部のインスタンスを再構成して、別のフォルト・ドメインを指定します。
-
コンピュート・ノードの退避の実行中に一部のインスタンスを停止します。
-
移行不可能なインスタンスを停止します。次のステップを参照してください。
-
移行操作で強制オプションを指定して、ライブ移行できないインスタンスをソフト・ストップします。前述のインスタンス可用性リカバリ・アクションおよび自動リカバリ構成の説明を参照してください。
-
-
vmMigrate操作でforceオプションを指定して、ライブ移行できないインスタンスをソフト・ストップすることは可能ですが、ベスト・プラクティスは、移行前に移行不可能なインスタンスを正常に停止して、インスタンスで実行されているワークロードが適切な状態になるようにすることです。-
移行不可能なインスタンスのリストを表示します。
実行中のインスタンスのIDをコピーして、停止できるようにします。
PCA-ADMIN> getNonMigratableInstances Data: id Display Name Compute Node Id Domain State -- ------------ --------------- ------------ ocid1.instance.unique_ID instance202 CN_ID running ocid1.instance.unique_ID kqh027 CN_ID shut off -
実行中のインスタンスを停止します。
インスタンスの停止、起動およびリセットを参照してください。
-
-
計算ノードでのプロビジョニングを無効にします。
計算ノード・プロビジョニングの無効化を参照してください。
-
- サービスWeb UIの使用
-
-
ナビゲーションメニューで、「ラックユニット」をクリックします。
-
「ラック・ユニット」表で、退避するコンピュート・ノードのホスト名を見つけます。そのホストの「Actions」メニューをクリックし、「Migrate All Vms」オプションをクリックします。
または、「ラック・ユニット」表で、退避するコンピュート・ノードのホスト名をクリックして、そのコンピュート・ノードの詳細ページを表示します。「Controls」メニューをクリックし、「Migrate All Vms」オプションをクリックします。
-
「Confirm Migrating VMs」ダイアログで、移行できないインスタンスを強制的に停止するかどうかを選択します。
デフォルトでは、強制停止オプションは有効になっていません。移行できないインスタンスは、移行操作の完了後もノードで実行されます。移行できないインスタンスを強制的に停止するには、「Confirm Migrating VMs」ダイアログで強制停止オプションを有効にします。
-
「Confirm Migrating VMs」ダイアログで、「Migrate」ボタンをクリックします。
コンピュート・サービスは、使用可能なリソースが十分で、それを許可するように高可用性設定が構成されている場合、実行中のインスタンスを他のコンピュート・ノードにライブ移行します。強制オプションが指定されている場合、移行できなかったインスタンスはソフト・ストップされます。インスタンスを移行できず、強制が指定されなかった場合、それらのインスタンスは、退避しようとしているコンピュート・ノードで実行されたままになります。
-
- サービスCLIの使用
-
-
コンピュートノードのリストを表示します。
退避する計算ノードのIDをコピーします。
PCA-ADMIN> list ComputeNode Data: id name provisioningState provisioningType -- ---- ----------------- ---------------- 3e62bf25-a26c-407e-ab8b-df01a4ad98b6 pcacn002 Provisioned KVM f7b8356b-052f-4911-babb-447e6ab9c78d pcacn003 Provisioned KVM 4e06ebdf-faed-484e-996d-d77af786f123 pcacn001 Provisioned KVM -
migrateVmコマンドを使用して、実行中のすべてのコンピュート・インスタンスをコンピュート・ノードからライブ移行します。移行に失敗したインスタンスをソフト・ストップするには、forceオプションを設定します。PCA-ADMIN> migrateVm id=7a0236f4-b00e-461d-93a0-b22673a18d9c force=true JobId: 6f1e94bc-7d5b-4002-ada9-7d4b504a2599コンピュート・サービスは、使用可能なリソースが十分で、それを許可するように高可用性設定が構成されている場合、実行中のインスタンスを他のコンピュート・ノードにライブ移行します。
force=trueが指定されている場合、移行できなかったインスタンスはソフト・ストップされます。インスタンスを移行できず、force=trueが指定されなかった場合、それらのインスタンスは退避しようとしているコンピュート・ノードで実行されたままになります。ジョブIDを使用して、
migrateVmコマンドのステータスを確認します。PCA-ADMIN> show Job id=6f1e94bc-7d5b-4002-ada9-7d4b504a2599 [...] Done = true Name = MODIFY_TYPE Run State = Succeeded
-
計算ノード・プロビジョニングの無効化
いくつかのコンピュート・ノード操作は、プロビジョニングが無効になっている条件でのみ実行できます。次の手順に従って、プロビジョニング・ロックを適用して解放します。
- サービスWeb UIの使用
-
-
ナビゲーションメニューで、「ラックユニット」をクリックします。
-
「ラック・ユニット」表で、変更するコンピュート・ノードのホスト名をクリックします。
計算ノードの詳細ページが表示されます。
-
ページの右上隅にある「コントロール」をクリックし、「プロビジョニング・ロック」コマンドを選択します。
確認ウィンドウが表示されたら、「Lock」をクリックして続行します。
正常に完了すると、「Compute Node Information」タブに「Provisioning Locked」が「Yes」と表示されます。
-
プロビジョニング・ロックを解除するには、「制御」をクリックし、「プロビジョニング・ロック解除」コマンドを選択します。
確認ウィンドウが表示されたら、「Unlock」をクリックして続行します。
正常に完了すると、「計算ノード情報」タブに「プロビジョニング・ロック済」= 「いいえ」と表示されます。
-
- サービスCLIの使用
-
-
コンピュートノードのリストを表示します。
プロビジョニング操作を無効にするコンピュート・ノードのIDをコピーします。
PCA-ADMIN> list ComputeNode Data: id name provisioningState provisioningType -- ---- ----------------- ---------------- 3e62bf25-a26c-407e-ab8b-df01a4ad98b6 pcacn002 Provisioned KVM f7b8356b-052f-4911-babb-447e6ab9c78d pcacn003 Provisioned KVM 4e06ebdf-faed-484e-996d-d77af786f123 pcacn001 Provisioned KVM -
計算ノードにプロビジョニング・ロックを設定します。
PCA-ADMIN> provisioningLock id=f7b8356b-052f-4911-babb-447e6ab9c78d JobId: 6ee78c8a-e227-4d31-a770-9b9c96085f3fジョブIDを使用して、コマンドのステータスを確認します。
PCA-ADMIN> show Job id=6ee78c8a-e227-4d31-a770-9b9c96085f3f [...] Done = true Name = MODIFY_TYPE Run State = Succeeded -
ジョブが完了したら、コンピュート・ノードがプロビジョニング・ロック中であることを確認します。
PCA-ADMIN> show ComputeNode id=f7b8356b-052f-4911-babb-447e6ab9c78d [...] Provisioning State = Provisioned [...] Provisioning Locked = true Maintenance Locked = falseロックが解放されるまで、すべてのプロビジョニング操作が無効になります。
-
プロビジョニング・ロックを解除するには、次のコマンドを使用します。
PCA-ADMIN> provisioningUnlock id=f7b8356b-052f-4911-babb-447e6ab9c78d JobId: 523892e8-c2d4-403c-9620-2f3e94015b46ジョブIDを使用して、コマンドのステータスを確認します。
PCA-ADMIN> show Job id=523892e8-c2d4-403c-9620-2f3e94015b46 [...] Done = true Name = MODIFY_TYPE Run State = Succeeded -
ジョブが完了したら、プロビジョニング・ロックが解放されたことを確認します。
PCA-ADMIN> show ComputeNode id=f7b8356b-052f-4911-babb-447e6ab9c78d [...] Provisioning State = Provisioned [...] Provisioning Locked = false Maintenance Locked = false
-
メンテナンスのための計算ノードのロック
メンテナンス操作の場合は、コンピュート・ノードをメンテナンス・モードにする必要があります。次の手順に従って、メンテナンス・ロックを適用して解放します。メンテナンスのためにコンピュート・ノードをロックする前に、まずプロビジョニングを無効にする必要があります。メンテナンス操作は、コンピュート・ノードに実行中のコンピュート・インスタンスがない場合にのみ実行できます。
コンピュート・サービスの高可用性構成によっては、自動インスタンス移行によって、コンピュート・ノードを正常にロックできない場合があります。コンピュート・インスタンスの高可用性構成を参照してください。この状況は、使用可能なコンピュート容量が制限されている場合に発生する可能性が高くなります。
-
コンピュート・ノードの停止後のインスタンス・リカバリまたは移行操作によって、メンテナンス・ロックが失敗することがあります。インスタンス移行に関与するコンピュート・ノードは、移行が完了するまでメンテナンス・ロックを拒否します。
-
コンピュート・ノードのメンテナンス・ロックが解放されると、置き換えられたインスタンスを元のフォルト・ドメインに戻すことができます。置き換えられたインスタンスが戻されるコンピュート・ノードは、移行が完了するまでメンテナンス・ロックを拒否します。
-
通常、インスタンスの移行にかかる時間は30秒以下です。ただし、大規模なインスタンスと大量のワークロードでは、必要な時間が長くなります。
-
インスタンスが移動状態でスタックし、移行の完了に失敗した場合、そのホスト・コンピュート・ノードはメンテナンスのためにロックできません。詳細は、オラクルに連絡してください。
- サービスWeb UIの使用
-
-
計算ノードでプロビジョニングが無効になっていることを確認します。
-
コンピュート・ノードにアクティブなインスタンスがないことを確認します。これらは移行または停止する必要があります。
-
ナビゲーションメニューで、「ラックユニット」をクリックします。
-
「ラック・ユニット」表で、メンテナンスが必要なコンピュート・ノードのホスト名をクリックします。
計算ノードの詳細ページが表示されます。
-
ページの右上隅にある[コントロール]をクリックし、[メンテナンスロック]コマンドを選択します。
確認ウィンドウが表示されたら、「Lock」をクリックして続行します。
正常に完了すると、「Compute Node Information」タブに「Maintenance Locked」が「Yes」と表示されます。
-
保守ロックを解除するには、「制御」をクリックし、「保守ロック解除」コマンドを選択します。
確認ウィンドウが表示されたら、「Unlock」をクリックして続行します。
正常に完了すると、「Compute Node Information」タブに「Maintenance Locked」が「No」と表示されます。
-
- サービスCLIの使用
-
-
コンピュートノードのリストを表示します。
保守が必要な計算ノードのIDをコピーします。
PCA-ADMIN> list ComputeNode Data: id name provisioningState provisioningType -- ---- ----------------- ---------------- 3e62bf25-a26c-407e-ab8b-df01a4ad98b6 pcacn002 Provisioned KVM f7b8356b-052f-4911-babb-447e6ab9c78d pcacn003 Provisioned KVM 4e06ebdf-faed-484e-996d-d77af786f123 pcacn001 Provisioned KVM -
計算ノードでプロビジョニングが無効になっていることを確認します。
-
メンテナンスのために計算ノードをロックします。
PCA-ADMIN> maintenanceLock id=f7b8356b-052f-4911-babb-447e6ab9c78d JobId: e46f6603-2af2-4df4-a0db-b15156491f88ジョブIDを使用して、コマンドのステータスを確認します。
PCA-ADMIN> show Job id=e46f6603-2af2-4df4-a0db-b15156491f88 [...] Done = true Name = MODIFY_TYPE Run State = Succeeded -
ジョブが完了したら、コンピュート・ノードがメンテナンスのためにロックされていることを確認します。
PCA-ADMIN> show ComputeNode id=f7b8356b-052f-4911-babb-447e6ab9c78d [...] Provisioning State = Provisioned [...] Provisioning Locked = true Maintenance Locked = true計算ノードはメンテナンスの準備ができました。
-
メンテナンス・ロックを解除するには、次のコマンドを使用します。
PCA-ADMIN> maintenanceUnlock id=f7b8356b-052f-4911-babb-447e6ab9c78d JobId: 625af20e-4b49-4201-879f-41d4405314c7ジョブIDを使用して、コマンドのステータスを確認します。
PCA-ADMIN> show Job id=625af20e-4b49-4201-879f-41d4405314c7 [...] Done = true Name = MODIFY_TYPE Run State = Succeeded -
ジョブが完了したら、プロビジョニング・ロックが解放されたことを確認します。
PCA-ADMIN> show ComputeNode id=f7b8356b-052f-4911-babb-447e6ab9c78d [...] Provisioning State = Provisioned [...] Provisioning Locked = true Maintenance Locked = false
-