コンピュート・ノード操作の実行
「サービスWeb UI」のラック・ユニット・リストから、管理者はハードウェア・コンポーネントに対して特定の操作を実行できます。 これらの操作には、アクション・メニューからアクセスできます。これは、各表の行の右側に縦に3つの点があるボタンです。 実際には、全てのコンポーネント・タイプについて、詳細の表示およびIDのコピーの操作のみを使用できます。
コンピュート・ノードが検出状態であるか、起動している場合、ハードウェア・プロセスがそれらをプロビジョニング準備完了に遷移するまで、そのステータスは失敗です。 通常、このプロセスには5分かかりません。 失敗状態が続く場合は、「サービスCLI」コマンドlist ComputeNode
を使用してコンピュート・ノードのプロビジョニング状態を確認し、適切なアクションを実行します。
コンピュート・ノードの場合、アクション・メニューまたはコンピュート・ノードの詳細ページから、他のいくつかの操作を使用できます。 これらの操作は、「サービスCLI」の同等のステップを含む、この項で詳しく説明します。
コンピュート・ノードのプロビジョニング
コンピュート・ノードを使用してコンピュート・インスタンスをホストする前に、管理者がプロビジョニングする必要があります。 アプライアンス・ソフトウェアは、ラックに取り付けられ、スイッチに接続されたコンピュート・ノードを検出します。つまり、ラック・ユニット・リストには「プロビジョニング準備完了」と表示されます。 「サービスWeb UI」または「サービスCLI」からプロビジョニングできます。
「サービスWeb UI」の使用
-
ナビゲーション・メニューで、「ラック・ユニット」をクリックします。
-
「ラック・ユニット」表で、プロビジョニングするコンピュート・ノードのホスト名をクリックします。
コンピュート・ノードの詳細ページが表示されます。
-
ページの右上隅で、Controls(管理)をクリックし、Provision(プロビジョニング)コマンドを選択します。
「サービスCLI」の使用
-
コンピュート・ノードのリストを表示します。
プロビジョニングするコンピュート・ノードのIDをコピーします。
PCA-ADMIN> list ComputeNode Command: list ComputeNode Status: Success Time: 2021-08-20 08:53:56,681 UTC Data: id name provisioningState provisioningType -- ---- ----------------- ---------------- 29f68a0e-4744-4a92-9545-7c48fa365d0a pcacn001 Ready to Provision Unspecified 7a0236f4-b00e-461d-93a0-b22673a18d9c pcacn003 Ready to Provision Unspecified dc8ae567-b07f-48e0-89bd-e57069c20010 pcacn002 Ready to Provision Unspecified
-
次のコマンドを使用して、コンピュート・ノードをプロビジョニングします:
PCA-ADMIN> provision id=7a0236f4-b00e-461d-93a0-b22673a18d9c Command: provision id=7a0236f4-b00e-461d-93a0-b22673a18d9c Status: Success Time: 2021-08-20 11:35:40,152 UTC JobId: ea93cac4-4430-4663-aafd-d70701593fb2
ジョブIDを使用して、プロビジョニング・コマンドのステータスを確認します。
PCA-ADMIN> show Job id=ea93cac4-4430-4663-aafd-d70701593fb2 [...] Done = true Name = MODIFY_TYPE Run State = Succeeded
-
この時点でプロビジョニングする他のコンピュート・ノードに対して、プロビジョニング・コマンドを繰り返します。
-
コンピュート・ノードがプロビジョニングされていることを確認します。
PCA-ADMIN> list ComputeNode Command: list ComputeNode Status: Success Time: 2021-08-20 11:38:29,509 UTC Data: id name provisioningState provisioningType -- ---- ----------------- ---------------- 29f68a0e-4744-4a92-9545-7c48fa365d0a pcacn001 Provisioned KVM 7a0236f4-b00e-461d-93a0-b22673a18d9c pcacn003 Provisioned KVM dc8ae567-b07f-48e0-89bd-e57069c20010 pcacn002 Provisioned KVM
コンピュート・ノードのプロビジョニングの無効化
複数のコンピュート・ノード操作は、プロビジョニングが無効になっている状態でのみ実行できます。 この項では、プロビジョニング・ロックを適用およびリリースする方法について説明します。
「サービスWeb UI」の使用
-
ナビゲーション・メニューで、「ラック・ユニット」をクリックします。
-
「ラック・ユニット」表で、変更するコンピュート・ノードのホスト名をクリックします。
コンピュート・ノードの詳細ページが表示されます。
-
ページの右上隅で、「Controls」をクリックし、「プロビジョニング・ロック」コマンドを選択します。
確認ウィンドウが表示されたら、ロックをクリックして続行します。
正常に完了すると、「コンピュート・ノード情報」タブにプロビジョニング・ロック済がはいと表示されます。
-
プロビジョニング・ロックを解除するには、Controlsをクリックし、プロビジョニング・ロック解除コマンドを選択します。
確認ウィンドウが表示されたら、ロック解除をクリックして続行します。
正常に完了すると、「コンピュート・ノード情報」タブにプロビジョニング・ロック済がいいえと表示されます。
「サービスCLI」の使用
-
コンピュート・ノードのリストを表示します。
プロビジョニング操作を無効にするコンピュート・ノードのIDをコピーします。
PCA-ADMIN> list ComputeNode Command: list ComputeNode Status: Success Time: 2021-08-23 09:25:56,307 UTC Data: id name provisioningState provisioningType -- ---- ----------------- ---------------- 3e62bf25-a26c-407e-ab8b-df01a4ad98b6 pcacn002 Provisioned KVM f7b8356b-052f-4911-babb-447e6ab9c78d pcacn003 Provisioned KVM 4e06ebdf-faed-484e-996d-d77af786f123 pcacn001 Provisioned KVM
-
コンピュート・ノードにプロビジョニング・ロックを設定します。
PCA-ADMIN> provisioningLock id=f7b8356b-052f-4911-babb-447e6ab9c78d Command: provisioningLock id=f7b8356b-052f-4911-babb-447e6ab9c78d Status: Success Time: 2021-08-23 09:29:46,568 UTC JobId: 6ee78c8a-e227-4d31-a770-9b9c96085f3f
ジョブIDを使用して、コマンドのステータスを確認します。
PCA-ADMIN> show Job id=6ee78c8a-e227-4d31-a770-9b9c96085f3f Command: show Job id=6ee78c8a-e227-4d31-a770-9b9c96085f3f [...] Done = true Name = MODIFY_TYPE Run State = Succeeded
-
ジョブが完了したら、コンピュート・ノードがプロビジョニング・ロック中であることを確認します。
PCA-ADMIN> show ComputeNode id=f7b8356b-052f-4911-babb-447e6ab9c78d [...] Provisioning State = Provisioned [...] Provisioning Locked = true Maintenance Locked = false
ロックが解放されるまで、すべてのプロビジョニング操作は無効になります。
-
プロビジョニング・ロックを解除するには、次のコマンドを使用します:
PCA-ADMIN> provisioningUnlock id=f7b8356b-052f-4911-babb-447e6ab9c78d Command: provisioningUnlock id=f7b8356b-052f-4911-babb-447e6ab9c78d Status: Success Time: 2021-08-23 09:44:58,531 UTC JobId: 523892e8-c2d4-403c-9620-2f3e94015b46
ジョブIDを使用して、コマンドのステータスを確認します。
PCA-ADMIN> show Job id=523892e8-c2d4-403c-9620-2f3e94015b46 [...] Done = true Name = MODIFY_TYPE Run State = Succeeded
-
ジョブが完了したら、プロビジョニング・ロックが解放されたことを確認します。
PCA-ADMIN> show ComputeNode id=f7b8356b-052f-4911-babb-447e6ab9c78d [...] Provisioning State = Provisioned [...] Provisioning Locked = false Maintenance Locked = false
メンテナンス用のコンピュート・ノードのロック
メンテナンス操作の場合、コンピュート・ノードはメンテナンス・モードにする必要があります。 このセクションでは、メンテナンス・ロックの実施および解放方法について説明します。 メンテナンスのためにコンピュート・ノードをロックする前に、まずプロビジョニングを無効にする必要があります。 メンテナンス操作は、コンピュート・ノードに実行中のコンピュート・インスタンスがない場合にのみ実行できます。
注意:
コンピュート・サービスの高可用性構成によっては、自動インスタンス移行によって、コンピュート・ノードを正常にロックできない場合があります。 「高可用性のためのコンピュート・サービスの構成」を参照してください。 この状況は、使用可能なコンピュート容量が制限されている場合に発生します。
-
コンピュート・ノードの停止後のインスタンス・リカバリまたは移行操作により、メンテナンス・ロックが失敗することがあります。 インスタンスの移行に関与するコンピュート・ノードは、移行が完了するまでメンテナンス・ロックを拒否します。
-
コンピュート・ノードのメンテナンス・ロックが解除されると、交換したインスタンスを元のフォルト・ドメインに戻すことができます。 置き換えられたインスタンスの移行元のコンピュート・ノードは、移行が完了するまでメンテナンス・ロックを拒否します。
-
通常、インスタンスの移行には30秒以上かかります。 ただし、大規模なインスタンスと大量のワークロードにより、必要な時間が増加します。
-
インスタンスが移動状態でスタックし、移行が完了しなかった場合、そのホスト・コンピュート・ノードをメンテナンスのためにロックできません。 Oracleに連絡してください。
「サービスWeb UI」の使用
-
コンピュート・ノードでプロビジョニングが無効になっていることを確認します。
「コンピュート・ノードのプロビジョニングの無効化」を参照してください。
-
コンピュート・ノードにアクティブなインスタンスがないことを確認します。 移行または停止する必要があります。
「コンピュート・ノードからのインスタンスの移行」を参照してください。
-
ナビゲーション・メニューで、「ラック・ユニット」をクリックします。
-
「ラック・ユニット」表で、メンテナンスが必要なコンピュート・ノードのホスト名をクリックします。
コンピュート・ノードの詳細ページが表示されます。
-
ページの右上隅で、Controlsをクリックし、Maintenance Lockコマンドを選択します。
確認ウィンドウが表示されたら、ロックをクリックして続行します。
正常に完了すると、「コンピュート・ノード情報」タブにメンテナンス・ロック済がはいと表示されます。
-
保守ロックを解放するには、Controlsをクリックし、Maintenanceロック解除コマンドを選択します。
確認ウィンドウが表示されたら、ロック解除をクリックして続行します。
正常に完了すると、「コンピュート・ノード情報」タブにメンテナンス・ロック済がいいえと表示されます。
「サービスCLI」の使用
-
コンピュート・ノードのリストを表示します。
メンテナンスを必要とするコンピュート・ノードのIDをコピーします。
PCA-ADMIN> list ComputeNode Command: list ComputeNode Status: Success Time: 2021-08-23 09:25:56,307 UTC Data: id name provisioningState provisioningType -- ---- ----------------- ---------------- 3e62bf25-a26c-407e-ab8b-df01a4ad98b6 pcacn002 Provisioned KVM f7b8356b-052f-4911-babb-447e6ab9c78d pcacn003 Provisioned KVM 4e06ebdf-faed-484e-996d-d77af786f123 pcacn001 Provisioned KVM
-
コンピュート・ノードでプロビジョニングが無効になっていることを確認します。
「コンピュート・ノードのプロビジョニングの無効化」を参照してください。
-
メンテナンスのためにコンピュート・ノードをロックします。
PCA-ADMIN> maintenanceLock id=f7b8356b-052f-4911-babb-447e6ab9c78d Command: maintenanceLock id=f7b8356b-052f-4911-babb-447e6ab9c78d Status: Success Time: 2021-08-23 09:56:05,443 UTC JobId: e46f6603-2af2-4df4-a0db-b15156491f88
ジョブIDを使用して、コマンドのステータスを確認します。
PCA-ADMIN> show Job id=e46f6603-2af2-4df4-a0db-b15156491f88 [...] Done = true Name = MODIFY_TYPE Run State = Succeeded
-
ジョブが完了したら、コンピュート・ノードがメンテナンス用にロックされていることを確認します。
PCA-ADMIN> show ComputeNode id=f7b8356b-052f-4911-babb-447e6ab9c78d [...] Provisioning State = Provisioned [...] Provisioning Locked = true Maintenance Locked = true
コンピュート・ノードはメンテナンスの準備ができました。
-
メンテナンス・ロックを解放するには、次のコマンドを使用します:
PCA-ADMIN> maintenanceUnlock id=f7b8356b-052f-4911-babb-447e6ab9c78d Command: maintenanceUnlock id=f7b8356b-052f-4911-babb-447e6ab9c78d Status: Success Time: 2021-08-23 10:00:53,902 UTC JobId: 625af20e-4b49-4201-879f-41d4405314c7
ジョブIDを使用して、コマンドのステータスを確認します。
PCA-ADMIN> show Job id=625af20e-4b49-4201-879f-41d4405314c7 [...] Done = true Name = MODIFY_TYPE Run State = Succeeded
-
ジョブが完了したら、プロビジョニング・ロックが解放されたことを確認します。
PCA-ADMIN> show ComputeNode id=f7b8356b-052f-4911-babb-447e6ab9c78d [...] Provisioning State = Provisioned [...] Provisioning Locked = true Maintenance Locked = false
コンピュート・ノードからのインスタンスの移行
一部のメンテナンス操作など、一部のコンピュート・ノード操作を実行できるのは、コンピュート・ノードに実行中のコンピュート・インスタンスがない場合のみです。 管理者は、実行中のすべてのインスタンスをコンピュート・ノード(コンピュート・ノードの退避とも呼ばれる)から移行できます。
デフォルトでは、十分なリソースが使用可能な場合、実行中のインスタンスは、同じフォルト・ドメイン内の他のコンピュート・ノードにライブ移行されます。
重要:
コンピュート・ノードの退避を実行する前に、同じフォルト・ドメイン内の別のコンピュート・ノードにライブ移行できないインスタンスの動作を確認します。
このトピックおよび「高可用性のためのコンピュート・サービスの構成」の残りの部分では、設定の確認方法と、様々な設定に対するインスタンスの処理方法について説明します。
厳密なフォルト・ドメイン強制が設定されているかどうかを確認するには、「コンピュート・サービス構成の表示および設定」を参照してください。
Strict FD Enabled
がfalse
に設定されている場合)、同じフォルト・ドメイン内の別のコンピュート・ノードにライブ移行できないインスタンスは、そのフォルト・ドメインで十分なリソースが使用可能な場合、別のフォルト・ドメインにライブ移行されます。
厳密なフォルト・ドメインの強制が有効になっている場合(「サービスWeb UI」で「厳密なFD」が「有効」に設定されているか、「サービスCLI」でStrict FD Enabled
がtrue
に設定されている場合)、同じフォルト・ドメイン内の別のコンピュート・ノードにライブ移行できないインスタンスは移行されません。これらのインスタンスは、退避するコンピュート・ノードで実行されています。
厳密なフォルト・ドメイン強制を有効化または無効化して、同じフォルト・ドメイン内の他のコンピュート・ノードにライブ移行できないインスタンスが、コンピュート・ノードの退避を試行した後も、別のフォルト・ドメインにライブ移行されるか、同じコンピュート・ノードで実行されるかを設定します。
現在のフォルト・ドメインがそれらに対応できず、厳密なフォルト・ドメイン強制が有効になっているため、または厳密なフォルト・ドメインの強制が無効になっているが、他のフォルト・ドメインもインスタンスに対応できないため、一部のインスタンスをライブ移行できない場合は、強制オプションを指定して移行操作を再実行できます。 forceオプションを指定すると、Computeサービスはライブ移行に失敗したすべてのインスタンスを停止し、退避を続行できるようにします。
停止したインスタンスを再起動します。 インスタンスがコンピュート・サービスによって停止され(管理者が手動で停止していない)、リソースが使用可能になったときに自動的に実行にリストアされるようにする場合は、コンピュート・サービスの「自動リカバリ」プロパティが有効で、インスタンスの可用性リカバリ・アクションがRESTORE_INSTANCE
に設定されていることを確認します。 「コンピュート・サービス構成の表示および設定」および「「停止したインスタンスのリカバリ状態の構成」」を参照してください。
管理者がコンピュート・ノードを退避するとき、または計画外コンピュート・ノードの停止にレスポンスして強制オプションを使用する場合、コンピュート・サービスによってインスタンスを停止できます。 自動リカバリの設定は、管理メンテナンスまたは計画外停止後にリソースが使用可能になる前または後にいつでも変更でき、コンピュート・サービスによって停止されたインスタンスを再起動できます。 インスタンス可用性リカバリ・アクションがSTOP_INSTANCE
に設定されている場合、自動リカバリ・プロパティが有効になっている場合でもインスタンスは停止されたままです。 インスタンスの可用性リカバリ・アクションが後でRESTORE_INSTANCE
に変更された場合、後続の自動リカバリ・パスによってインスタンスが再起動されます。
再配置されたインスタンスを返します。 インスタンスが別のフォルト・ドメインにライブ移行(置換)され、リソースが使用可能になったときに、選択したフォルト・ドメイン(インスタンス構成で指定されているフォルト・ドメイン)にインスタンスを戻す場合は、コンピュート・サービスの「自動解決」プロパティが有効であることを確認します。 「コンピュート・サービス構成の表示および設定」および「「コンピュート・サービス構成コマンド」」を参照してください。 コンピュート・ノードの退避が完了する前または後にいつでも「自動解決」プロパティを設定して、置き換えられたインスタンスを再配置できます。
移行操作を実行するには、次の手順を使用します。
コンピュート・ノードの退避: 始める前に
-
フォルト・ドメインおよびコンピュート・ノード・リソースを確認します。 「フォルト・ドメイン別CPUおよびメモリー使用量の表示」を参照してください。 この情報に基づいて、次のいずれかを実行するかどうかを決定します:
-
不要になったインスタンスを終了します。
-
使用するリソースが少なくなるように一部のインスタンスを再構成します。 たとえば、別のシェイプを指定します。
-
一部のインスタンスを再構成して、別のフォルト・ドメインを指定します。
-
コンピュート・ノードの退避の実行中に、一部のインスタンスを停止します。
- 移行不可能なインスタンスを停止します。 「移行不可能なインスタンスの手動停止」を参照してください。
-
移行操作の強制オプションを指定して、ライブ移行できないインスタンスをソフト・ストップします。 インスタンスの可用性リカバリ・アクションおよび自動リカバリ構成については、前述の説明を参照してください。
-
-
コンピュート・ノードでのプロビジョニングを無効にします。 「コンピュート・ノードのプロビジョニングの無効化」を参照してください。
「サービスWeb UI」の使用
-
ナビゲーション・メニューで、「ラック・ユニット」をクリックします。
-
「ラック・ユニット」表で、退避するコンピュート・ノードのホスト名を検索します。 そのホストの「アクション」メニューをクリックし、「すべてのVMSの移行」オプションをクリックします。
または、「ラック・ユニット」表で、退避するコンピュート・ノードのホスト名をクリックして、そのコンピュート・ノードの詳細ページを表示します。 「Controls」メニューをクリックし、「すべてのVMSの移行」オプションをクリックします。
-
「VMsの移行の確認」ダイアログで、移行できないインスタンスを強制的に停止するかどうかを選択します。
デフォルトでは、強制停止オプションは有効ではなく、移行できないインスタンスは、移行操作の完了後もノードで実行されます。 移行できないインスタンスを強制的に停止するには、「VMsの移行の確認」ダイアログで強制停止オプションを有効にします。
-
「VMsの移行の確認」ダイアログで、「移行」ボタンをクリックします。
コンピュート・サービスでは、十分なリソースが使用可能であり、それを許可するように高可用性設定が構成されている場合、実行中のインスタンスが他のコンピュート・ノードにライブ移行されます。 「強制」オプションを指定した場合、移行できなかったインスタンスはソフト停止されます。 「フォースが指定されませんでした」インスタンスを移行できなかった場合、それらのインスタンスは、退避しようとしているコンピュート・ノードで実行されたままになります。
「サービスCLI」の使用
-
コンピュート・ノードのリストを表示します。
退避するコンピュート・ノードのIDをコピーします。
PCA-ADMIN> list ComputeNode Command: list ComputeNode Status: Success Time: 2021-08-23 09:25:56,307 UTC Data: id name provisioningState provisioningType -- ---- ----------------- ---------------- 3e62bf25-a26c-407e-ab8b-df01a4ad98b6 pcacn002 Provisioned KVM f7b8356b-052f-4911-babb-447e6ab9c78d pcacn003 Provisioned KVM 4e06ebdf-faed-484e-996d-d77af786f123 pcacn001 Provisioned KVM
-
migrateVm
コマンドを使用して、実行中のすべてのコンピュート・インスタンスをコンピュート・ノードからライブ移行します。 移行に失敗したインスタンスをソフト・ストップするには、force
オプションを設定します:PCA-ADMIN> migrateVm id=7a0236f4-b00e-461d-93a0-b22673a18d9c force=true Command: migrateVm id=7a0236f4-b00e-461d-93a0-b22673a18d9c force=true Status: Running Time: 2021-08-20 10:37:05,781 UTC JobId: 6f1e94bc-7d5b-4002-ada9-7d4b504a2599
コンピュート・サービスでは、十分なリソースが使用可能であり、それを許可するように高可用性設定が構成されている場合、実行中のインスタンスが他のコンピュート・ノードにライブ移行されます。
force=true
が指定された場合、移行できなかったインスタンスはソフト停止されます。 いずれかのインスタンスを移行できず、force=true
が指定されなかった場合、それらのインスタンスは、退避しようとしているコンピュート・ノードで実行されたままになります。ジョブIDを使用して、
migrateVm
コマンドのステータスを確認します。PCA-ADMIN> show Job id=6f1e94bc-7d5b-4002-ada9-7d4b504a2599 [...] Done = true Name = MODIFY_TYPE Run State = Succeeded
移行不可能なインスタンスの手動停止
vmMigrate
操作でforce
オプションを指定して、ライブ移行できないインスタンスをソフト・ストップすることは可能ですが、ベスト・プラクティスは、移行前に移行不可能なインスタンスを正常に停止して、VMで実行されているすべてのワークロードが良好な状態になるようにすることです。
「サービスCLI」の使用
-
移行不可能なインスタンスのリストを表示します。
実行中のインスタンスのIDをコピーして、停止できるようにします。
PCA-ADMIN> getNonMigratableInstances Command: getNonMigratableInstances Status: Success Time: 2024-09-26 13:21:51,727 UTC Data: id Display Name Compute Node Id Domain State -- ------------ --------------- ------------ ocid1.instance.unique_ID instance202 CN_ID running ocid1.instance.unique_ID kqh027 CN_ID shut off
-
実行中のインスタンスを停止します。
「コンピュート・インスタンスのデプロイメント」の「インスタンスの操作」セクションを参照してください。
高可用性のためのコンピュート・サービスの構成
「コンピュート・ノードからのインスタンスの移行」は、計画メンテナンスのためにコンピュート・ノードを退避する方法について説明します。 可能な場合、Computeサービスは、実行中のインスタンスを同じフォルト・ドメイン内の他のコンピュート・ノードにライブ移行します。
コンピュート・ノードの計画外停止の場合、コンピュート・サービスはインスタンスを停止し、停止が継続する場合は、リブート移行を使用してコンピュート・ノードを退避しようとします。
次の項では、コンピュート・サービスが計画外停止を処理する方法を制御するために高可用性構成を設定する方法について説明します。
インスタンスおよびコンピュート・サービスの高可用性構成の使用
次の項では、高可用性構成を使用して、様々なタイプのコンピュート・ノード停止の結果を管理する方法について説明します。 インスタンス可用性リカバリ・アクションは、インスタンスごとに設定される唯一の高可用性構成です。 その他の高可用性構成はすべてComputeサービスに設定され、すべてのインスタンスに影響します。
「選択中」フォルト・ドメインは、インスタンス構成で指定されるフォルト・ドメインです。 「避難民」インスタンスは、選択したフォルト・ドメインではないフォルト・ドメインにあります。
計画メンテナンス停止
コンピュート・ノードを退避する方法の詳細は、「コンピュート・ノードからのインスタンスの移行」を参照してください。 可能な場合、Computeサービスは、実行中のインスタンスを同じフォルト・ドメイン内の他のコンピュート・ノードにライブ移行します。
「コンピュート・ノードからのインスタンスの移行」では、コンピュート・ノードの退避の実行時に、インスタンスの可用性リカバリ・アクション(各インスタンスで設定)およびコンピュート・サービスの自動リカバリおよび自動解決プロパティを使用する方法についても説明します。
計画外停止
コンピュート・サービスは、次のコンピュート・ノードの停止条件下でインスタンスの停止およびリブートの移行を試みます:
-
HWステータスからの電源切断
-
コンピュート・ノード・データ・ネットワークに到達できません
コンピュート・サービスがインスタンスを移行できないという場合、コンピュート・ノードの停止が発生する可能性があります。 たとえば、コンピュート・サービスがコンピュート・ノードにまったく到達できない場合、コンピュート・サービスはインスタンスを停止およびリブートして移行できません。
5分未満の計画外停止
計画外停止では、コンピュート・サービスは影響を受けるインスタンスを停止します。 停止が5分未満の場合、デフォルトでは、コンピュート・サービスは停止前に実行されていたインスタンスの再起動を試みます。 実際の動作は、インスタンスとコンピュート・サービスの構成方法によって異なります。 次のディシジョン・フローでは、この動作を制御する方法について説明します。
コンピュート・サービスで、停止の前に実行されていたインスタンスの再起動を試行しますか。 これはデフォルトです。
-
はい 自動リカバリが有効で、インスタンスの可用性リカバリ・アクションが
RESTORE_INSTANCE
に設定されていることを確認します。 「停止したインスタンスのリカバリ状態の構成」を参照してください。選択したフォルト・ドメインで一部のインスタンスに対応できなくなった場合、自動リカバリは引き続きポーリングを行い、インスタンスの再起動を試行します。
getForcedStoppedInstances
も参照してください。インスタンスの可用性リカバリ・アクションが
STOP_INSTANCE
に設定されている場合、自動リカバリが有効になっている場合でも、インスタンスは停止したままになります。 -
いいえ。自動リカバリを無効にします。 停止前に実行されていたインスタンスは停止したままになります。
インスタンスの可用性リカバリ・アクション設定および自動リカバリ設定はいつでも変更でき、変更は次回のポーリング時に有効になります。
5分を超える計画外停止
計画外停止では、コンピュート・サービスは影響を受けるインスタンスを停止します。 停止が5分を超えると、コンピュート・サービスは、デフォルトでコンピュート・ノードから移行(コールド移行)インスタンスのリブートを試みます。 同じフォルト・ドメイン内の他のコンピュート・ノードに収容できないインスタンスは、リブートして他のフォルト・ドメインに移行されます。 実際の動作は、コンピュート・サービスの構成方法によって異なります。 次のディシジョン・フローでは、この動作を制御する方法について説明します。
実行中のインスタンスをリブート移行しますか。 リブート移行は、特定のコンピュート・ノードで実行中の各インスタンスを停止および起動しています。 「Oracle Private Cloud Appliance概要ガイド」の「アーキテクチャと設計」の章にある「高可用性」のコンピュート・インスタンスの可用性に関する項も参照してください。
-
はい VM高可用性が有効になっていることを確認します。
一部のインスタンスを同じフォルト・ドメイン内の別のコンピュート・ノードに収容できない場合は、それらのインスタンスを別のフォルト・ドメインにリブート移行しますか。
-
はい 厳密なFDが無効になっていることを確認します。 どのフォルト・ドメインにも対応できないインスタンスは、コンピュート・サービスによって停止されたままです。
リブート移行後、選択したフォルト・ドメインではないフォルト・ドメインで実行されているインスタンスを、リソースが使用可能になると、選択したフォルト・ドメインに自動的にライブ移行しますか。
-
はい 自動解決が有効になっていることを確認します。
getDisplacedInstances
も参照してください。 -
いいえ。自動解決を無効にします。
-
-
いいえ。厳密なFDを有効にします。 停止前に実行されていて、現在のフォルト・ドメイン内の別のコンピュート・ノードに移行できないインスタンスは、コンピュート・サービスによって停止されたままです。
-
-
いいえ。VM高可用性を無効にします。 停止前に実行されていたインスタンスは、コンピュート・サービスによって停止されます。
コンピュート・サービスによって停止されたインスタンスを、選択したフォルト・ドメインで実行するように自動的にリストアしますか。 はいの場合、自動リカバリが有効で、インスタンスの可用性リカバリ・アクションがRESTORE_INSTANCE
に設定されていることを確認します。 「停止したインスタンスのリカバリ状態の構成」を参照してください。
コンピュート・サービス構成の表示および設定
これらの構成設定の動作の詳細は、「コンピュート・サービス構成コマンド」を参照してください。
「サービスWeb UI」の使用
ナビゲーション・メニューで、「FDインスタンス」をクリックし、「コンピュート・サービスの詳細」をクリックします。
「コンピュート・サービス情報」ページには、自動リカバリ、置換されたインスタンスの自動解決、VM高可用性および厳密なFDの現在の設定が表示されます。 これらの設定は、デフォルトで無効になっている厳密なFDを除き、すべてデフォルトで有効になっています。 デフォルトでは、コンピュート・サービスがインスタンスを移行する場合、フォルト・ドメインの配置は厳密に強制されません。
「Computeサービス情報」ページの「コントロール」メニューを使用して、これらの構成設定の値を「有効」と「無効」の間で変更します。
「サービスCLI」の使用
show computeservice
コマンドを使用して、現在のコンピュート・サービス構成設定を表示します。 次の例では、4つの高可用性構成設定のデフォルト値が設定されます: Auto Recovery Action Enabled
, Auto-Resolve Displaced Instances Enabled
, VM High Availability Enabled
およびStrict FD Enabled
。 デフォルトでは、Strict FD Enabled
(デフォルトではfalse)を除き、これらの設定はすべてtrueです。
PCA-ADMIN> show computeservice
Command: show computeservice
Status: Success
Time: 2023-04-17 20:37:42,296 UTC
Data:
Id = unique_ID
Type = ComputeService
total CN cpu usage percent = 23.3
total CN memory usage percent = 16.2
Auto Recovery Action Enabled = true
Auto-Resolve Displaced Instances Enabled = true
VM High Availability Enabled = true
Strict FD Enabled = false
Name = Compute Service
Work State = Normal
これらの設定を変更するには、次のリストのコマンドを使用します。 showcustomcmds computeservice
コマンドは、コンピュート・サービス内のすべての高可用性構成コマンドをリストします。
PCA-ADMIN> showcustomcmds computeservice enableAutoRecoveryAction disableAutoRecoveryAction enableAutoResolveDisplacedInstances disableAutoResolveDisplacedInstances enableVmHighAvailability disableVmHighAvailability enableStrictFD disableStrictFD getForcedStoppedInstances getDisplacedInstances
たとえば、Auto Recovery Action Enabled
を無効にするには、disableAutoRecoveryAction
コマンドを実行します。 厳密なフォルト・ドメインの強制を有効にするには、enableStrictFD
コマンドを実行します。
コンピュート・サービス構成コマンド
この項では、コンピュート・サービスの高可用性構成設定の動作について説明します。 「サービスCLI」コマンドをこの項のリストに示します。 同等の「サービスWeb UI」設定にアクセスするには、ナビゲーション・メニューをクリックし、「FDインスタンス」をクリックします。 「コンピュート・サービス構成の表示および設定」を参照してください。
これらの説明では、「選択中」フォルト・ドメインは、インスタンス構成で指定されたフォルト・ドメインです。 「避難民」インスタンスは、選択したフォルト・ドメインではないフォルト・ドメインにあります。
-
enableAutoRecoveryAction
-
コンピュート・サービスによって停止されたインスタンスの自動再起動を有効にします。 これはデフォルトです。 インスタンス可用性リカバリ・アクションが
RESTORE_INSTANCE
に設定されている場合、このコマンドは、コンピュート・サービスによって停止されたインスタンスを、リソースが使用可能なときに選択したフォルト・ドメインで自動的に再起動します。 「停止したインスタンスのリカバリ状態の構成」およびgetForcedStoppedInstances
も参照してください。インスタンスは、次の理由でコンピュート・サービスによって停止された可能性があります:
-
移行に強制オプションを指定した結果、すべての操作および一部のインスタンスを移行できませんでした。
「コンピュート・ノードからのインスタンスの移行」を参照してください。
-
計画外のコンピュート・ノードの停止の結果として。
「計画外停止」を参照してください。
この自動リカバリ・プロパティは、管理メンテナンスの停止前または停止後にいつでも設定できます。また、計画外停止によってコンピュート・サービスによって停止されたインスタンスを再起動できます。 インスタンス可用性リカバリ・アクションが
STOP_INSTANCE
に設定されている場合、自動リカバリ・プロパティが有効になっている場合でもインスタンスは停止されたままです。 インスタンスの可用性リカバリ・アクションが後でRESTORE_INSTANCE
に変更された場合、後続の自動リカバリ・パスによってインスタンスが再起動されます。 -
-
disableAutoRecoveryAction
-
停止したインスタンスの自動再起動を無効にします。 コンピュート・サービスによって停止されたインスタンスは、リソースが使用可能になると自動的に再起動されません。
-
enableAutoResolveDisplacedInstances
-
実行中のインスタンスを、選択したフォルト・ドメインに戻すことができます。 これはデフォルトです。 コンピュート・ノードの退避中にインスタンスが別のフォルト・ドメインに移動(置き換え)された場合、このコマンドを使用すると、そのフォルト・ドメインで十分なリソースが使用可能になったら、それらのインスタンスを選択したフォルト・ドメインに自動的にライブ移行できます。
getDisplacedInstances
も参照してください。この自動解決構成は、停止前または停止後にいつでも設定して、置き換えられたインスタンスを再配置できます。
停止したインスタンスは移行されません。
-
disableAutoResolveDisplacedInstances
-
選択したフォルト・ドメインへのインスタンスの戻りを無効にします。 コンピュート・ノードの退避中に別のフォルト・ドメインに移動されたインスタンスは、移動先のフォルト・ドメインに残ります。
-
enableVmHighAvailability
-
アクセスできないコンピュート・ノードから高可用性(リブート移行)を有効にします。 これはデフォルトです。
-
disableVmHighAvailability
-
リブート移行を無効にします。
-
enableStrictFD
-
厳密なフォルト・ドメイン強制を有効にします。 コンピュート・ノードの退避中に、強制オプションが指定されている場合、同じフォルト・ドメイン内の別のコンピュート・ノードに移動できないインスタンスは停止されます。 強制オプションが指定されなかった場合、移行操作は失敗します。
-
disableStrictFD
-
厳密なフォルト・ドメインの強制を無効にします。 これはデフォルトです。 コンピュート・ノードの退避中に、同じフォルト・ドメイン内の別のコンピュート・ノードに移動できないインスタンスは、別のフォルト・ドメインに移動されます。 コンピュート・サービスの「自動解決」プロパティが有効になっている場合、別のフォルト・ドメインへのこの移動は一時的です: 自動解決が有効な場合、リソースが使用可能になると、移動されたインスタンスは、選択したフォルト・ドメインにライブ移行されます。
getDisplacedInstances
も参照してください。 -
getForcedStoppedInstances
-
移行操作のforceオプションの使用によって停止されたインスタンス、または計画外の停止に応じてコンピュート・サービスによって停止されたインスタンスをすべてリストします。
PCA-ADMIN> getForcedStoppedInstances Command: getForcedStoppedInstances Status: Success Time: 2023-04-17 20:53:51,410 UTC Data: id displayName compartmentId -- ----------- ------------- ocid1.instance.unique_ID inst-name ocid1.compartment.unique_ID
「サービスWeb UI」で、ナビゲーション・メニューをクリックし、「FDインスタンス」をクリックしてから、「強制停止されたインスタンス」をクリックします。 「処理」メニューを使用して、OCIDsをコピーします。
-
getDisplacedInstances
-
選択したフォルト・ドメインではないフォルト・ドメインで現在実行されているインスタンスをリストします。 実行されていないインスタンスは表示されません。
次の例では、実行中のインスタンスをフォルト・ドメイン1から移行しています。 1つのインスタンスがフォルト・ドメイン2に配置され、1つのインスタンスがフォルト・ドメイン3に配置されています。
PCA-ADMIN> getDisplacedInstances Command: getDisplacedInstances Status: Success Time: 2023-04-18 23:20:41,484 UTC Data: id displayName compartmentId faultDomain faultDomainSelected -- ----------- ------------- ----------- ------------------- ocid1.instance.unique_ID inst-name ocid1.compartment.unique_ID FAULT-DOMAIN-3 FAULT-DOMAIN-1 ocid1.instance.unique_ID inst-name ocid1.compartment.unique_ID FAULT-DOMAIN-2 FAULT-DOMAIN-1
「サービスWeb UI」で、ナビゲーション・メニューをクリックし、「FDインスタンス」をクリックして、「置換されたインスタンス」をクリックします。 「処理」メニューを使用して、OCIDsをコピーします。
停止したインスタンスのリカバリ状態の構成
コンピュート・サービスがインスタンスを停止した場合、コンピュート・サービスのインスタンス可用性リカバリ・アクションおよび自動リカバリ・プロパティを設定することで、リソースが再度使用可能になると、その停止したインスタンスがどのように処理されるかを構成できます。
コンピュート・サービスでインスタンスを停止できる理由については、「コンピュート・サービス構成コマンド」のenableAutoRecoveryAction
コマンドの説明を参照してください。 disableAutoRecoveryAction
およびgetForcedStoppedInstances
の説明も参照してください。
インスタンスの起動時または後続のインスタンス更新時に、インスタンスの可用性構成でインスタンス・リカバリ・アクションを設定します。
「コンピュートWeb UI」で、ダイアログの「可用性構成」の項を参照して、インスタンスを作成または編集したり、インスタンス構成を作成または編集します。 コンピュート・サービスによって停止されたインスタンスを再起動するには、「インフラストラクチャ・メンテナンス後のインスタンス・ライフサイクル状態のリストア」というラベルのボックスを選択します。 これはデフォルトです。 停止したインスタンスを停止したままにするには、「インスタンスのリストア」ボックスの選択を解除します。
OCI CLIでは、コンピュート・インスタンスのlaunch
またはupdate
コマンドまたはインスタンス構成のcreate
またはupdate
コマンドで、--availability-config
オプションまたはavailabilityConfig
プロパティを使用します。 recoveryAction
をRESTORE_INSTANCE
またはSTOP_INSTANCE
に設定します。 デフォルトの動作はRESTORE_INSTANCE
です。
"availabilityConfig": {"recoveryAction": "STOP_INSTANCE"}
厳密なフォルト・ドメイン強制の有効化
厳密なフォルト・ドメインの強制を有効にするには、次のいずれかを実行します:
-
「サービスWeb UI」で、ナビゲーション・メニューをクリックし、「FDインスタンス」をクリックして、「コンピュート・サービスの詳細」をクリックします。 「Computeサービス情報」ページで、「コントロール」メニューをクリックし、「厳密なFDの有効化」をクリックします。
-
「サービスCLI」で、
enableStrictFD
コマンドを実行します。
フォルト・ドメインの強制の影響の詳細は、「コンピュート・サービス構成コマンド」を参照してください。
現在のフォルト・ドメインに、移行する必要があるすべてのインスタンスに対応できる十分なリソースがない場合は、次を実行します:
-
計画されたコンピュート・ノードの退避を実行する場合は、移行操作で強制オプションを指定して、現在のフォルト・ドメイン内のインスタンスを停止します。
-
enableAutoRecoveryAction
コマンドを実行するか、「サービスWeb UI」で「自動リカバリの有効化」を選択します。 -
各インスタンスのインスタンス可用性リカバリ・アクションが、デフォルトの
RESTORE_INSTANCE
に設定されていることを確認します。 「停止したインスタンスのリカバリ状態の構成」を参照してください。
「コンピュート・ノードからのインスタンスの移行」の例を参照してください。
コンピュート・ノードの起動、リセット、または停止
「サービス・エンクレーブ」を使用すると、管理者は起動、リブートおよび停止のシグナルをコンピュート・ノードに送信できます。
「サービスWeb UI」の使用
-
コンピュート・ノードがメンテナンスのためにロックされていることを確認します。
「メンテナンス用のコンピュート・ノードのロック」を参照してください。
-
ナビゲーション・メニューで、「ラック・ユニット」をクリックします。
-
「ラック・ユニット」表で、起動、リセットまたは停止するコンピュート・ノードを見つけます。
-
アクション・メニュー(縦3つのドット)をクリックし、適切なアクションを選択: 開始、リセットまたは停止。
-
確認ウィンドウが表示されたら、適切なアクション・ボタンをクリックして続行します。
数秒間ポップアップ・ウィンドウが表示され、コンピュート・ノードの起動、停止または再起動が確認されます。
-
コンピュート・ノードが起動して再実行したら、メンテナンス・ロックおよびプロビジョニング・ロックを解放します。
「サービスCLI」の使用
-
コンピュート・ノードのリストを表示します。
起動、リセットまたは停止するコンピュート・ノードのIDをコピーします。
PCA-ADMIN> list ComputeNode Command: list ComputeNode Status: Success Time: 2021-08-23 09:25:56,307 UTC Data: id name provisioningState provisioningType -- ---- ----------------- ---------------- 3e62bf25-a26c-407e-ab8b-df01a4ad98b6 pcacn002 Provisioned KVM f7b8356b-052f-4911-babb-447e6ab9c78d pcacn003 Provisioned KVM 4e06ebdf-faed-484e-996d-d77af786f123 pcacn001 Provisioned KVM
-
コンピュート・ノードがメンテナンスのためにロックされていることを確認します。
「メンテナンス用のコンピュート・ノードのロック」を参照してください。
-
対応するコマンドを使用して、コンピュート・ノードを起動、リセットまたは停止します:
PCA-ADMIN> start ComputeNode id=f7b8356b-052f-4911-babb-447e6ab9c78d Command: start ComputeNode id=f7b8356b-052f-4911-babb-447e6ab9c78d Status: Success Time: 2021-08-23 09:26:06,446 UTC Data: Success
PCA-ADMIN> reset id=f7b8356b-052f-4911-babb-447e6ab9c78d Command: reset id=f7b8356b-052f-4911-babb-447e6ab9c78d Status: Success Time: 2021-08-23 09:27:06,434 UTC Data: Success
PCA-ADMIN> stop ComputeNode id=f7b8356b-052f-4911-babb-447e6ab9c78d Command: stop ComputeNode id=f7b8356b-052f-4911-babb-447e6ab9c78d Status: Success Time: 2021-08-23 09:31:38,271 UTC Data: Success
-
コンピュート・ノードが起動して再実行したら、メンテナンス・ロックおよびプロビジョニング・ロックを解放します。
コンピュート・ノードのプロビジョニング解除
障害のあるノードの交換などのために、コンピュート・ノードを外す必要がある場合は、まずそれをプロビジョニング解除して、そのデータがシステム・データベースからクリーンに削除されるようにする必要があります。
「サービスWeb UI」の使用
-
ナビゲーション・メニューで、「ラック・ユニット」をクリックします。
-
「ラック・ユニット」表で、プロビジョニング解除するコンピュート・ノードのホスト名をクリックします。
コンピュート・ノードの詳細ページが表示されます。
-
ページの右上隅で、「Controls」をクリックし、「プロビジョニング・ロック」コマンドを選択します。
確認ウィンドウが表示されたら、ロックをクリックして続行します。
正常に完了すると、「コンピュート・ノード情報」タブにプロビジョニング・ロック済がはいと表示されます。
-
コンピュート・ノードで実行されているコンピュート・インスタンスがこれ以上ないことを確認します。
Controlsをクリックし、Migrate All Vmsコマンドを選択します。 インスタンスは他のコンピュート・ノードに移行されます。
-
コンピュート・ノードのプロビジョニングを解除するには、制御をクリックし、プロビジョニング解除コマンドを選択します。
確認ウィンドウが表示されたら、Deprovision(プロビジョニング解除)をクリックして続行します。
正常に完了すると、「コンピュート・ノード情報」タブにプロビジョニング状態がプロビジョニング準備完了と表示されます。
「サービスCLI」の使用
-
コンピュート・ノードのリストを表示します。
プロビジョニング解除するコンピュート・ノードのIDをコピーします。
PCA-ADMIN> list ComputeNode Command: list ComputeNode Status: Success Time: 2021-08-20 08:53:56,681 UTC Data: id name provisioningState provisioningType -- ---- ----------------- ---------------- 29f68a0e-4744-4a92-9545-7c48fa365d0a pcacn001 Provisioned KVM 7a0236f4-b00e-461d-93a0-b22673a18d9c pcacn003 Provisioned KVM dc8ae567-b07f-48e0-89bd-e57069c20010 pcacn002 Provisioned KVM
-
コンピュート・ノードにプロビジョニング・ロックを設定します。
PCA-ADMIN> provisioningLock id=7a0236f4-b00e-461d-93a0-b22673a18d9c Command: provisioningLock id=7a0236f4-b00e-461d-93a0-b22673a18d9c Status: Success Time: 2021-08-20 10:30:00,320 UTC JobId: ed4a4646-6d73-41f9-9cb0-73ea35e0d766
ジョブIDを使用して、コマンドのステータスを確認します。
PCA-ADMIN> show Job id=ed4a4646-6d73-41f9-9cb0-73ea35e0d766 [...] Done = true Name = MODIFY_TYPE Run State = Succeeded
-
コンピュート・ノードがプロビジョニング・ロック中であることを確認します。
PCA-ADMIN> show ComputeNode id=7a0236f4-b00e-461d-93a0-b22673a18d9c [...] Provisioning Locked = true
-
プロビジョニング解除するコンピュート・ノードから実行中のすべてのコンピュート・インスタンスを移行します。
PCA-ADMIN> migrateVm id=7a0236f4-b00e-461d-93a0-b22673a18d9c Command: migrateVm id=7a0236f4-b00e-461d-93a0-b22673a18d9c Status: Running Time: 2021-08-20 10:37:05,781 UTC JobId: 6f1e94bc-7d5b-4002-ada9-7d4b504a2599
ジョブIDを使用して、コマンドのステータスを確認します。
PCA-ADMIN> show Job id=6f1e94bc-7d5b-4002-ada9-7d4b504a2599 Command: show Job id=6f1e94bc-7d5b-4002-ada9-7d4b504a2599 Status: Success Time: 2021-08-20 10:39:59,025 UTC Data: [...] Done = true Name = MODIFY_TYPE Run State = Succeeded
-
次のコマンドを使用して、コンピュート・ノードのプロビジョニングを解除します:
PCA-ADMIN> deprovision id=7a0236f4-b00e-461d-93a0-b22673a18d9c Command: deprovision id=7a0236f4-b00e-461d-93a0-b22673a18d9c Status: Success Time: 2021-08-20 11:30:43,793 UTC JobId: 9868fdac-ddb6-4260-9ce1-c018cf2ddc8d
ジョブIDを使用して、プロビジョニング解除コマンドのステータスを確認します。
PCA-ADMIN> show Job id=9868fdac-ddb6-4260-9ce1-c018cf2ddc8d [...] Done = true Name = MODIFY_TYPE Run State = Succeeded
-
コンピュート・ノードがプロビジョニング解除されたことを確認します。
PCA-ADMIN> list ComputeNode Command: list ComputeNode Status: Success Time: 2021-08-20 08:53:56,681 UTC Data: id name provisioningState provisioningType -- ---- ----------------- ---------------- 29f68a0e-4744-4a92-9545-7c48fa365d0a pcacn001 Provisioned KVM 7a0236f4-b00e-461d-93a0-b22673a18d9c pcacn003 Ready to Provision Unspecified dc8ae567-b07f-48e0-89bd-e57069c20010 pcacn002 Provisioned KVM