Opérations de maintenance de noeud de calcul
Pour les opérations de maintenance, y compris la mise à niveau ou l'application de patches du logiciel Private Cloud Appliance, et lorsque la réparation matérielle est nécessaire, les noeuds de calcul doivent être placés en mode de maintenance. Cela nécessite l'évacuation des instances de calcul en cours d'exécution et le verrouillage du noeud des autres opérations système.
Evacuation d'un noeud de calcul
Certaines opérations de noeud de calcul ne peuvent être effectuées que si le noeud de calcul n'a aucune instance de calcul en cours d'exécution. Les administrateurs peuvent migrer toutes les instances en cours d'exécution hors d'un noeud de calcul, également appelé évacuation du noeud de calcul.
Par défaut, si suffisamment de ressources sont disponibles, les instances en cours d'exécution sont migrées en direct vers d'autres noeuds de calcul du même domaine de pannes.
Avant d'effectuer une évacuation de noeud de calcul, vérifiez le comportement des instances qui ne peuvent pas être migrées en direct vers un autre noeud de calcul dans le même domaine de pannes.
Cette rubrique et Configuration haute disponibilité pour les instances de calcul expliquent comment vérifier les paramètres et comment les instances sont gérées pour différents paramètres.
La migration en direct entre différents types de noeud de calcul n'est pas prise en charge. Par exemple, vous ne pouvez pas migrer des instances de calcul d'un serveur Oracle X10 vers un serveur Oracle X11.
Vérifiez si l'application stricte du domaine de pannes est définie.
-
Lorsque l'application stricte du domaine de pannes est désactivée (la définition stricte du domaine de pannes est désactivée dans l'interface utilisateur Web de service ou
Strict FD Enabledestfalsedans l'interface de ligne de commande de service), les instances qui ne peuvent pas être migrées en direct vers un autre noeud de calcul du même domaine de pannes sont migrées en direct vers un autre domaine de pannes si suffisamment de ressources sont disponibles dans ce domaine de pannes. -
Lorsque l'application stricte du domaine de pannes est activée (la fonction FD stricte est activée dans l'interface utilisateur Web de service ou
Strict FD Enabledesttruedans l'interface de ligne de commande de service), les instances qui ne peuvent pas être migrées en direct vers un autre noeud de calcul du même domaine de pannes ne migrent pas ; ces instances sont toujours en cours d'exécution sur le noeud de calcul à évacuer.
Activez ou désactivez l'application stricte du domaine de pannes pour indiquer si les instances qui ne peuvent pas migrer en direct vers d'autres noeuds de calcul du même domaine de pannes seront migrées en direct vers un autre domaine de pannes ou si elles sont toujours en cours d'exécution sur le même noeud de calcul après avoir tenté d'évacuer le noeud de calcul.
Si certaines instances ne peuvent pas être migrées en direct, soit parce que le domaine de pannes en cours n'est pas en mesure de les prendre en charge et que l'application stricte du domaine de pannes est activée, soit parce que l'application stricte du domaine de pannes est désactivée mais que d'autres domaines de pannes ne peuvent pas non plus prendre en charge les instances, vous pouvez réexécuter l'opération de migration avec l'option Forcer spécifiée. Lorsque l'option Forcer est spécifiée, le service Compute arrête toutes les instances qui ne parviennent pas à migrer en direct, ce qui permet à l'évacuation de continuer.
Redémarrez les instances arrêtées. Si des instances ont été arrêtées par le service Compute (et non manuellement arrêtées par un administrateur) et que vous voulez qu'elles soient automatiquement restaurées en cours d'exécution lorsque les ressources deviennent disponibles, vérifiez que la propriété de récupération automatique du service Compute est activée et que l'action de récupération de la disponibilité de l'instance est définie sur RESTORE_INSTANCE. Reportez-vous à Visualisation et définition de la configuration du service Compute et à Configuration de l'état de récupération pour une instance arrêtée.
Les instances peuvent être arrêtées par le service Compute si l'option Forcer est utilisée lorsqu'un administrateur évacue un noeud de calcul ou en réponse à une panne de noeud de calcul non planifiée. Vous pouvez modifier le paramètre de récupération automatique à tout moment avant ou après la mise à disposition des ressources après une maintenance administrative ou une interruption non planifiée pour redémarrer les instances arrêtées par le service Compute. Si l'action de récupération de la disponibilité de l'instance est définie sur STOP_INSTANCE, l'instance reste arrêtée même si la propriété de récupération automatique est activée. Si l'action de récupération de la disponibilité de l'instance est ensuite remplacée par RESTORE_INSTANCE, un passe de récupération automatique ultérieur redémarre l'instance.
Renvoyer les instances déplacées. Si les instances sont migrées en direct vers un autre domaine de pannes (déplacé) et que vous souhaitez qu'elles soient renvoyées au domaine de pannes sélectionné (le domaine de pannes indiqué dans la configuration de l'instance) lorsque les ressources deviennent disponibles, vérifiez que la propriété de résolution automatique du service Compute est activée. Reportez-vous à Affichage et définition de la configuration du service Compute et à Commandes de configuration du service Compute. Vous pouvez définir la propriété de résolution automatique à tout moment avant ou après la fin de l'évacuation du noeud de calcul pour déplacer les instances déplacées.
Suivez les procédures ci-après pour effectuer l'opération de migration.
- Evacuation du noeud de calcul : avant de commencer
-
-
Vérifiez les ressources de domaine de pannes et de noeud de calcul. Reportez-vous à admin-monitor-capacity.htm. Sur la base de ces informations, décidez si vous devez effectuer l'une des opérations suivantes :
-
Mettez fin aux instances qui ne sont plus nécessaires.
-
Reconfigurez certaines instances pour qu'elles utilisent moins de ressources. Par exemple, indiquez une forme différente.
-
Reconfigurez certaines instances pour indiquer un autre domaine de pannes.
-
Arrêtez certaines instances pendant l'évacuation du noeud de calcul.
-
Arrêtez les instances non migrables. Voir l'étape suivante.
-
Indiquez l'option Forcer sur l'opération de migration pour arrêter temporairement toutes les instances qui ne peuvent pas être migrées en direct. Reportez-vous à la discussion ci-dessus sur l'action de récupération de disponibilité d'instance et la configuration de la récupération automatique.
-
-
Bien qu'il soit possible d'indiquer l'option
forcesur l'opérationvmMigratepour arrêter temporairement toutes les instances qui ne peuvent pas être migrées en direct, il est recommandé d'arrêter progressivement les instances non migrables avant la migration afin que toutes les charges globales en cours d'exécution sur l'instance soient en bon état.-
Affichez la liste des instances non migrables.
Copiez l'ID des instances en cours d'exécution afin de pouvoir les arrêter.
PCA-ADMIN> getNonMigratableInstances Data: id Display Name Compute Node Id Domain State -- ------------ --------------- ------------ ocid1.instance.unique_ID instance202 CN_ID running ocid1.instance.unique_ID kqh027 CN_ID shut off -
Arrêtez les instances en cours.
Reportez-vous à Arrêt, démarrage et réinitialisation d'une instance.
-
-
Désactivez le provisionnement sur le noeud de calcul.
Reportez-vous à Désactivation du provisionnement de noeud de calcul.
-
- Utiliser l'interface utilisateur Web de service
-
-
Dans le menu de navigation, cliquez sur Unités de rack.
-
Dans le tableau Rack Units, recherchez le nom d'hôte du noeud de calcul à évacuer. Cliquez sur le menu Actions de cet hôte, puis sur l'option Migrate All Vms.
Dans le tableau Rack Units, vous pouvez également cliquer sur le nom d'hôte du noeud de calcul à évacuer pour afficher la page de détails de ce noeud de calcul. Cliquez sur le menu Controls, puis sur l'option Migrate All Vms.
-
Dans la boîte de dialogue Confirmer la migration des machines virtuelles, indiquez si vous souhaitez forcer l'arrêt des instances qui ne peuvent pas être migrées.
Par défaut, l'option Forcer l'arrêt n'est pas activée et les instances qui ne peuvent pas être migrées sont toujours en cours d'exécution sur le noeud une fois l'opération de migration terminée. Pour forcer l'arrêt des instances qui ne peuvent pas être migrées, activez l'option Forcer l'arrêt dans la boîte de dialogue Confirmer la migration des machines virtuelles.
-
Dans la boîte de dialogue Confirmer la migration des machines virtuelles, cliquez sur le bouton Migrer.
Le service Compute en direct migre les instances en cours d'exécution vers d'autres noeuds de calcul si suffisamment de ressources sont disponibles et que les paramètres de haute disponibilité sont configurés pour l'autoriser. Si l'option Forcer a été spécifiée, toutes les instances qui n'ont pas pu être migrées sont arrêtées temporairement. Si aucune instance n'a pu être migrée et que Forcer n'a pas été spécifié, ces instances restent en cours d'exécution sur le noeud de calcul que vous tentez d'évacuer.
-
- Utilisation de la CLI de service
-
-
Affichez la liste des noeuds de calcul.
Copiez l'ID du noeud de calcul que vous souhaitez évacuer.
PCA-ADMIN> list ComputeNode Data: id name provisioningState provisioningType -- ---- ----------------- ---------------- 3e62bf25-a26c-407e-ab8b-df01a4ad98b6 pcacn002 Provisioned KVM f7b8356b-052f-4911-babb-447e6ab9c78d pcacn003 Provisioned KVM 4e06ebdf-faed-484e-996d-d77af786f123 pcacn001 Provisioned KVM -
Utilisez la commande
migrateVmpour migrer en direct toutes les instances de calcul en cours d'exécution hors du noeud de calcul. Pour arrêter temporairement les instances qui ne parviennent pas à migrer, définissez l'optionforce:PCA-ADMIN> migrateVm id=7a0236f4-b00e-461d-93a0-b22673a18d9c force=true JobId: 6f1e94bc-7d5b-4002-ada9-7d4b504a2599Le service Compute en direct migre les instances en cours d'exécution vers d'autres noeuds de calcul si suffisamment de ressources sont disponibles et que les paramètres de haute disponibilité sont configurés pour l'autoriser. Si
force=truea été spécifié, toutes les instances qui n'ont pas pu être migrées sont arrêtées temporairement. Si aucune instance n'a pu être migrée et queforce=truen'a pas été indiqué, ces instances restent en cours d'exécution sur le noeud de calcul que vous tentez d'évacuer.Utilisez l'ID de travail pour vérifier le statut de la commande
migrateVm.PCA-ADMIN> show Job id=6f1e94bc-7d5b-4002-ada9-7d4b504a2599 [...] Done = true Name = MODIFY_TYPE Run State = Succeeded
-
Désactivation du provisionnement de noeud de calcul
Plusieurs opérations de noeud de calcul ne peuvent être effectuées que si le provisionnement a été désactivé. Suivez ces instructions pour imposer et libérer un verrou de provisionnement.
- Utiliser l'interface utilisateur Web de service
-
-
Dans le menu de navigation, cliquez sur Unités de rack.
-
Dans le tableau Rack Units, cliquez sur le nom d'hôte du noeud de calcul auquel vous souhaitez apporter des modifications.
La page de détails du noeud de calcul apparaît.
-
Dans l'angle supérieur droit de la page, cliquez sur Contrôles et sélectionnez la commande Verrouillage du provisionnement.
Lorsque la fenêtre de confirmation apparaît, cliquez sur Lock pour continuer.
Une fois l'opération terminée, l'onglet Informations sur le noeud de calcul indique Provisionnement verrouillé = Oui.
-
Pour libérer le verrou de provisionnement, cliquez sur Contrôles et sélectionnez la commande Provisioning Unlock.
Lorsque la fenêtre de confirmation apparaît, cliquez sur Déverrouiller pour continuer.
Une fois l'opération terminée, l'onglet Informations sur le noeud de calcul indique Provisionnement verrouillé = Non.
-
- Utilisation de la CLI de service
-
-
Affichez la liste des noeuds de calcul.
Copiez l'ID du noeud de calcul pour lequel vous souhaitez désactiver les opérations de provisionnement.
PCA-ADMIN> list ComputeNode Data: id name provisioningState provisioningType -- ---- ----------------- ---------------- 3e62bf25-a26c-407e-ab8b-df01a4ad98b6 pcacn002 Provisioned KVM f7b8356b-052f-4911-babb-447e6ab9c78d pcacn003 Provisioned KVM 4e06ebdf-faed-484e-996d-d77af786f123 pcacn001 Provisioned KVM -
Définissez un verrou de provisionnement sur le noeud de calcul.
PCA-ADMIN> provisioningLock id=f7b8356b-052f-4911-babb-447e6ab9c78d JobId: 6ee78c8a-e227-4d31-a770-9b9c96085f3fUtilisez l'ID de travail pour vérifier le statut de votre commande.
PCA-ADMIN> show Job id=6ee78c8a-e227-4d31-a770-9b9c96085f3f [...] Done = true Name = MODIFY_TYPE Run State = Succeeded -
Une fois le travail terminé, vérifiez que le noeud de calcul est en cours de provisionnement.
PCA-ADMIN> show ComputeNode id=f7b8356b-052f-4911-babb-447e6ab9c78d [...] Provisioning State = Provisioned [...] Provisioning Locked = true Maintenance Locked = falseToutes les opérations de provisionnement sont maintenant désactivées jusqu'à ce que le verrou soit libéré.
-
Pour libérer le verrou de provisionnement, utilisez la commande suivante :
PCA-ADMIN> provisioningUnlock id=f7b8356b-052f-4911-babb-447e6ab9c78d JobId: 523892e8-c2d4-403c-9620-2f3e94015b46Utilisez l'ID de travail pour vérifier le statut de votre commande.
PCA-ADMIN> show Job id=523892e8-c2d4-403c-9620-2f3e94015b46 [...] Done = true Name = MODIFY_TYPE Run State = Succeeded -
Une fois le travail terminé, vérifiez que le verrou de provisionnement a été libéré.
PCA-ADMIN> show ComputeNode id=f7b8356b-052f-4911-babb-447e6ab9c78d [...] Provisioning State = Provisioned [...] Provisioning Locked = false Maintenance Locked = false
-
Verrouillage d'un noeud de calcul à des fins de maintenance
Pour les opérations de maintenance, les noeuds de calcul doivent être placés en mode maintenance. Suivez ces instructions pour imposer et libérer un verrou de maintenance. Pour pouvoir verrouiller un noeud de calcul à des fins de maintenance, vous devez d'abord désactiver le provisionnement. Les opérations de maintenance ne peuvent être effectuées que si le noeud de calcul n'a aucune instance de calcul en cours d'exécution.
En fonction de la configuration haute disponibilité du service Compute, les migrations automatiques d'instance peuvent vous empêcher de verrouiller un noeud de calcul. Reportez-vous à Configuration haute disponibilité pour les instances Compute. Cette situation est plus susceptible de se produire lorsque la capacité de calcul disponible est limitée.
-
Les opérations de récupération ou de migration d'instance après une coupure de noeud de calcul peuvent entraîner l'échec d'un verrou de maintenance. Les noeuds de calcul impliqués dans les migrations d'instance rejetteront le verrou de maintenance jusqu'à ce que les migrations soient terminées.
-
Les instances déplacées peuvent être migrées vers leur domaine de pannes d'origine lorsqu'un verrou de maintenance de noeud de calcul est libéré. Un noeud de calcul à partir duquel une instance déplacée est renvoyée rejette le verrou de maintenance jusqu'à ce que la migration soit terminée.
-
La migration d'une instance ne prend généralement pas plus de 30 secondes. Cependant, les instances volumineuses et les charges de travail lourdes augmentent le temps nécessaire.
-
Si une instance est bloquée à l'état mobile et que la migration échoue, son noeud de calcul hôte ne peut pas être verrouillé pour maintenance. Contactez Oracle pour obtenir de l'aide.
- Utiliser l'interface utilisateur Web de service
-
-
Assurez-vous que le provisionnement a été désactivé sur le noeud de calcul.
-
Assurez-vous que le noeud de calcul n'a pas d'instances actives. Ils doivent être migrés ou arrêtés.
-
Dans le menu de navigation, cliquez sur Unités de rack.
-
Dans le tableau Rack Units, cliquez sur le nom d'hôte du noeud de calcul nécessitant une maintenance.
La page de détails du noeud de calcul apparaît.
-
Dans l'angle supérieur droit de la page, cliquez sur Contrôles et sélectionnez la commande Maintenance Lock.
Lorsque la fenêtre de confirmation apparaît, cliquez sur Lock pour continuer.
Une fois l'opération terminée, l'onglet Informations sur le noeud de calcul affiche Maintenance verrouillée = Oui.
-
Pour déverrouiller la maintenance, cliquez sur Contrôles et sélectionnez la commande Maintenance Unlock.
Lorsque la fenêtre de confirmation apparaît, cliquez sur Déverrouiller pour continuer.
Une fois l'opération terminée, l'onglet Informations sur le noeud de calcul affiche Maintenance verrouillée = Non.
-
- Utilisation de la CLI de service
-
-
Affichez la liste des noeuds de calcul.
Copiez l'ID du noeud de calcul nécessitant une maintenance.
PCA-ADMIN> list ComputeNode Data: id name provisioningState provisioningType -- ---- ----------------- ---------------- 3e62bf25-a26c-407e-ab8b-df01a4ad98b6 pcacn002 Provisioned KVM f7b8356b-052f-4911-babb-447e6ab9c78d pcacn003 Provisioned KVM 4e06ebdf-faed-484e-996d-d77af786f123 pcacn001 Provisioned KVM -
Assurez-vous que le provisionnement a été désactivé sur le noeud de calcul.
-
Verrouillez le noeud de calcul pour maintenance.
PCA-ADMIN> maintenanceLock id=f7b8356b-052f-4911-babb-447e6ab9c78d JobId: e46f6603-2af2-4df4-a0db-b15156491f88Utilisez l'ID de travail pour vérifier le statut de votre commande.
PCA-ADMIN> show Job id=e46f6603-2af2-4df4-a0db-b15156491f88 [...] Done = true Name = MODIFY_TYPE Run State = Succeeded -
Une fois le travail terminé, vérifiez que le noeud de calcul a été verrouillé pour maintenance.
PCA-ADMIN> show ComputeNode id=f7b8356b-052f-4911-babb-447e6ab9c78d [...] Provisioning State = Provisioned [...] Provisioning Locked = true Maintenance Locked = trueLe noeud de calcul est maintenant prêt pour la maintenance.
-
Pour libérer le verrou de maintenance, utilisez la commande suivante :
PCA-ADMIN> maintenanceUnlock id=f7b8356b-052f-4911-babb-447e6ab9c78d JobId: 625af20e-4b49-4201-879f-41d4405314c7Utilisez l'ID de travail pour vérifier le statut de votre commande.
PCA-ADMIN> show Job id=625af20e-4b49-4201-879f-41d4405314c7 [...] Done = true Name = MODIFY_TYPE Run State = Succeeded -
Une fois le travail terminé, vérifiez que le verrou de provisionnement a été libéré.
PCA-ADMIN> show ComputeNode id=f7b8356b-052f-4911-babb-447e6ab9c78d [...] Provisioning State = Provisioned [...] Provisioning Locked = true Maintenance Locked = false
-