Guide d'administration d'Oracle® VM Server for SPARC 3.3

Quitter la vue de l'impression

Mis à jour : Octobre 2015
 
 

Récupération de domaines après la détection de ressources défectueuses ou manquantes

Si un serveur SPARC T5, un serveur de série SPARC T7, un serveur SPARC M5, un serveur SPARC M6 , un serveur de série SPARC M7 ou un Fujitsu M10 détecte une ressource défectueuse ou manquante à la mise sous tension, le Logical Domains Manager tente de récupérer les domaines configurés à l'aide des ressources disponibles restantes. Lors de la récupération, le système (ou le domaine physique sur les serveurs de série SPARC M5, SPARC M6 et SPARC M7) est considéré comme étant en mode de récupération. Le mode de récupération est activé par défaut. Reportez-vous à Contrôle du mode de récupération.

    A la mise sous tension, le microprogramme du système revient à la configuration usine par défaut si la dernière configuration de mise sous tension sélectionnée ne peut pas être initialisée dans l'une des situations suivantes :

  • La topologie d'E/S au sein de chaque commutateur PCIe dans la configuration ne correspond pas à la topologie d'E/S de la dernière configuration de mise sous tension sélectionnée.

  • Les ressources de CPU ou de mémoire de la dernière configuration de mise sous tension sélectionnée ne sont plus présentes dans le système.

Quand le mode de récupération est activé, Logical Domains Manager récupère tous les domaines actifs et liés à partir de la dernière configuration de mise sous tension sélectionnée. La configuration en cours d'exécution qui en résulte est appelée la configuration dégradée. La configuration dégradée est enregistrée sur le SP et reste la configuration active jusqu'à ce qu'une nouvelle configuration soit enregistrée ou que le domaine physique soit soumis à un cycle d'alimentation.


Remarque - Le domaine physique n'a pas besoin d'un cycle d'alimentation pour activer la configuration dégradée après la récupération, puisque la configuration dégradée est déjà en cours d'exécution.

Si le domaine physique est soumis à un cycle d'alimentation, le microprogramme du système tente d'abord d'initialiser la dernière configuration de mise sous tension d'origine. De cette manière, si le ou les disques manquants ou défectueux ont été remplacés dans l'intervalle, le système peut initialiser la configuration normale d'origine. Si la dernière configuration de mise sous tension sélectionnée ne peut pas être initialisée, le microprogramme tente d'initialiser la configuration dégradée associée, si elle existe. Si la configuration dégradée ne peut pas être initialisée ou n'existe pas, la configuration d'usine par défaut est initialisée et le mode de récupération est appelé.

    L'opération de récupération se déroule dans l'ordre suivant 

  • Domaine de contrôle. Logical Domains Manager récupère le domaine de contrôle en restaurant sa CPU, sa mémoire et la configuration d'E/S ainsi que ses services d'E/S virtuels.

    Si la quantité de CPU ou de mémoire requise pour tous les domaines récupérables est supérieure aux ressources restantes, le nombre de CPU, de coeurs ou de mémoires est réduit proportionnellement à la taille des autres domaines. Par exemple, dans un système à quatre domaines sur lequel 25 % des CPU et de la mémoire est assigné à chaque domaine, la configuration dégradée qui en découle continue d'assigner 25 % des CPU et de la mémoire à chaque domaine. Si le domaine primary possédait à l'origine jusqu'à deux coeurs (16 CPU virtuelles) et huit Go de mémoire, la taille du domaine de contrôle n'est pas réduite.

    Les complexes root et les périphériques PCIe assignés à d'autres domaines sont supprimés du domaine de contrôle. Les fonctions virtuelles sur des complexes root détenus par le domaine de contrôle sont recréées. Tout complexe root, périphérique PCIe, fonction physique ou fonction virtuelle manquant assigné au domaine de contrôle est marqué comme évacué. Logical Domains Manager réinitialise ensuite le domaine de contrôle pour appliquer les modifications.

  • Domaines root. Après la réinitialisation du domaine de contrôle, Logical Domains Manager récupère les domaines root. La quantité de CPU et de mémoire est réduite proportionnellement aux autres domaines récupérables, le cas échéant. Si un complexe root n'est plus présent physiquement sur le système, il est marqué comme évacué. Ce complexe root n'est pas configuré dans le domaine pendant l'opération de récupération. Un domaine root est récupéré tant qu'au moins un des complexes root assignés au domaine root est disponible. Si aucun de ses complexes root n'est disponible, le domaine root n'est pas récupéré. Logical Domains Manager initialise le domaine root et recrée les fonctions virtuelles sur les fonctions physiques détenues par le domaine root. Il retire également les emplacements PCIe prêtés par le domaine root. Tous les emplacements PCIe, fonctions physiques et fonctions virtuelles manquants sont marqués comme évacués. Dans la mesure du possible, tous les services d'E/S virtuels fournis par le domaine sont recréés.

  • Domaines d'E/S. Logical Domains Manager récupère tout domaine d'E/S. Tous les emplacements PCIe et les fonctions virtuelles manquants sur le système sont marqués comme évacués. Si aucun des périphériques d'E/S requis n'est présent, le domaine n'est pas récupéré et ses ressources CPU et de mémoire sont disponibles pour une utilisation par d'autres domaines. Dans la mesure du possible, tous les services d'E/S virtuels fournis par le domaine sont recréés.

  • Domaines invités. Un domaine invité est uniquement récupéré si au moins un des domaines de service qui le servent a été récupéré. Si le domaine invité ne peut pas être récupéré, ses ressources de CPU et de mémoire sont disponibles pour une utilisation par d'autres domaines invités.

Dans la mesure du possible, le système alloue à un domaine le même nombre de CPU et la même quantité de mémoire que dans la configuration d'origine. Si le nombre de CPU ou la quantité de mémoire disponibles sont insuffisants, ces ressources sont réduites proportionnellement pour consommer les ressources disponibles restantes.


Remarque - Lorsqu'un système est en mode récupération, vous pouvez uniquement exécuter les commandes ldm list-*. Toutes les autres commandes ldm sont désactivées jusqu'à la fin de l'opération de récupération.

Logical Domains Manager tente uniquement de récupérer les domaines liés et actifs. La configuration des ressources existante de tout domaine non lié est copiée en l'état dans la nouvelle configuration.

Au cours d'une opération de récupération, il est possible que la quantité de ressources disponibles soit inférieure à la précédente configuration initialisée. De ce fait, il est possible que Logical Domains Manager ne puisse récupérer que certains des domaines précédemment configurés. D'autre part, un domaine récupéré peut ne pas disposer de toutes les ressources dont il disposait dans la configuration d'origine. Par exemple, un domaine lié récupéré peut présenter moins de ressources d'E/S qu'il n'en avait dans la configuration précédente. Un domaine risque de ne pas être récupéré si ses périphériques d'E/S sont absents ou si son domaine de service parent n'a pas pu être récupéré.

Le mode de récupération consigne les étapes de sa réalisation dans le journal SMF Logical Domains Manager, /var/svc/log/ldoms-ldmd:default.log. Un message est écrit sur la console système lorsque Logical Domains Manager démarre une récupération, réinitialise le domaine de contrôle et à l'issue de la récupération.


Caution

Mise en garde  - Il n'est pas garanti qu'un domaine récupéré soit parfaitement opérationnel. Le domaine risque de ne pas inclure une ressource essentielle à l'exécution de l'instance du système d'exploitation ou d'une application. Par exemple, un domaine récupéré peut ne disposer que d'une ressource réseau et d'aucune ressource de disque. Ou un système de fichiers nécessaire à l'exécution d'une application peut manquer dans un domaine récupéré. L'utilisation d'E/S à chemins d'accès multiples pour un domaine limite les conséquences de l'absence de certaines ressources d'E/S.


Configuration matérielle et logicielle requise pour le mode de récupération

  • Configuration matérielle - La fonctionnalité de mode de récupération est prise en charge sur le serveur SPARC T5, le serveur de série SPARC T7, le serveur SPARC M5, le serveur SPARC M6, le serveur de série SPARC M7 et le Serveur Fujitsu M10.

  • Configuration du microprogramme – Au minimum la version 9.1.0.a du microprogramme système pour les serveurs SPARC T5, SPARC M5 et SPARC M6. Au minimum la version 9.4.3 du microprogramme système pour les serveurs de série SPARC T7 et SPARC M7. Au minimum la version XCP2230 du microprogramme système pour le Serveur Fujitsu M10.

  • Configuration logicielle – Les domaines root non-primary qui prêtent des emplacements PCIe doivent exécuter au moins le SE Oracle Solaris 10 1/13 ou le SE Oracle Solaris 11.2.

Configuration dégradée

Chaque domaine physique ne peut disposer que d'une seule configuration dégradée enregistrée sur le SP. S'il existe déjà une configuration dégradée, elle est remplacée par la dernière configuration dégradée créée.

Vous ne pouvez pas interagir directement avec les configurations dégradées. Si nécessaire, le microprogramme du système initialise de manière transparente la version dégradée de la prochaine configuration de mise sous tension. Cette transparence permet au système d'initialiser la configuration d'origine après un cycle d'alimentation lorsque les ressources manquantes réapparaissent. Lorsque la configuration active est une configuration dégradée, elle est marquée indiquée comme [degraded] dans la sortie ldm list-spconfig.

La fonctionnalité d'enregistrement automatique est désactivée lorsque la configuration active est une configuration dégradée. Si vous enregistrez une nouvelle configuration sur le SP alors qu'une configuration dégradée est active, la nouvelle configuration est une configuration non dégradée normale.


Remarque - Une ressource précédemment manquante qui réapparaît après un cycle d'alimentation ultérieur n'a pas d'effet sur le contenu d'une configuration normale. Toutefois, si vous sélectionnez par la suite la configuration qui a déclenché le mode de récupération, le SP initialise la configuration non dégradée d'origine, puisque l'ensemble de son matériel est à présent disponible.

Contrôle du mode de récupération

La propriété SMF ldmd/recovery_mode contrôle le comportement du mode de récupération. Le mode de récupération est activé par défaut.

Si la propriété ldmd/recovery_mode n'est pas présente ou est définie sur auto, le mode de récupération est activé.

Lorsque la propriété ldmd/recovery_mode est définie sur never, Logical Domains Manager sort du mode de récupération sans effectuer d'action et le domaine physique exécute la configuration d'usine par défaut.


Remarque - Si le microprogramme du système demande le mode de récupération lorsque celui-ci n'est pas activé, exécutez les commandes suivantes pour activer le mode de récupération à la demande :
primary# svccfg -s ldmd setprop ldmd/recovery_mode = astring: auto
primary# svcadm refresh ldmd
primary# svcadm restart ldmd

Le mode de récupération est uniquement initié immédiatement dans ce scénario si vous n'avez apporté aucune modification au système, c'est-à-dire s'il dispose toujours de la configuration d'usine par défaut.


En outre, pour activer le mode de récupération, vous pouvez spécifier une valeur de délai d'attente pour l'initialisation d'un domaine root lors de la récupération. Par défaut, la valeur de la propriété ldmd/recovery_mode_boot_timeout est de 30 minutes. Les valeurs valides commencent à 5 minutes.