Guide de l'utilisateur de la fonctionnalité Dynamic Reconfiguration sur le Sun Fire 880

Chapitre 1 Introduction

Ce chapitre présente les principes de la reconfiguration dynamique et les opérations d'enfichage à chaud. En sus, il précise les conditions requises par cette fonctionnalité ainsi que ses limites.

Il se compose comme suit :

Opérations d'enfichage et échange à chaud

Les systèmes Sun Fire 880 supportent les cartes PCI (Peripheral Component Interconnect) enfichables à chaud. Cette propriété vous permet d'ajouter, de retirer ou de changer une carte PCI sur un système sous tension, sans influer en quoi que ce soit sur les autres fonctionnalités de ce système.

L'enfichage à chaud réduit considérablement les temps d'arrêt d'un système associés au remplacement des cartes PCI. Il faut toutefois savoir que toute procédure d'enfichage à chaud nécessite l'exécution de commandes logicielles visant à préparer le système au retrait d'une carte PCI puis à reconfigurer l'environnement d'exploitation après l'installation d'une nouvelle carte.

Les plateaux de ventilateurs et les alimentations des Sun Fire 880 sont en revanche échangeables à chaud. Ceci signifie que vous pouvez à tout moment retirer ou insérer ces composants sans aucune opération préliminaire sur le plan logiciel. Pour plus d'informations sur les composants échangeables à chaud des systèmes, consultez le Sun Fire 880 Server Owner's Guide.


Remarque :

La carte RSC (Remote System Control) du Sun Fire 880 n'est pas un composant enfichable à chaud. Par conséquent, avant d'installer ou de retirer une carte RSC, vous devez mettre le système hors tension et en débrancher tous les cordons d'alimentation.


Opérations d'enfichage à chaud et reconfiguration dynamique

Les opérations d'enfichage à chaud portant sur des cartes PCI utilisent la reconfiguration dynamique (DR). Cette fonctionnalité de l'environnement d'exploitation vous permet de reconfigurer le matériel d'un système pendant son fonctionnement. Plus précisément, utiliser la DR vous permet d'ajouter ou de changer des ressources matérielles sur un système en limitant au minimum, voire en éliminant totalement, l'arrêt des activités normales de ce système.

L'enfichage à chaud d'une carte PCI peut requérir l'exécution de commandes logicielles dont l'objectif est de préparer le système avant le retrait d'un périphérique et de reconfigurer l'environnement d'exploitation après l'installation d'un nouveau périphérique. En sus, certaines conditions doivent être réunies pour que les opérations d'enfichage à chaud réussissent. Pour de plus amples détails, consultez "Conditions requises".

Les procédures d'enfichage à chaud des cartes PCI sont détaillées au Chapitre 2.


Remarque :

Vous pouvez enficher à chaud toute carte PCI conforme à la spécification PCI 2.2 vendue dans le commerce, à condition de disposer d'un gestionnaire logiciel adapté pour l'environnement d'exploitation Solaris et que ce gestionnaire supporte l'enfichage à chaud.


Interfaces utilisateur permettant les opérations d'enfichage à chaud

Trois méthodes permettent de réaliser des opérations d'enfichage à chaud PCI sur les systèmes Sun Fire 880 :

La première utilise les boutons-poussoirs et les diodes électroluminescentes d'état qui se trouvent à proximité de tout emplacement de carte PCI. Ainsi, vous pouvez commencer une opération d'enfichage à chaud en appuyant sur le bouton-poussoir correspondant à l'emplacement concerné. Trois diodes d'état situées à proximité de l'emplacement indiquent la réussite ou l'échec de l'opération.

La deuxième méthode vous permet d'effectuer des opérations d'enfichage à chaud à distance, via une console connectée au système ou une console RSC. Cette méthode utilise la commande Solaris cfgadm(1M) et les diodes situées à proximité des emplacements, qui indiquent où insérer ou retirer la carte concernée.

Enfin, la troisième méthode permettant d'effectuer des opérations DR repose sur le logiciel de gestion et de surveillance de systèmes SunTM Management Center (autrefois appelé Sun Enterprise SyMONTM). Pour plus d'informations, consultez le Guide de l'utilisateur du logiciel Sun Management Center et le Supplément Sun Management Center pour les serveurs de groupes de travail.

Ces trois méthodes se basent sur l'examen des diodes électroluminescentes placées à proximité des divers emplacements PCI. Ces diodes indiquent lorsqu'il est possible de procéder sans risque à l'insertion d'une carte dans un emplacement ou à son retrait, et signalent la réussite ou l'échec de l'opération. Pour plus de détails sur les diodes d'état du Sun Fire 880, consultez "Diodes électroluminescentes des emplacements".


Remarque :

Quelle que soit la méthode adoptée, certaines opérations administratives supplémentaires sont souvent nécessaires pour une opération de retrait à chaud. Avant d'effectuer une telle opération, vous devez en effet vous assurer que les périphériques qui se trouvent sur la carte ne sont pas en cours d'utilisation. Pour identifier les éventuels périphériques en fonctionnement et mettre fin manuellement à leur utilisation, vous pouvez utiliser des commandes Solaris standard telles que mount(1M), umount(1M), swap(1M), ifconfig(1M) et ps(1).


Pour le détail des procédures d'enfichage à chaud de cartes PCI, consultez le Chapitre 2.

Reconfiguration dynamique et logiciel de multipathing

La DR fonctionne conjointement avec - mais n'exige pas - le logiciel de multipathing (on parle aussi de logiciel de chemin alternatif ou de remplacement). Vous pouvez utiliser ce logiciel pour commuter les opérations E/S d'un contrôleur sur un autre contrôleur pour préparer des opérations DR. Associer la DR à ce logiciel vous permet de retirer, de changer ou de désactiver une carte contrôleur PCI sans interrompre le fonctionnement du système. Pour ce faire, vous devez disposer de matériel redondant ; le système doit comporter un contrôleur E/S de remplacement connecté à/aux mêmes périphériques que la carte qui va être retirée ou changée. Ce contrôleur de remplacement doit résider sur une carte PCI différente ou être intégré à la carte mère ou à la carte E/S du système Sun Fire 880. Pour plus d'informations sur le logiciel de multipathing, consultez le Sun Fire 880 Server Owner's Guide.

Conditions requises

Un système doit réunir certaines conditions pour que les opérations DR réussissent. Ces conditions sont résumées ci-après et examinées plus en détail dans les sections qui suivent.

Détachement

Pour qu'une carte PCI puisse être déconnectée avec succès d'un environnement d'exploitation en fonctionnement :

Gestionnaires de périphériques sûr en cas de détachement

Pour qu'une carte PCI puisse être détachée avec succès d'un environnement d'exploitation en fonctionnement, tout périphérique résidant sur cette carte doit avoir un gestionnaire sûr en cas de détachement. Un gestionnaire est dit sûr en cas de détachement quand il est possible de fermer une instance de ce gestionnaire tout en en laissant d'autres ouvertes pour servir des périphériques similaires utilisés ailleurs dans le système. Pour être considéré sûr en cas de détachement, un gestionnaire doit pouvoir effectuer une fonction Device Driver Interface/Device Kernel Interface (DDI/DKI) de base appelée DDI_DETACH. Tout gestionnaire ne supportant pas la fonction DDI_DETACH est dit pas sûr en cas de détachement ("detach-unsafe").

Sun Microsystems propose une sélection de cartes PCI enfichables à chaud qui utilisent des gestionnaires de périphériques sûrs en cas de détachement. Pour obtenir la liste à jour de ces cartes PCI, consultez les Sun Fire 880 Server Product Notes ou contactez votre revendeur Sun habituel.


Remarque :

De nombreux gestionnaires de périphériques de marque tierce (achetés ailleurs que chez Sun Microsystems) ne supportent pas la fonction DDI_DETACH. Sun Microsystems vous conseille donc de tester ces fonctions pendant la sélection ou l'installation d'une carte PCI d'une autre marque avant de l'utiliser dans un environnement de production.


Il est possible de détacher une carte PCI ayant des gestionnaires pas sûrs en cas de détachement mais la procédure à suivre est relativement compliquée. Vous devez :

  1. Mettre fin à l'utilisation des gestionnaires pas sûrs en cas de détachement de la carte.

  2. Mettre fin à l'utilisation des autres périphériques du système qui utilisent aussi ces gestionnaires pas sûrs en cas de détachement.

  3. Fermer manuellement toutes les instances et décharger tous les gestionnaires affectés.

Pour plus d'informations, consultez "Retrait des cartes PCI utilisant des gestionnaires pas sûrs en cas de détachement".

Ressources système vitales

Vous ne pouvez pas détacher de manière dynamique une carte PCI qui contrôle des ressources système vitales à moins que des chemins de remplacement menant à ces ressources ne soient disponibles. Ces chemins de remplacement doivent utiliser une carte PCI différente ou un contrôleur embarqué intégré à la carte mère ou à la carte E/S du système. Avant de détacher la carte, vous devez commuter le contrôle des ressources vitales sur le chemin de remplacement (vous remarquerez qu'il existe des logiciels de multipathing qui effectuent ceci automatiquement). A titre d'exemple, le disque d'initialisation, l'espace de swap et l'interface réseau primaire font partie des ressources vitales d'un système.

Certaines cartes ne peuvent pas être détachées. C'est le cas notamment d'une carte PCI qui contrôle un disque d'initialisation pour lequel aucun chemin de remplacement n'est disponible.

Dans la mesure du possible, il est préférable que l'espace de swap du système soit réparti sur deux disques (ou plus) rattachés à des contrôleurs se trouvant sur des cartes distinctes. Par exemple, une partie de l'espace de swap pourrait être contrôlée par une carte adaptatrice hôte PCI et le reste par le contrôleur embarqué du système. Avec une configuration de ce type, aucune partition de swap prise individuellement ne constitue une ressource vitale du système puisque l'espace de swap est accessible par le biais de plusieurs contrôleurs, et il est possible de configurer de manière dynamique de l'espace de swap supplémentaire au moyen de la commande swap(1M).


Remarque :

Avant de détacher une carte PCI qui contrôle l'espace de swap sur disque, vous devez vous assurer que la mémoire et l'espace disque restants du système sont en mesure de prendre en charge les programmes en cours d'exécution.


Limites de la reconfiguration dynamique

Cartes défectueuses


Attention : Attention :

Insérer une carte défectueuse peut entraîner le blocage du système. N'utilisez que des cartes dont vous savez qu'elles fonctionnent correctement.


Lors de l'enfichage à chaud d'une carte PCI, il est important de garder à l'esprit que toute carte défectueuse nouvellement insérée peut, une fois sous tension, causer des problèmes dans le segment de bus auquel elle est connectée.

Piles de disques FC-AL

Pour les piles de disques Sun StorEdgeTM A5000, la version du microprogramme doit être la ST19171FC 0413 ou une version ultérieure.