L'Agent de gestion de commutation (AGC) est un module de grappe assurant la gestion des canaux de communication au niveau de l'interconnexion privée de la grappe. Il surveille l'interconnexion privée et appelle une procédure de reprise vers un réseau de sauvegarde lorsqu'il détecte une défaillance.
Prenez note des restrictions suivantes avant de débuter la procédure.
Les noeuds SC2000/SS1000 n'acceptent pas plus d'une carte SCI sur une carte système. S'il y en a davantage, il peut se produire des réinitialisations parasites au niveau des liens de l'interconnexion SCI.
Un SBus de noeud E10000 doit comporter d'autres cartes en plus de la carte SCI.
N'installez pas d'adaptateurs SCI et d'autres adaptateurs d'hôte A3000 sur le même SBus d'une configuration Sun StorEdge A3000.
Voir également l'Annexe B dans le Sun Cluster 2.2 Hardware Site Preparation, Planning, and Installation Guide.
Cette procédure permet d'ajouter des commutateurs et des cartes SCI aux noeuds de la grappe. Pour de plus amples renseignements, consultez la page de manuel sm_config(1M).
Modifiez le fichier modèle sm_config pour tenir compte des changements apportés à la configuration.
Ce fichier modèle se trouve habituellement dans le répertoire /opt/SUNWsma/bin/Examples.
Configurez les cartes SCI SBus en exécutant la commande sm_config(1M) à partir d'un noeud de la grappe.
Exécutez une seconde fois la commande pour vous assurer que les ID et les adresses IP des noeuds SCI sont correctement attribuées aux noeuds de la grappe. Toute attribution erronée peut nuire aux communications entre les noeuds.
Réinitialisez les nouveaux noeuds.
Si un problème survient avec le logiciel SCI, vérifiez si les éléments suivants s'appliquent :
Le fichier modèle sm_config(1M) correspond à la configuration matérielle (lien et commutateur SCI) et à la topologie de la grappe.
La commande sm_config(1M) peut être exécutée avec succès à partir d'un noeud de la grappe.
Un noeud reconfiguré a été réinitialisé après l'exécution de la commande sm_config(1M).
Prenez également note des problèmes suivants et de leurs solutions :
Avec certaines applications telles que Oracle Parallel Server (OPS), il est nécessaire de spécifier une quantité minimale de mémoire partagée anormalement élevée dans le fichier /etc/system. Si la valeur du champ shmsys:shminfo_shmmin dans le fichier /etc/system dépasse les 200 octets, la commande sm_config(1M) ne peut pas obtenir sa part de mémoire partagée parce que ses besoins à ce niveau sont inférieurs de quelques octets seulement par rapport à la quantité minimale que le système peut lui allouer. Cela se traduit par un échec de l'appel système effectué par la commande sm_config(1M), et cette commande ne peut être exécutée.
Pour pallier ce problème. modifiez le fichier /etc/system et fixez la valeur de shmsys:shminfo_shmmin à moins de 200 octets. Réinitialisez ensuite l'ordinateur pour qu'il tienne compte des nouvelles valeurs.
Si des avertissements semsys et des vidages d'image mémoire se produisent, vérifiez que les valeurs de sémaphore contenues dans les champs semsys:seminfo_ * du fichier /etc/system correspondent bien aux limites physiques réelles de l'ordinateur.
Pour de plus amples renseignements sur les composants SCI, voir l'Annexe B dans le Sun Cluster 2.2 Hardware Site Preparation, Planning, and Installation Guide.
Deux commandes permettent de vérifier la connectivité entre les noeuds : get_ci_status(1M) et ping(1).
Exécutez la commande get_ci_status(1M) sur tous les noeuds de grappe.
Voici un exemple de données de sortie obtenues avec la commande get_ci_status(1M) :
# /opt/SUNWsma/bin/get_ci_status sma : sci #0 : no_emplacement_sbus 1 ; id_adaptateur 8 (0x08) ; adresse_ip 1 ; id_commutateurd 0 ; id_port 0 ; Etat de l'adaptateur - ACTIF ; Etat du lien - ACTIF sma : sci #1 : no_emplacement_sbus 2 ; id_adaptateur 12 (0x0c) ; adresse _IP 17 ; id_commutateur 1 ; id_port 0 ; Etat de l'adaptateur - ACTIF ; Etat du lien - ACTIF sma : id_commutateur 0sma : id_port 1 : nom_hôte = interconn2 ; id_adaptateur = 72 ; actif | fonctionnel sma : id_port 2 : nom_hôte = interconn3 ; id_adaptateur = 136 ; actif | fonctionnel sma : id_port 3 : nom_hôte = interconn4 ; id_adaptateur = 200 ; actif | fonctionnel sma : id_commutateur 1 sma : id_port 1 : nom_hôte = interconn2 ; id_adaptateur = 76 ; actif | fonctionnel sma : id_port 2 : nom_hôte = interconn3 ; id_adaptateur = 140 ; actif | fonctionnel sma : id_port 3 : nom_hôte = interconn4 ; id_adaptateur = 204 ; actif | fonctionnel # |
Les quatre premières lignes indiquent l'état du noeud logique (interconn1 dans le cas présent). Ce dernier communique avec id_commutateur 0 et id_commutateur 1 (État du lien - ACTIF).
sma : sci #0 : no_emplacement_sbus 1 ; id_adaptateur 8 (0x08) ; adresse_ip 1 ; id_commutateurd 0 ; id_port 0 ; Etat de l'adaptateur - ACTIF ; Etat du lien - ACTIF sma : sci #1 : no_emplacement_sbus 2 ; id_adaptateur 12 (0x0c) ; adresse _IP 17 ; id_commutateur 1 ; id_port 0 ; Etat de l'adaptateur - ACTIF ; Etat du lien - ACTIF |
Les données de sortie restantes indiquent l'état général des autres noeuds de la grappe. Tous les ports des deux commutateurs communiquent avec leurs noeuds respectifs. S'il y a un problème au niveau du matériel, l'état inactif apparaît plutôt que actif. Si le problème se situe au niveau logiciel, l'état non fonctionnel apparaît plutôt que fonctionnel.
sma : id_commutateur 0 sma : id_port 1 : nom_hôte = interconn2 ; id_adaptateur = 72 ; actif | fonctionnel sma : id_port 2 : nom_hôte = interconn3 ; id_adaptateur = 136 ; actif | fonctionnel sma : id_port 3 : nom_hôte = interconn4 ; id_adaptateur = 200 ; actif | fonctionnel sma : id_commutateur 1 sma : id_port 1 : nom_hôte = interconn2 ; id_adaptateur = 76 ; actif | fonctionnel sma : id_port 2 : nom_hôte = interconn3 ; id_adaptateur = 140 ; actif | fonctionnel sma : id_port 3 : nom_hôte = interconn4 ; id_adaptateur = 204 ; actif | fonctionnel # |
Exécutez la commande ping(1) sur toutes les adresses IP des noeuds distants.
Voici un exemple de données de sortie obtenues avec la commande ping(1).
# ping adresse-IP |
Les adresses IP se trouvent dans le fichier /etc/sma.ip. Prenez soin d'exécuter la commande ping(1) sur chaque noeud de la grappe.
La commande ping(1) renvoie le message "en activité", ce qui confirme que les deux extrémités communiquent sans problème. Autrement, un message d'erreur apparaît.
Par exemple,
# ping 204.152.65.2 204.152.65.2 en activité |
Exécutez la commande ifconfig -a pour vérifier si toutes les interfaces SCI sont actives et que les noeuds de grappe possèdent une adresse IP exacte.
Les 8 derniers bits de l'adresse IP doivent correspondre à la valeur du champ IP dans le fichier /etc/sma.config.
# ifconfig -a lo0 : indicateurs=849 <ACTIF,REBOUCLAGE,EN COURS D'EXECUTION,MULTIDESTINATAIRE> mtu 8232 inet 127.0.0.1 masques_réseau ff000000 hme0 : indicateurs=863<ACTIF,DIFFUSION, PAS DE BLOCS DE FIN,EN COURS D'EXECUTION,MULTIDESTINATAIRES> mtu 1500 inet 129.146.238.55 masque_réseau ffffff00 diffusion 129.146.238.255 ether 8:0:20:7b:fa:0 scid0 : indicateurs=80cl<ACTIF,EN COURS D'EXECUTION,PAS D'ARP,PRIVE> mtu 16321 inet 204.152.65.1 masques_réseau fffffff0 scid1 : indicateurs=80cl<ACTIF,EN COURS D'EXECUTION,PAS D'ARP,PRIVE> mtu 16321 inet 204.152.65.17 masques_réseau fffffff0 |