Guide d'administration du systéme de Sun Cluster 2.2

Administration de l'Agent de gestion de commutation

L'Agent de gestion de commutation (AGC) est un module de grappe assurant la gestion des canaux de communication au niveau de l'interconnexion privée de la grappe. Il surveille l'interconnexion privée et appelle une procédure de reprise vers un réseau de sauvegarde lorsqu'il détecte une défaillance.

Prenez note des restrictions suivantes avant de débuter la procédure.

Voir également l'Annexe B dans le Sun Cluster 2.2 Hardware Site Preparation, Planning, and Installation Guide.

Comment ajouter des commutateurs et des cartes SCI

Cette procédure permet d'ajouter des commutateurs et des cartes SCI aux noeuds de la grappe. Pour de plus amples renseignements, consultez la page de manuel sm_config(1M).

  1. Modifiez le fichier modèle sm_config pour tenir compte des changements apportés à la configuration.

    Ce fichier modèle se trouve habituellement dans le répertoire /opt/SUNWsma/bin/Examples.

  2. Configurez les cartes SCI SBus en exécutant la commande sm_config(1M) à partir d'un noeud de la grappe.

    Exécutez une seconde fois la commande pour vous assurer que les ID et les adresses IP des noeuds SCI sont correctement attribuées aux noeuds de la grappe. Toute attribution erronée peut nuire aux communications entre les noeuds.

  3. Réinitialisez les nouveaux noeuds.

Dépannage du logiciel SCI

Si un problème survient avec le logiciel SCI, vérifiez si les éléments suivants s'appliquent :

Prenez également note des problèmes suivants et de leurs solutions :

Pour pallier ce problème. modifiez le fichier /etc/system et fixez la valeur de shmsys:shminfo_shmmin à moins de 200 octets. Réinitialisez ensuite l'ordinateur pour qu'il tienne compte des nouvelles valeurs.

Pour de plus amples renseignements sur les composants SCI, voir l'Annexe B dans le Sun Cluster 2.2 Hardware Site Preparation, Planning, and Installation Guide.

Comment vérifier la connectivité entre les noeuds

Deux commandes permettent de vérifier la connectivité entre les noeuds : get_ci_status(1M) et ping(1).

  1. Exécutez la commande get_ci_status(1M) sur tous les noeuds de grappe.

    Voici un exemple de données de sortie obtenues avec la commande get_ci_status(1M) :


    # /opt/SUNWsma/bin/get_ci_status
    sma : sci #0 : no_emplacement_sbus 1 ; id_adaptateur 8 (0x08) ; 
    adresse_ip 1 ; id_commutateurd 0 ; id_port 0 ; 
        Etat de l'adaptateur - ACTIF ; Etat du lien - ACTIF
    sma : sci #1 : no_emplacement_sbus 2 ; id_adaptateur 12 (0x0c) ; 
    adresse _IP 17 ; id_commutateur 1 ; id_port 0 ; 
        Etat de l'adaptateur - ACTIF ; Etat du lien - ACTIF
    sma : id_commutateur 0sma : id_port 1 : nom_hôte = interconn2 ; 
    id_adaptateur = 72 ; actif | fonctionnel
    sma : id_port 2 : nom_hôte = interconn3 ; id_adaptateur = 136 ; 
    actif | fonctionnel
    sma : id_port 3 : nom_hôte = interconn4 ; id_adaptateur = 200 ; actif | fonctionnel
    sma : id_commutateur 1
    sma : id_port 1 : nom_hôte = interconn2 ; id_adaptateur = 76 ; actif | fonctionnel
    sma : id_port 2 : nom_hôte = interconn3 ; id_adaptateur = 140 ; actif | fonctionnel
    sma : id_port 3 : nom_hôte = interconn4 ; id_adaptateur = 204 ; actif | fonctionnel 
    # 

    Les quatre premières lignes indiquent l'état du noeud logique (interconn1 dans le cas présent). Ce dernier communique avec id_commutateur 0 et id_commutateur 1 (État du lien - ACTIF).


    sma : sci #0 : no_emplacement_sbus 1 ; id_adaptateur 8 (0x08) ; adresse_ip 1 ; 
    id_commutateurd 0 ; id_port 0 ; 
        Etat de l'adaptateur - ACTIF ; Etat du lien - ACTIF
    sma : sci #1 : no_emplacement_sbus 2 ; id_adaptateur 12 (0x0c) ; adresse _IP 17 ; 
    id_commutateur 1 ; id_port 0 ; 
        Etat de l'adaptateur - ACTIF ; Etat du lien - ACTIF

    Les données de sortie restantes indiquent l'état général des autres noeuds de la grappe. Tous les ports des deux commutateurs communiquent avec leurs noeuds respectifs. S'il y a un problème au niveau du matériel, l'état inactif apparaît plutôt que actif. Si le problème se situe au niveau logiciel, l'état non fonctionnel apparaît plutôt que fonctionnel.


    sma : id_commutateur 0
    sma : id_port 1 : nom_hôte = interconn2 ; id_adaptateur = 72 ; actif | fonctionnel
    sma : id_port 2 : nom_hôte = interconn3 ; id_adaptateur = 136 ; actif | fonctionnel
    sma : id_port 3 : nom_hôte = interconn4 ; id_adaptateur = 200 ; actif | fonctionnel
    sma : id_commutateur 1
    sma : id_port 1 : nom_hôte = interconn2 ; id_adaptateur = 76 ; actif | fonctionnel
    sma : id_port 2 : nom_hôte = interconn3 ; id_adaptateur = 140 ; actif | fonctionnel
    sma : id_port 3 : nom_hôte = interconn4 ; id_adaptateur = 204 ; actif | fonctionnel 
    #

  1. Exécutez la commande ping(1) sur toutes les adresses IP des noeuds distants.

    Voici un exemple de données de sortie obtenues avec la commande ping(1).


    # ping adresse-IP
    

    Les adresses IP se trouvent dans le fichier /etc/sma.ip. Prenez soin d'exécuter la commande ping(1) sur chaque noeud de la grappe.

    La commande ping(1) renvoie le message "en activité", ce qui confirme que les deux extrémités communiquent sans problème. Autrement, un message d'erreur apparaît.

    Par exemple,


    # ping 204.152.65.2
    204.152.65.2 en activité

Comment vérifier la configuration des interfaces SCI
  1. Exécutez la commande ifconfig -a pour vérifier si toutes les interfaces SCI sont actives et que les noeuds de grappe possèdent une adresse IP exacte.

    Les 8 derniers bits de l'adresse IP doivent correspondre à la valeur du champ IP dans le fichier /etc/sma.config.


    # ifconfig -a
    lo0 : indicateurs=849 <ACTIF,REBOUCLAGE,EN COURS D'EXECUTION,MULTIDESTINATAIRE> mtu 8232 
     inet 127.0.0.1 masques_réseau ff000000
    hme0 : indicateurs=863<ACTIF,DIFFUSION, 
    PAS DE BLOCS DE FIN,EN COURS D'EXECUTION,MULTIDESTINATAIRES> mtu 1500 
     inet 129.146.238.55 masque_réseau ffffff00 diffusion 129.146.238.255 
     ether 8:0:20:7b:fa:0 
    scid0 : indicateurs=80cl<ACTIF,EN COURS D'EXECUTION,PAS D'ARP,PRIVE> mtu 16321 
     inet 204.152.65.1 masques_réseau fffffff0
    scid1 : indicateurs=80cl<ACTIF,EN COURS D'EXECUTION,PAS D'ARP,PRIVE> mtu 16321 
     inet 204.152.65.17 masques_réseau fffffff0