Surveillance et dépannage des périphériques IB
Dans la version Oracle Solaris 11, de nouvelles commandes et de nouveaux utilitaires vous permettent de gérer plus efficacement la structure IB. Ces commandes sont incluses dans le package system/io/infiniband/open-fabrics et les pages de manuel sont installées automatiquement avec le package open-fabrics. Ainsi,
% man rping
Reformatting page. Please Wait... done
librdmacm RPING(1)
NAME
rping - RDMA CM connection and RDMA ping-pong test.
SYNOPSIS
rping -s [-v] [-V] [-d] [-P] [-a address] [-p port]
[-C message_count] [-S message_size]
rping -c [-v] [-V] [-d] -a address [-p port]
[-C message_count] [-S message_size]
.
.
.
Les nouvelles commandes et les nouveaux utilitaires suivants permettent de lister et d'interroger les périphériques IB, de diagnostiquer et de dépanner les problèmes de Fabric IB, ainsi que de mesurer les performances IB.
Table 3-1 Commandes de surveillance IB générales
|
|
ibv_asyncwatch
|
Surveille les événements asynchrones InfiniBand
|
ibv_devices ou ibv_devinfo
|
Liste les périphériques InfiniBand ou les informations des périphériques
|
ibv_rc_pingpong, ibv_srq_pingpong ou ibv_ud_pingpong
|
Teste la connectivité d'un noeud à l'autre en utilisant une connexion RC, des SRQ ou une connexion UD
|
mckey
|
Teste l'installation multidiffusion du gestionnaire de communication RDMA et le transfert de données simple
|
rping
|
Teste la connexion du gestionnaire de communication RDMA et tente une opération ping pong RDMA
|
ucmatose
|
Teste la connexion du gestionnaire de communication RDMA et tente une opération ping-pong simple
|
udaddy
|
Teste l'installation datagramme du gestionnaire de communication RDMA et tente une opération ping-pong simple
|
|
Table 3-2 Commandes de test de performance IB générales
|
|
rdma_bw ou rdma_lat
|
Teste les transactions d'écriture RDMA du point de vue de la bande passante ou de la latence en transmission en continu.
|
ib_read_bw ou ib_read_lat
|
Teste les transactions de lecture RDMA du point de vue de la bande passante ou de la latence.
|
ib_send_bw ou ib_send_lat
|
Teste les transactions d'envoi RDMA du point de vue de la bande passante ou de la latence.
|
ib_write_bw ou ib_write_bw_postlist
|
Teste les transactions d'écriture RDMA pour une bande passante affichant une demande d'E/S à la fois ou une bande passante affichant une liste de demandes d'E/S.
|
ib_write_lat
|
Teste les transactions en écriture RDMA du point de vue de la latence.
|
ib_clock_test
|
Teste l'exactitude de l'horloge système
|
qperf
|
Mesure les performances RDMA et de socket
|
|
Table 3-3 Outils de test et surveillance RDS
|
|
rds-info
|
Affiche les informations du module de noyau RDS
|
rds-ping
|
Détermine si un noeud distant sur RDS est accessible
|
rds-stress
|
Envoie un message entre processus sur des sockets RDS
|
|
Notez que l'annulation de la configuration d'adaptateurs de canal hôte RDSv3 ne prend pas en charge. Si le système possède une pilote RDSv3 au moment de la RD, l'annulation de la configuration du HCA échoue avec un message d'erreur ressemblant à l'exemple suivant pour ib::rdsv3,0.
# cfgadm -c unconfigure ib::rdsv3,0
This operation will suspend activity on the IB device
Continue (yes/no)? yes
cfgadm: Hardware specific failure: unconfigure operation
failed ap_id: /devices/ib:fabric::rdsv3,0
# cfgadm -c unconfigure PCI-EM0
cfgadm: Component system is busy, try again: unconfigure failed
Solution :
Supprimez le pilote RDSv3 et réinitialisez le système HCA DR avant d'effectuer l'opération.
# rem_drv rdsv3
Device busy
Cannot unload module: rdsv3
Will be unloaded upon reboot.
# init 6
Table 3-4 Outils de diagnostic de Fabric
|
|
ibdiagnet
|
Réalise un contrôle diagnostique de l'ensemble du Fabric
|
ibaddr
|
Recherche la ou les adresses InfiniBand
|
ibnetdiscover
|
Détecte la topologie InfiniBand à distance
|
ibping
|
Valide la connectivité entre noeuds IB
|
ibportstate
|
Recherche l'état d'un port physique et la vitesse de liaison d'un port IB
|
ibroute
|
Affiche les tables de transfert d'un commutateur InfiniBand
|
ibstat ou ibsysstat
|
Recherchent l'état d'un ou plusieurs périphériques InfiniBand ou d'un système sur une adresse IB
|
ibtracert
|
Trace un chemin IB
|
perfquery ou saquery
|
Recherche les compteurs de ports IB ou les attributs d'administration de sous-réseau sIB
|
sminfo
|
Recherche l'attribut SMInfo IB
|
smpquery ou smpdump
|
Recherche ou vide les attributs de gestion de sous-réseau IB
|
ibcheckerrors ou ibcheckerrs
|
Valide le port IB (ou le noeud) ou le sous-réseau IB et génère des rapports d'erreurs
|
ibchecknet, ibchecknode ou ibcheckport
|
Valide le sous-réseau, noeud ou port IB et génère des rapports d'erreurs
|
ibcheckportstate, ibcheckportwidth, ibcheckstate ou ibcheckwidth
|
Valide les ports IB qui sont activés mais pas actifs, vérifie la largeur de la liaison 1x (2,0 Gbit/s), valide les ports de sous-réseau IB qui sont activés mais pas actifs ou valide les liaisons lx du sous-réseau IB
|
ibclearcountersibclearerrors ou ibclearerrors
|
Efface les compteurs de ports ou les compteurs d'erreurs du sous-réseau IB
|
ibdatacountersibdatacounts ou ibdatacounts
|
Recherche les compteurs de données de sous-réseau IB ou les compteurs de données de port IB
|
ibdiscover.pl
|
Annote et compare la topologie IB
|
ibhosts
|
Affiche les noeuds d'hôte IB dans la topologie
|
iblinkinfo.pl ou iblinkinfo
|
Affiche les informations de liaison pour toutes les liaisons du Fabric
|
ibnodes
|
Affiche les noeuds IB de la topologie
|
ibprintca.pl
|
Affiche l'AC spécifiée ou la liste des AC à partir du résultat de ibnetdiscover
|
ibprintrt.pl
|
Affiche le routeur spécifié uniquement ou la liste des routeurs à partir du résultat de ibnetdiscover
|
ibprintswitch.pl
|
Affiche le commutateur spécifié ou la liste des commutateurs à partir du résultat de ibnetdiscover
|
ibqueryerrors.pl
|
Recherche les compteurs de ports IB qui ne sont pas à zéro et génère des rapports
|
ibrouters
|
Affiche les noeuds de routeur IB de la topologie
|
ibstatus
|
Recherche l'état de base des périphériques IB
|
ibswitches
|
Affiche les noeuds de commutateur IB de la topologie
|
ibswportwatch.pl
|
Interroge les compteurs sur le commutateur ou port spécifié et génère des rapports concernant les taux de variation
|
set_nodedesc.sh
|
Définit ou affiche une chaîne de description de noeud pour les HCA IB
|
dump2psl.pl
|
Vide le fichier PSL en se basant sur le fichier de résultat opensm utilisé pour le contrôle de boucle de crédit
|
dump2slvl.pl
|
Vide le fichier SLVL en se basant sur le fichier de résultat opensm utilisé pour le contrôle de boucle de crédit
|
ibis
|
Shell TCL étendu pour les services intrabande de gestion IB
|
|