Supervisión y resolución de problemas de dispositivos IB
En Oracle Solaris 11, existen nuevos comandos y utilidades que le permiten gestionar el tejido IB de manera más eficaz. Estos comandos se incluyen en el paquete system/io/infiniband/open-fabrics y las páginas del comando man se instalan automáticamente cuando el paquete open-fabrics está instalado. Por ejemplo:
% man rping
Reformatting page. Please Wait... done
librdmacm RPING(1)
NAME
rping - RDMA CM connection and RDMA ping-pong test.
SYNOPSIS
rping -s [-v] [-V] [-d] [-P] [-a address] [-p port]
[-C message_count] [-S message_size]
rping -c [-v] [-V] [-d] -a address [-p port]
[-C message_count] [-S message_size]
.
.
.
Los siguientes comandos y utilidades nuevos proporcionan la habilidad de enumerar y consultar dispositivos IB, diagnosticar y solucionar problemas de tejidos IB y calcular el rendimiento IB.
Tabla 3-1 Comandos de supervisión de IB generales
|
|
ibv_asyncwatch
|
Supervisa eventos asíncronos InfiniBand
|
ibv_devices or ibv_devinfo
|
Enumera dispositivos InfiniBand o información de dispositivos
|
ibv_rc_pingpong, ibv_srq_pingpong o ibv_ud_pingpong
|
Prueba la conectividad de nodo a nodo mediante conexión RC, SRQs o conexión UD
|
mckey
|
Prueba la configuración de multidifusión CM RDMA y la transferencia de datos simple
|
rping
|
Prueba la conexión CM RDMA e intenta ping-pong RDMA
|
ucmatose
|
Prueba la conexión CM RDMA e intenta ping-pong simple
|
udaddy
|
Prueba la configuración de datagramas CM RDMA e intenta ping-pong simple
|
|
Tabla 3-2 Comandos de prueba de rendimiento IB general
|
|
rdma_bw or rdma_lat
|
Prueba transacciones de escritura RDMA para el flujo de ancho de banda o latencia.
|
ib_read_bw o ib_read_lat
|
Prueba transacciones de lectura RDMA para ancho de banda o latencia.
|
ib_send_bw o ib_send_lat
|
Prueba transacciones de envío RDMA para ancho de banda o latencia.
|
ib_write_bw o ib_write_bw_postlist
|
Prueba transacciones de escritura RDMA para ancho de banda que muestra una solicitud de E/S en un momento o ancho de banda de lista de publicación que muestra una lista de solicitudes de E/S.
|
ib_write_lat
|
Prueba transacciones de escritura RDMA para latencia.
|
ib_clock_test
|
Prueba la precisión del reloj del sistema.
|
qperf
|
Calcula el rendimiento del socket y RDMA.
|
|
Tabla 3-3 Herramientas de prueba y supervisión RDS
|
|
rds-info
|
Muestra información de módulo de núcleo RDS.
|
rds-ping
|
Determina si el nodo remoto mediante RDS es accesible.
|
rds-stress
|
Envía mensajes entre procesos mediante sockets RDS.
|
|
Tenga en cuenta que RDSv3 no admite la desconfiguración de HCA. Si el sistema tiene instalado un controlador RDSv3 cuando se realiza la reconfiguración dinámica, falla la desconfiguración de HCA y muestra un mensaje de error como el que se muestra en el mensaje siguiente para ib::rdsv3,0.
# cfgadm -c unconfigure ib::rdsv3,0
This operation will suspend activity on the IB device
Continue (yes/no)? yes
cfgadm: Hardware specific failure: unconfigure operation
failed ap_id: /devices/ib:fabric::rdsv3,0
# cfgadm -c unconfigure PCI-EM0
cfgadm: Component system is busy, try again: unconfigure failed
Solución alternativa:
Elimine el controlador RDSv3 y reinicie el sistema antes de realizar la operación de reconfiguración dinámica de HCA.
# rem_drv rdsv3
Device busy
Cannot unload module: rdsv3
Will be unloaded upon reboot.
# init 6
Tabla 3-4 Herramientas de diagnóstico de tejido
|
|
ibdiagnet
|
Realiza una comprobación de diagnóstico de todo el tejido
|
ibaddr
|
Consulta una dirección o direcciones InfiniBand
|
ibnetdiscover
|
Detecta topología InfiniBand remota
|
ibping
|
Valida la conectividad entre nodos IB
|
ibportstate
|
Consulta el estado del puerto físico y la velocidad de enlace de un puerto IB
|
ibroute
|
Muestra tablas de reenvío de conmutación InfiniBand
|
ibstat o ibsysstat
|
Consulta el estado de un dispositivo o dispositivos InfiniBand, o el estado de un sistema en una dirección IB
|
ibtracert
|
Realiza un seguimiento de una ruta IB
|
perfquery o saquery
|
Consulta los contadores de puerto IB o atributos de administración de subred sIB
|
sminfo
|
Consulta el atributo SMInfo IB
|
smpquery o smpdump
|
Consulta o vuelca atributos de gestión de subred IB
|
ibcheckerrors o ibcheckerrs
|
Valida un puerto IB (o nodo) o subred IB y notifica los errores
|
ibchecknet, ibchecknode o ibcheckport
|
Valida una subred, nodo o puerto IB y notifica los errores
|
ibcheckportstate, ibcheckportwidth, ibcheckstate o ibcheckwidth
|
Valida un puerto IB enlazado pero no activo, puertos para ancho de enlace 1x (2,0 Gbps), puertos en la subred IB enlazados pero no activos o enlaces lx en subred IB
|
ibclearcountersibclearerrors o ibclearerrors
|
Borra contadores de puerto o contadores de errores de una subred IB
|
ibdatacountersibdatacounts o ibdatacounts
|
Consulta contadores de datos en la subred IB o contadores de datos de puerto IB
|
ibdiscover.pl
|
Anota y compara la topología IB
|
ibhosts
|
Muestra nodos host IB en la topología
|
iblinkinfo.pl o iblinkinfo
|
Muestra información de enlaces para todos los enlaces en el tejido
|
ibnodes
|
Muestra nodos IB en la topología
|
ibprintca.pl
|
Muestra la CA especificada o la lista de CA de la salida ibnetdiscover
|
ibprintrt.pl
|
Muestra sólo el enrutador especificado o una lista de los enrutadores de la salida ibnetdiscover
|
ibprintswitch.pl
|
Muestra el conmutador especificado o la lista de conmutadores de la salida ibnetdiscover
|
ibqueryerrors.pl
|
Consulta e informa contadores de puerto IB que no tengan valor cero
|
ibrouters
|
Muestra nodos de enrutador IB en la topología
|
ibstatus
|
Consulta el estado básico de dispositivos IB
|
ibswitches
|
Muestra nodos de conmutadores IB en la topología
|
ibswportwatch.pl
|
Sondea los contadores en el conmutador especificado o en el puerto especificado, e informa la tasa de información que se modifica
|
set_nodedesc.sh
|
Establece o muestra la cadena de descripción de nodos para adaptadores de controlador de host IB (HCA)
|
dump2psl.pl
|
Vuelca el archivo PSL basado en el archivo de salida opensm que se utiliza para comprobación en bucles de créditos
|
dump2slvl.pl
|
Vuelca el archivo SLVL basado en el archivo de salida opensm que se utiliza para comprobación en bucles de créditos
|
ibis
|
Un shell TCL mejorado para servicios Inband de gestión IB
|
|