ID de bug 20731016: si se usa el comando ldm remove-io para eliminar la última función virtual SR-IOV de un dominio de E/S, es posible que el comando informe un timeout y no pueda eliminar la función virtual.
Solución alternativa: si ocurre este problema, realice los siguientes pasos:
Verifique que el paquete system/management/hwmgmtd esté instalado en el sistema.
# pkg info system/management/hwmgmtd
Desactive el servicio svc:/system/sp/management.
# svcadm disable -st svc:/system/sp/management
Vuelva a intentar ejecutar el comando ldm remove-io.
Cuando la función virtual SR-IOV se haya eliminado correctamente, active el servicio svc:/system/sp/management.
# svcadm enable svc:/system/sp/management
ID de bug 18323562: un dominio raíz Oracle Solaris 10 puede generar un aviso grave al reiniciar: El dominio raíz Oracle Solaris 10 tiene al menos dos buses PCIe, y las funciones virtuales de las funciones físicas en los distintos buses se asignan a dominios invitados. Es decir, si se reciben eventos desde distintos buses en los dominios invitados en paralelo, el dominio raíz puede emitir avisos graves. Este error grave se produce en raras ocasiones.
panic[cpu3]/thread=2a100365c80: BAD TRAP: type=31 rp=2a1003652b0 addr=2000 mmu_fsr=0 occurred in module "pcie" due to an illegal access to a user address
Solución alternativa: ninguna.
ID de bug 18323370: un dominio raíz de Oracle Solaris 10 puede generar un aviso grave si destruye las funciones virtuales y luego ejecuta el comando prtdiag.
El comando prtdiag puede generar un aviso grave cuando se intenta acceder a los nodos de dispositivo de función virtual recién destruidos:
panic[cpu31]/thread=2a10140bc80: Fatal error has occured in: PCIe fabric.(0x1)(0x43)
Y el comando prtdiag imprime mensajes como el siguiente:
DEV_GET failed -1 Invalid argument 4.0.2 offset 0xff /SYS/PCI-EM4 PCIE fibre-channel-pciex10df,e200 -- /pci@600/pci@1/pci@0/pci@4/fibre-channel@0,2
Estos mensajes ocurren porque el comando prtdiag intenta acceder a los nodos del dispositivo de función virtual de acceso que se han destruido. Los nodos siguen apareciendo en el árbol picl, pero no en el árbol de dispositivo real.
Solución alternativa: para evitar el aviso grave, agregue la siguiente línea al archivo /etc/system en el dominio raíz de Oracle Solaris 10:
set px:pxtool_cfg_delay_usec=25000
Además, refresque el daemon picl para evitar los mensajes de Invalid argument:
# svcadm refresh picl
ID de bug 18168525 y 18156291: debe conectar la tarjeta PCIe del canal de fibra a un conmutador de canal de fibra que admita NPIV y sea compatible con la tarjeta PCIe. Si no utiliza esta configuración, al utiliza el comando format o crear o destruir una función virtual, la función física podría ser declarada defectuosa por FMA y desactivarse. Si se produce este error, el mensaje es similar al siguiente:
SUNW-MSG-ID: PCIEX-8000-0A, TYPE: Fault, VER: 1, SEVERITY: Critical EVENT-TIME: event-time PLATFORM: platform-type SOURCE: eft, REV: 1.16 EVENT-ID: event-ID DESC: A problem was detected for a PCIEX device. AUTO_RESPONSE: One or more device instances may be disabled IMPACT: Loss of services provided by the device instances associated with this fault REC-ACTION: Use 'fmadm faulty' to provide a more detailed view of this event. Please refer to the associated reference document at http://support.oracle.com/msg/PCIEX-8000-0A for the latest service procedures and policies regarding this diagnosis.
Solución alternativa: si la tarjeta ha sido declarada defectuosa por FMA, primero controle las conexiones y asegúrese de que la tarjeta no esté conectada directamente al almacenamiento. Luego, realice el paso que coincide con su configuración:
La tarjeta está conectada directamente al almacenamiento. Configure correctamente la tarjeta PCIe del canal de fibra; para ello, conéctela al conmutador de canal de fibra que admite NPIV y que sea compatible con la tarjeta PCIe. Luego, ejecute el comando fmadm repair para anular el diagnóstico de FMA.
La tarjeta no está conectada directamente al almacenamiento. Cambie la tarjeta.
ID de bug 18030411: el dominio primary se puede colgar si detiene e inicia dominios de E/S frecuentemente y en sucesión rápida. Como resultado de este comportamiento, InfiniBand HCA deja de responder y hace que se cuelgue el dominio primary.
Si tiene este problema, es posible que vea mensajes en la consola o en el archivo messages similares al siguiente:
VF3: PF has failed Mcxnex: HW2SW_MPT command @ failed: 0000ffff Hermon: MAD_IFC (port 01) command failed: 0000ffff WARNING: mcxnex0: Device Error: HCR Timeout waiting for command go bit
Recuperación: para evitar este problema, no realice operaciones de detención e inicio innecesarias en los dominios de E/S. En cambio, lleve a cabo un cierre ordenado del dominio de E/S.
Solución alternativa: si el dominioprimary se cuelga por este motivo, reinicie el sistema de una de las siguientes maneras:
Reinicie el dominio
primary# ldm stop -r domain-name
Reinicie el SP
-> reset /SYS
ID de bug 17623156: cuando genere funcione virtuales del canal de fibra, es posible que observe las siguientes advertencias:
WARNING: kmem_cache_destroy: 'px0_emlxs3_3_cache2' (3000383e030) not empty WARNING: vmem_destroy('px0_emlxs3_3_vmem_top'): leaked 262144 identifiers
Estos mensajes no afectan el funcionamiento normal del sistema y puede ignorarlos.
Solución alternativa: ninguna.
ID de bug 16397888: después de agregar o destruir funciones virtuales, podría haber una demora de hasta cinco minutos antes de que pueda intentar agregar o destruir más fracciones virtuales de la función física del canal de fibra.
Si intenta llevar a cabo estas operaciones antes de que transcurran cinco minutos, se producirá un error en las operaciones con un mensaje similar al siguiente:
The attempt to offline the pf /SYS/PCI-EM4/IOVFC.PF0 in domain primary failed. Error message from svc:/ldoms/agents in domain primary: CMD_OFFLINE Failed. ERROR: devices or resources are busy.
Solución alternativa: espere cinco minutos antes de intentar otra operación de IOV en la función física del canal de fibra.
Para llevar a cabo todas las opciones de configuración necesarias en un único comando, utilice el comando ldm create-vf -n max o ldm destroy-vf -n max.
En un Fujitsu M10 Server puede asignar dispositivos de punto final PCIe y funciones virtuales SR-IOV de un bus PCIe particular a un máximo de 24 dominios. El máximo es 15 dominios para las plataformas SPARC T-Series y SPARC M-Series compatibles.
![]() | Precaución - Revise esta sección antes de implementar SR-IOV InfiniBand en su entorno de Oracle VM Server for SPARC 3.1. |
En esta sección se describen los problemas conocidos para la función SR-IOV InfiniBand en la versión inicial de Oracle VM Server for SPARC 3.1.
El reinicio de un dominio de E/S de Oracle Solaris 11.1.10.5.0 que tiene funciones virtuales de InfiniBand asignadas ocasionalmente produce un error grave en el correspondiente dominio root. Consulte el ID de bug 17336355.
Un dominio de E/S de Oracle Solaris 10 1/13 que tiene funciones virtuales de InfiniBand asignadas algunas veces genera un error grave durante el reinicio. El dominio de E/S ejecuta el sistema operativo Oracle Solaris 10 1/13 además de los parches necesarios. Consulte los ID de bug 17382933, 17361763, 17329218 y 17336035.
ID de bug 16979993: al intentar utilizar operaciones SR-IOV dinámicas en un dispositivo InfiniBand, se obtienen como resultado mensajes de error confusos e inadecuados.
La función SR-IOV dinámica no es compatible con los dispositivos InfiniBand.
Solución alternativa: gestione las funciones virtuales de InfiniBand mediante uno de los siguientes procedimientos: