Notas de la versión de Oracle® VM Server for SPARC 3.2

Salir de la Vista de impresión

Actualización: Mayo de 2015
 
 

Problemas con SR-IOV

El comando ldm remove-io informa un timeout y no puede eliminar la última función virtual SR-IOV de un dominio de E/S

ID de bug 20731016: si se usa el comando ldm remove-io para eliminar la última función virtual SR-IOV de un dominio de E/S, es posible que el comando informe un timeout y no pueda eliminar la función virtual.

Solución alternativa: si ocurre este problema, realice los siguientes pasos:

  1. Verifique que el paquete system/management/hwmgmtd esté instalado en el sistema.

    # pkg info system/management/hwmgmtd
  2. Desactive el servicio svc:/system/sp/management.

    # svcadm disable -st svc:/system/sp/management
  3. Vuelva a intentar ejecutar el comando ldm remove-io.

  4. Cuando la función virtual SR-IOV se haya eliminado correctamente, active el servicio svc:/system/sp/management.

    # svcadm enable svc:/system/sp/management

En raras ocasiones se produce un aviso grave de BAD TRAP al reiniciar un dominio raíz de Oracle Solaris 10 que tiene funciones virtuales SR-IOV asignadas a los dominios invitados

ID de bug 18323562: un dominio raíz Oracle Solaris 10 puede generar un aviso grave al reiniciar: El dominio raíz Oracle Solaris 10 tiene al menos dos buses PCIe, y las funciones virtuales de las funciones físicas en los distintos buses se asignan a dominios invitados. Es decir, si se reciben eventos desde distintos buses en los dominios invitados en paralelo, el dominio raíz puede emitir avisos graves. Este error grave se produce en raras ocasiones.

panic[cpu3]/thread=2a100365c80: BAD TRAP: type=31 rp=2a1003652b0 addr=2000
mmu_fsr=0 occurred in module "pcie" due to an illegal access to a user
address

Solución alternativa: ninguna.

prtdiag puede ocasionar que el dominio raíz de Oracle Solaris 10 genere un aviso grave después de destruir las funciones virtuales de SR-IOV

ID de bug 18323370: un dominio raíz de Oracle Solaris 10 puede generar un aviso grave si destruye las funciones virtuales y luego ejecuta el comando prtdiag.

El comando prtdiag puede generar un aviso grave cuando se intenta acceder a los nodos de dispositivo de función virtual recién destruidos:

panic[cpu31]/thread=2a10140bc80: Fatal error has occured in: PCIe
fabric.(0x1)(0x43)

Y el comando prtdiag imprime mensajes como el siguiente:

DEV_GET failed -1 Invalid argument  4.0.2 offset 0xff
/SYS/PCI-EM4      PCIE  fibre-channel-pciex10df,e200                   --
                     /pci@600/pci@1/pci@0/pci@4/fibre-channel@0,2

Estos mensajes ocurren porque el comando prtdiag intenta acceder a los nodos del dispositivo de función virtual de acceso que se han destruido. Los nodos siguen apareciendo en el árbol picl, pero no en el árbol de dispositivo real.

Solución alternativa: para evitar el aviso grave, agregue la siguiente línea al archivo /etc/system en el dominio raíz de Oracle Solaris 10:

set px:pxtool_cfg_delay_usec=25000

Además, refresque el daemon picl para evitar los mensajes de Invalid argument:

# svcadm refresh picl

La función física del canal de fibra es declarada defectuosa por FMA y se desactiva

ID de bug 18168525 y 18156291: debe conectar la tarjeta PCIe del canal de fibra a un conmutador de canal de fibra que admita NPIV y sea compatible con la tarjeta PCIe. Si no utiliza esta configuración, al utiliza el comando format o crear o destruir una función virtual, la función física podría ser declarada defectuosa por FMA y desactivarse. Si se produce este error, el mensaje es similar al siguiente:

SUNW-MSG-ID: PCIEX-8000-0A, TYPE: Fault, VER: 1, SEVERITY: Critical
EVENT-TIME: event-time
PLATFORM: platform-type
SOURCE: eft, REV: 1.16
EVENT-ID: event-ID
DESC: A problem was detected for a PCIEX device.
AUTO_RESPONSE: One or more device instances may be disabled
IMPACT: Loss of services provided by the device instances associated with
this fault
REC-ACTION: Use 'fmadm faulty' to provide a more detailed view of this event.
Please refer to the associated reference document at
http://support.oracle.com/msg/PCIEX-8000-0A for the latest service procedures
and policies regarding this diagnosis.

Solución alternativa: si la tarjeta ha sido declarada defectuosa por FMA, primero controle las conexiones y asegúrese de que la tarjeta no esté conectada directamente al almacenamiento. Luego, realice el paso que coincide con su configuración:

  • La tarjeta está conectada directamente al almacenamiento. Configure correctamente la tarjeta PCIe del canal de fibra; para ello, conéctela al conmutador de canal de fibra que admite NPIV y que sea compatible con la tarjeta PCIe. Luego, ejecute el comando fmadm repair para anular el diagnóstico de FMA.

  • La tarjeta no está conectada directamente al almacenamiento. Cambie la tarjeta.

El dominio de control se cuelga cuando se detienen o se inician dominios de E/S

 

ID de bug 18030411: el dominio primary se puede colgar si detiene e inicia dominios de E/S frecuentemente y en sucesión rápida. Como resultado de este comportamiento, InfiniBand HCA deja de responder y hace que se cuelgue el dominio primary.

Si tiene este problema, es posible que vea mensajes en la consola o en el archivo messages similares al siguiente:

VF3: PF has failed

Mcxnex: HW2SW_MPT command @ failed: 0000ffff

Hermon: MAD_IFC (port 01) command failed: 0000ffff

WARNING: mcxnex0: Device Error: HCR Timeout waiting for command go bit

Recuperación: para evitar este problema, no realice operaciones de detención e inicio innecesarias en los dominios de E/S. En cambio, lleve a cabo un cierre ordenado del dominio de E/S.

Solución alternativa: si el dominioprimary se cuelga por este motivo, reinicie el sistema de una de las siguientes maneras:

  • Reinicie el dominio

    primary# ldm stop -r domain-name
  • Reinicie el SP

    -> reset /SYS

Aparecerán advertencias en la consola cuando genere funciones virtuales del canal de fibra

ID de bug 17623156: cuando genere funcione virtuales del canal de fibra, es posible que observe las siguientes advertencias:

WARNING: kmem_cache_destroy: 'px0_emlxs3_3_cache2'
  (3000383e030) not empty
WARNING: vmem_destroy('px0_emlxs3_3_vmem_top'):
  leaked 262144 identifiers

Estos mensajes no afectan el funcionamiento normal del sistema y puede ignorarlos.

Solución alternativa: ninguna.

Los cambios de configuración de la función física del canal de fibra requieren varios minutos para completarse

ID de bug 16397888: después de agregar o destruir funciones virtuales, podría haber una demora de hasta cinco minutos antes de que pueda intentar agregar o destruir más fracciones virtuales de la función física del canal de fibra.

Si intenta llevar a cabo estas operaciones antes de que transcurran cinco minutos, se producirá un error en las operaciones con un mensaje similar al siguiente:

The attempt to offline the pf /SYS/PCI-EM4/IOVFC.PF0 in domain
primary failed.
Error message from svc:/ldoms/agents in domain primary:
CMD_OFFLINE Failed. ERROR: devices or resources are busy.

Solución alternativa: espere cinco minutos antes de intentar otra operación de IOV en la función física del canal de fibra.

Para llevar a cabo todas las opciones de configuración necesarias en un único comando, utilice el comando ldm create-vf -n max o ldm destroy-vf -n max.

Fujitsu M10 Server tiene diferentes limitaciones de la función SR-IOV

En un Fujitsu M10 Server puede asignar dispositivos de punto final PCIe y funciones virtuales SR-IOV de un bus PCIe particular a un máximo de 24 dominios. El máximo es 15 dominios para las plataformas SPARC T-Series y SPARC M-Series compatibles.

Problemas de SR-IOV InfiniBand


Caution

Precaución  - Revise esta sección antes de implementar SR-IOV InfiniBand en su entorno de Oracle VM Server for SPARC 3.1.


    En esta sección se describen los problemas conocidos para la función SR-IOV InfiniBand en la versión inicial de Oracle VM Server for SPARC 3.1.

  • El reinicio de un dominio de E/S de Oracle Solaris 11.1.10.5.0 que tiene funciones virtuales de InfiniBand asignadas ocasionalmente produce un error grave en el correspondiente dominio root. Consulte el ID de bug 17336355.

  • Un dominio de E/S de Oracle Solaris 10 1/13 que tiene funciones virtuales de InfiniBand asignadas algunas veces genera un error grave durante el reinicio. El dominio de E/S ejecuta el sistema operativo Oracle Solaris 10 1/13 además de los parches necesarios. Consulte los ID de bug 17382933, 17361763, 17329218 y 17336035.

Se muestran mensajes engañosos para las operaciones SR-IOV InfiniBand

ID de bug 16979993: al intentar utilizar operaciones SR-IOV dinámicas en un dispositivo InfiniBand, se obtienen como resultado mensajes de error confusos e inadecuados.

La función SR-IOV dinámica no es compatible con los dispositivos InfiniBand.

Solución alternativa: gestione las funciones virtuales de InfiniBand mediante uno de los siguientes procedimientos: