Notes de version d'Oracle® VM Server for SPARC 3.2

Quitter la vue de l'impression

Mis à jour : Mai 2015
 
 

Problèmes liés à SR-IOV

La commande ldm remove-io signale un délai d'attente et un échec de la suppression de la dernière fonction virtuelle SR-IOV d'un domaine d'E/S

ID de bogue 20731016 : lorsque vous utilisez la commande ldm remove-io pour supprimer la dernière fonction virtuelle SR-IOV d'un domaine d'E/S, la commande peut signaler un délai d'attente et un échec de suppression de la fonction virtuelle.

Solution de contournement : si ce problème se produit, procédez comme suit :

  1. Vérifiez que le package system/management/hwmgmtd est installé sur le système.

    # pkg info system/management/hwmgmtd
  2. Désactivez le service svc:/system/sp/management.

    # svcadm disable -st svc:/system/sp/management
  3. Réexécutez la commande ldm remove-io.

  4. Lorsque la fonction virtuelle SR-IOV a été supprimée, activez le service svc:/system/sp/management.

    # svcadm enable svc:/system/sp/management

Une panique de déroutement incorrect survient rarement lors de la réinitialisation d'un domaine root Oracle Solaris 10 dont les fonctions virtuelles SR-IOV sont assignées à des domaines invités

ID de bogue 18323562 : un domaine root Oracle Solaris 10 peut paniquer lors de la réinitialisation. Le domaine root Oracle Solaris 10 dispose d'au moins deux bus PCIe et les fonctions virtuelles des fonctions physiques de différents bus sont assignées aux domaines invités. C'est-à-dire que si des événements de différents bus sur des domaines invités sont reçus en parallèle, le domaine root peut paniquer. Cette panique survient rarement.

panic[cpu3]/thread=2a100365c80: BAD TRAP: type=31 rp=2a1003652b0 addr=2000
mmu_fsr=0 occurred in module "pcie" due to an illegal access to a user
address

Solution de contournement : aucune.

prtdiag peut provoquer la panique d'un domaine root Oracle Solaris 10 après la destruction des fonctions virtuelles SR-IOV

ID de bogue 18323370 : un domaine root Oracle Solaris 10 peut paniquer si vous détruisez les fonctions virtuelles puis exécutez la commande prtdiag.

La commande prtdiag peut provoquer une panique lorsqu'elle tente d'accéder aux noeuds de périphérique de fonction virtuelle qui viennent juste d'être détruits :

panic[cpu31]/thread=2a10140bc80: Fatal error has occured in: PCIe
fabric.(0x1)(0x43)

La commande prtdiag imprime des messages similaires au message suivant :

DEV_GET failed -1 Invalid argument  4.0.2 offset 0xff
/SYS/PCI-EM4      PCIE  fibre-channel-pciex10df,e200                   --
                     /pci@600/pci@1/pci@0/pci@4/fibre-channel@0,2

Ces messages se produisent car la commande prtdiag tente d'accéder aux noeuds de périphérique de fonction virtuelle qui ont été détruits. Les noeuds s'affichent encore dans l'arborescence picl, mais pas dans l'arborescence de périphériques actuels.

Solution de contournement : pour éviter la panique, ajoutez la ligne suivante au fichier /etc/system sur le domaine root Oracle Solaris 10 :

set px:pxtool_cfg_delay_usec=25000

Actualisez également le démon picl pour éviter les messages Invalid argument :

# svcadm refresh picl

La fonction physique Fibre Channel est défaillante et désactivée par FMA

ID de bogue 18168525 et 18156291 : vous devez connecter la carte PCIe Fibre Channel à un commutateur Fibre Channel prenant en charge NPIV et compatible avec la carte PCIe. Si vous n'utilisez pas cette configuration, l'utilisation de la commande format ou la création ou suppression d'une fonction virtuelle peut provoquer la défaillance de la fonction physique et sa désactivation par FMA. Si cette défaillance se produit, le message qui s'affiche ressemble à l'exemple suivant 

SUNW-MSG-ID: PCIEX-8000-0A, TYPE: Fault, VER: 1, SEVERITY: Critical
EVENT-TIME: event-time
PLATFORM: platform-type
SOURCE: eft, REV: 1.16
EVENT-ID: event-ID
DESC: A problem was detected for a PCIEX device.
AUTO_RESPONSE: One or more device instances may be disabled
IMPACT: Loss of services provided by the device instances associated with
this fault
REC-ACTION: Use 'fmadm faulty' to provide a more detailed view of this event.
Please refer to the associated reference document at
http://support.oracle.com/msg/PCIEX-8000-0A for the latest service procedures
and policies regarding this diagnosis.

Solution : si la carte a été mise en défaillance par FMA, vérifiez tout d'abord ses connexions et assurez-vous que la carte n'est pas connectée directement au stockage. Ensuite, exécutez l'étape correspondant à votre configuration 

  • La carte est connectée directement au stockage – Configurez correctement la carte PCIe Fibre Channel en la connectant au commutateur Fibre Channel prenant en charge NPIV et compatible avec la carte PCIe. Ensuite, exécutez la commande fmadm repair pour ignorer le diagnostic FMA.

  • La carte n'est pas connectée directement au stockage– Remplacez la carte.

Blocage du domaine de contrôle lors de l'arrêt ou du démarrage de domaines d'E/S

 

ID de bogue 18030411 : Le domaine primary peut se bloquer si vous arrêtez et démarrez les domaines d'E/S régulièrement et de façon très rapprochée. Suite à ce comportement, le HCA InfiniBand cesse de répondre et provoque le blocage du domaine primary.

Si vous rencontrez ces problèmes, des messages tels que les suivants peuvent s'afficher dans la console ou dans le fichier messages :

VF3: PF has failed

Mcxnex: HW2SW_MPT command @ failed: 0000ffff

Hermon: MAD_IFC (port 01) command failed: 0000ffff

WARNING: mcxnex0: Device Error: HCR Timeout waiting for command go bit

Récupération : pour éviter de rencontrer ce problème, n'effectuez pas d'opérations d'arrêt et de démarrage non nécessaires des domaines d'E/S. Au lieu de cela, arrêtez correctement le domaine d'E/S.

Solution : si le domaine primary est bloqué pour cette raison, réinitialisez le système de l'une des façons suivantes :

  • Réinitialisez le domaine

    primary# ldm stop -r domain-name
  • Réinitialisez le SP

    -> reset /SYS

Affichage d'avertissements sur la console lors de la création de fonctions virtuelles Fibre Channel

ID de bogue 17623156 : lors de la création de fonctions virtuelles Fibre Channel, les avertissements suivants peuvent s'afficher :

WARNING: kmem_cache_destroy: 'px0_emlxs3_3_cache2'
  (3000383e030) not empty
WARNING: vmem_destroy('px0_emlxs3_3_vmem_top'):
  leaked 262144 identifiers

Ces messages n'affectent pas le fonctionnement normal du système et peuvent être ignorés.

Solution de contournement : aucune.

La modification de la configuration des fonctions physiques de Fibre Channel prend quelques minutes

ID de bogue 16397888 : après l'ajout ou la suppression de fonctions virtuelles, vous pouvez devoir patienter jusqu'à cinq minutes avant de pouvoir tenter d'ajouter ou de supprimer d'autres fonctions virtuelles de la fonction physique de Fibre Channel.

Si vous tentez d'effectuer ces opérations avant l'écoulement de ces cinq minutes, les opérations échouent avec un message tel que le suivant :

The attempt to offline the pf /SYS/PCI-EM4/IOVFC.PF0 in domain
primary failed.
Error message from svc:/ldoms/agents in domain primary:
CMD_OFFLINE Failed. ERROR: devices or resources are busy.

Solution : patientez cinq minutes avant de tenter une autre opération IOV sur la fonction physique Fibre Channel.

Pour exécuter toutes les options de configuration nécessaires à l'aide d'une commande unique, utilisez les commandes ldm create-vf -n max ou ldm destroy-vf -n max.

Les restrictions de la fonction SR-IOV du Serveur Fujitsu M10 sont différentes

Sur un Serveur Fujitsu M10, vous pouvez associer des périphériques d'extrémité PCIe et des fonctions virtuelles SR-IOV d'un bus PCIe donné à un maximum de 24 domaines. Le maximum est de 15 domaines pour les plate-formes SPARC T-Series et SPARC M-Series prises en charge.

Problèmes liés à SR-IOV InfiniBand


Caution

Mise en garde  - Consultez cette section avant de déployer SR-IOV InfiniBand dans votre environnement Oracle VM Server for SPARC 3.1.


    Cette section décrit les problèmes connus liés à la fonction SR-IOV InfiniBand dans la version initiale de Oracle VM Server for SPARC 3.1.

  • La réinitialisation d'un domaine d'E/S Oracle Solaris 11.1.10.5.0 auquel des fonctions virtuelles InfiniBand sont assignées entraîne quelquefois une panique du domaine root correspondant. Voir l'ID de bogue 17336355.

  • Un domaine d'E/S Oracle Solaris 10 1/13 auquel des fonctions virtuelles InfiniBand sont assignées peut paniquer lors de la réinitialisation. Le domaine d'E/S exécute le SE Oracle Solaris 10 1/13 et les patchs requis. Voir les ID de bogue 17382933, 17361763, 17329218 et 17336035.

Affichage de messages induisant en erreur pour les opérations SR-IOV InfiniBand

ID de bogue 16979993 : la tentative d'utiliser des opérations SR-IOV dynamiques sur un périphérique InfiniBand entraîne l'apparition de messages d'erreur peu clairs et inappropriés.

SR-IOV dynamique n'est pas pris en charge pour les périphériques InfiniBand.

Solution de contournement : gérez les fonctions virtuelles InfiniBand en effectuant l'une des procédures suivantes :