Ce problème affecte les deux serveurs.
Une fois le domaine principal ou root réinitialisé, le domaine d'E/S doit y suspendre les fonctions virtuelles affectées, puis les relancer une fois la réinitialisation terminée. Dans certains cas, la notification de reprise peut être prématurée et entraîner l'échec de la reprise d'une ou plusieurs fonctions virtuelles affectées par le domaine d'E/S. Le problème s'applique uniquement lorsque la stratégie de panne des domaines logiques sur le domaine d'E/S n'est pas définie ou définie sur ignore.
Si cette panne se produit, deux symptômes peuvent survenir. Un des symptômes est un rapport d'erreur de l'architecture de gestion des pannes dans le domaine principal ou root auquel la fonction physique est affectée. L'autre symptôme est un avertissement sur la console (également journalisé dans /var/adm/messages) dans le domaine d'E/S. Le rapport d'erreur de l'architecture de gestion des pannes pouvant survenir dans le domaine principal ou root est ereport.io.pciex.rc.epkt et contient la chaîne suivante :
event_name = Virtual_TTE_invalid
Pour vérifier que vous avez rencontré ce problème, utilisez la commande fmdump -eV afin d'identifier le rapport d'erreur de l'architecture de gestion des pannes contenant la chaîne event_name. L'avertissement qui s'affiche dans le domaine d'E/S est le suivant :
WARNING: pxsoft_msi_resume: retry limit exceeded.
Si le problème se produit, une ou plusieurs fonctions virtuelles affectées ne fonctionneront plus correctement dans le domaine d'E/S. Les pilotes de périphérique des fonctions virtuelles affectées ne pourront pas traiter les signaux d'interruption des périphériques matériels sous-jacents.
Solution de contournement : ce problème se produit si plusieurs fonctions virtuelles sont affectées à un domaine d'E/S parmi plusieurs fonctions physiques situées sur le même bus PCIe. Vous pouvez éviter ce problème en affectant les fonctions virtuelles uniquement depuis une seule fonction physique de ce bus PCIe.
Récupération : vous devez réinitialiser le domaine d'E/S afin de résoudre ce problème et de reprendre le contrôle des fonctions virtuelles affectées.
Afin de rendre le domaine d'E/S plus résistant à ce problème, vous pouvez ajouter le paramètre suivant au fichier /etc/system :
set pxsoft:pxsoft_resume_max_retries=1024
Vous devez réinitialiser le domaine d'E/S pour que ce paramètre prenne effet.