Guide d'administration d'Oracle® VM Server for SPARC 3.3

Quitter la vue de l'impression

Mis à jour : Octobre 2015
 
 

Utilisation de l'architecture FMA pour mettre sur liste noire les ressources défectueuses ou annuler leur configuration

L'architecture FMA contacte Logical Domains Manager lorsqu'elle détecte une ressource défectueuse. Ensuite, Logical Domains Manager tente de mettre fin à l'utilisation de cette ressource dans tous les domaines en cours d'exécution. Pour s'assurer qu'une ressource défectueuse ne pourra pas être assignée à un domaine, l'architecture FMA ajoute cette ressource à une liste noire.

Logical Domains Manager prend uniquement en charge la mise sur liste noire pour les ressources de CPU et de mémoire, et non pour les ressources d'E/S.

Si une ressource défectueuse n'est pas utilisée, Logical Domains Manager la supprime de la liste des ressources disponibles, que vous pouvez consulter dans la sortie de ldm list-devices. Cette ressource est alors marquée en interne comme étant “sur liste noire” de façon à ce qu'elle ne puisse pas être réassignée à un domaine ultérieurement.

Si la ressource défectueuse est en cours d'utilisation, Logical Domains Manager tente d'évacuer la ressource. Pour éviter une interruption de service sur les domaines en cours d'exécution, Logical Domains Manager tente d'abord d'utiliser la reconfiguration dynamique de la CPU ou de la mémoire pour évacuer la ressource défectueuse. Logical Domains Manager mappe à nouveau un coeur défectueux si celui-ci est disponible pour être utilisé en tant que cible. Si cette “évacuation en direct” réussit, la ressource défectueuse est marquée en interne comme placée sur liste noire et ne s'affiche pas dans la sortie ldm list-devices, de manière à ce qu'elle ne puisse pas être assignée à un domaine ultérieurement.

Si l'évacuation en direct échoue, Logical Domains Manager affecte en interne le statut « évacuation en attente » à la ressource défectueuse. La ressource s'affiche normalement dans la sortie ldm list-devices car elle est encore utilisée sur les domaines en cours d'exécution jusqu'à ce que les domaines invités affectés soient réinitialisés ou arrêtés.

Lorsque le domaine invité affecté est arrêté ou réinitialisé, Logical Domains Manager tente d'évacuer les ressources défectueuses et de les marquer en interne comme placées sur liste noire afin qu'elles ne puissent pas être assignées ultérieurement. Un tel périphérique n'est pas affiché dans la sortie ldm. Une fois l'exécution en attente effectuée, Logical Domains Manager tente de démarrer le domaine invité. Toutefois, si le domaine invité ne peut pas être démarré car les ressources disponibles sont insuffisantes, le domaine invité est marqué comme “dégradé” et le message d'avertissement suivant est émis, afin d'inviter l'utilisateur à effectuer une récupération manuelle.

primary# ldm ls
NAME             STATE      FLAGS   CONS    VCPU  MEMORY   UTIL  NORM  UPTIME
primary          active     -n-cv-  UART    368   2079488M 0.1%  0.0%  16h 57m
gd0              bound      -d----  5000    8

warning: Could not restart domain gd0 after completing pending evacuation.
The domain has been marked degraded and should be examined to see
if manual recovery is possible.

Lorsque le système est arrêté et redémarré, l'architecture FMA répète les demandes d'évacuation des ressources qui sont encore défectueuses et Logical Domains Manager gère ces demandes en évacuant les ressources défectueuses et en les marquant en interne comme placées sur liste noire.

Avant l'introduction de la mise sur liste noire par l'architecture FMA, une panique d'un domaine invité due à une ressource défectueuse pouvait entraîner une boucle de réinitialisation infinie. En utilisant l'évacuation de ressource et la mise sur liste noire lorsque le domaine invité est réinitialisé, vous pouvez éviter cette boucle et empêcher les tentatives ultérieures d'utilisation d'une ressource défectueuse.