Esta sección contiene problemas generales y errores específicos relativos al software Oracle VM Server for SPARC 3.5.
En esta sección se resumen los bugs que pueden surgir al utilizar esta versión del software. Se describen en primer lugar los bugs más recientes. Cuando es posible, se especifican las soluciones alternativas y los procedimientos de recuperación.
ID de bug 26435797: el daemon ldmd puede generar un volcado del núcleo si falla la operación de eliminación de núcleo de CPU o CPU virtual. Este fallo se puede producir cuando todos los CPU del dominio de destino están enlazados o muy cargados.
Cuando se produce este fallo, el comando ldm remove-core puede emitir uno de los siguientes mensajes de error:
Invalid response Failed to receive version negotiation response from logical domain manager: Connection reset by peer
Para realizar la eliminación de CPU virtuales, debe desenlazar algunos de las CPU del dominio de destino o disminuir la carga de trabajo. Tenga en cuenta que este problema no afecta las operaciones de eliminación de CPU virtual en dominios enlazados o no enlazados.
ID de bug 26184111: la propiedad vsw-relay-mode se configura en un conmutador virtual para activar el modo de retransmisión reflectante. Este modo no se conserva después del reinicio de un dominio de servicio; por lo tanto, el estado se revierte al valor por defecto local.
Solución alternativa: ejecute el siguiente comando en el conmutador virtual después del reinicio que activa la propiedad vsw-relay-mode:
primary# ldm set-vsw vsw-relay-mode=remote primary-vsw0
ID de bug 26047815: en ciertas situaciones de migración entre CPU, se pueden producir los siguientes errores de migración:
API group 0x20b v1.0 is not supported in the version of the firmware running on the target machine. API group 0x214 v1.0 is not supported in the version of the firmware running on the target machine.
Todas las siguientes condiciones deben cumplirse para que se presente este problema:
El dominio tiene la propiedad cpu-arch definida en generic o migration-class1.
El dominio tiene una configuración de la propiedad perf-counter que incluye el valor global.
El dominio se inició en al menos un servidor serie SPARC M7 o un servidor serie SPARC T7.
El equipo de destino es una plataforma anterior al servidor serie SPARC M7 o al servidor serie SPARC T7.
Este problema ocurre porque un dominio iniciado en al menos un servidor serie SPARC M7 o un servidor serie SPARC T7 con una configuración de la propiedad perf-counter que incluye en valor global registrará interfaces de contadores de rendimiento de hipervisor específicas de la plataforma que no existen en plataformas anteriores. Como parte de la migración, se realiza una comprobación para garantizar que todas las interfaces utilizadas por el dominio estén presentes en el equipo de destino. Cuando se detectan estas interfaces específicas del servidor serie SPARC M7 o del servidor serie SPARC T7, la migración se anula.
Solución alternativa: no defina perf-counter=global si cpu-arch no es native y al menos los servidores serie SPARC M7 y SPARC T7 forman parte de la agrupación de migración.
ID de bug 25865708: un dispositivo SES que el SO Oracle Solaris considera como una función secundaria es un tipo de dispositivo SES que vhba no puede admitir. vhba puede admitir un dispositivo SES cuyo tipo de dispositivo tiene un valor de 0xd según se especifica en el campo inq_dtype de la carga útil INQUIRY.
Cuando el vhba binario del dominio invitado intenta inicializar algunos dispositivos de servicios de contenedor de SCSI (SES), vhba hace que scsi emita el siguiente mensaje de advertencia:
... scsi: WARNING: scsi_enumeration_failed: vhba2 probe@w50080e51bfd32004,0,d enumeration failed during tran_tgt_init
La subcadena ,d representa el dígito hexadecimal 0xd, que es el código estándar del sector de SCSI para un dispositivo SES. La cadena ,d indica que este mensaje de advertencia aparece como resultado de un tipo no admitido de dispositivo SES.
vhba puede admitir un dispositivo SES que tiene un tipo de dispositivo de 0xd especificado en el campo inq_dtype de la carga útil INQUIRY.
# mdb -k > ::vsan vsan_t( 6400126e08c0 ) cfg-hdl(0) iport-path(/pci@300/pci@1/pci@0/pci@4/SUNW,emlxs@0,11/fp@0,0) vsan_iport_t( 6400125b8710 ) vsan_tport_t( 64001bf89718 ) tport_phys(w216000c0ff8089d5) vsan_lun_t( 640011aa65d0 ) lun(0) vlun-id(1127b) [] > 640011aa65d0::print vsan_lun_t vl_sd |::print struct scsi_device sd_inq |::print struct scsi_inquiry inq_dtype inq_dtype = d
ID de bug 24393532: la corrección del ID de bug 23591953 desactivó la supervisión de Oracle VM Server for SPARC MIB de Oracle VM Server for SPARC, como la lista de objetos de MIB de Oracle VM Server for SPARC mediante el uso del comando snmpwalk, y la generación de capturas para la tabla ldomHbaTable. Como resultado, la tabla ldomHbaTable de MIB de Oracle VM Server for SPARC no muestra ningún contenido.
primary# snmpwalk -v1 -c public localhost SUN-LDOM-MIB::ldomHbaTable primary#
Solución alternativa: utilice el comando ldm list-hba para ver la información de HBA.
ID de bug 23206413: en circunstancias excepcionales, una migración de dominio correcta informa el siguiente error:
Unable to send suspend request to domain domain-name
Este error se produce cuando el Administrador de dominios lógicos detecta un error mientras se suspende el dominio y el Administrador de dominios lógicos se recupera y completa la migración. El estado de salida del comando es 0, lo cual refleja que la migración se realizó correctamente.
Solución alternativa: debido a que la migración se completa correctamente, puede ignorar el mensaje de error.
ID de bug 23180427: al migrar en frío dominios enlazados que tienen un gran número de dispositivos virtuales, la operación puede fallar con el siguiente mensaje en el log de SMF:
warning: Timer expired: Failed to read feasibility response type (9) from target LDoms Manager
Este fallo indica que el timeout del Administrador de dominios lógicos que se ejecuta en la máquina de origen mientras esperaba a que el dominio se enlazara en la máquina de destino. La probabilidad de que se produzca este problema se incrementa a medida que aumenta el número de dispositivos virtuales en el dominio de migración.
Debido al momento en que aparece este error, se genera una copia enlazada del dominio en la máquina de origen y en la de destino. No inicie ambas copias de este dominio. Esta acción puede dañar los datos porque ambos dominios hacen referencia a los back-ends del mismo disco virtual.
Recuperación: después de comprobar que la copia del dominio migrado sea correcta en la máquina de destino, desenlace manualmente la copia del dominio en la máquina de origen y destrúyala.
ID de bug 23031413: cuando el dominio de control de la máquina de destino se queda sin LDC durante una migración de dominio, se produce un error en la migración que no tiene explicación y se escribe el siguiente mensaje en el log de SMF:
warning: Failed to read feasibility response type (5) from target LDoms Manager
Este error se produce cuando el dominio que se está migrando no se puede enlazar en la máquina de destino. Tenga en cuenta que la operación de enlace también puede fallar en la máquina de destino por otros motivos.
Solución alternativa: para que la migración se realice correctamente, se debe reducir el número de LDC en el dominio que se está migrando o en el dominio de control de la máquina de destino. Puede reducir el número de LDC mediante la reducción del número de dispositivos virtuales que usa o gestiona un dominio. Para obtener más información sobre la gestión de LDC, consulte Using Logical Domain Channels de Guía de administración de Oracle VM Server for SPARC 3.5.
ID de bug 23024583: el comando ovmtlibrary limita el nombre de archivo de imagen de disco a 50 caracteres. El comando ovmtlibrary comprueba el archivo .ovf y compara la información de la sección <ovf:References> con los nombres de archivo reales de los discos descomprimidos.
Se produce un error si los archivos son diferentes o si el nombre de archivo de la imagen de disco tiene más de 50 caracteres. Por ejemplo:
# ovmtlibrary -c store -d "example" -q -o file:/template.ova -l /export/user1/ovmtlibrary_example event id is 3 ERROR: The actual disk image file name(s) or the actual number of disk image(s) is different from OVF file: template.ovf exit code: 1
El siguiente ejemplo de XML muestra un nombre de archivo de imagen de disco de más de 50 caracteres:
<ovf:References> <ovf:File ovf:compression="gzip" ovf:href="disk_image.ldoms3.5_build_s11_u3_sru15_01_kz_42G.img.gz" ovf:id="ldoms3" ovf:size="6687633773"/> </ovf:References>
Solución alternativa: limite la longitud de los nombres de archivo de imagen de disco a menos de 50 caracteres.
ID de bug 22842188: para que linkprop=phys-state se admita en un dispositivo de red virtual, el Administrador de dominios lógicos debe poder validar que el conmutador virtual con el que está conectado el dispositivo de red virtual tenga una NIC física que respalde al conmutador virtual.
El agente netsvc de Oracle VM Server for SPARC debe estar en ejecución en el dominio invitado para que sea posible consultar al conmutador virtual.
Si el dominio invitado no está activo y no se puede comunicar con el agente en el dominio que tiene el conmutador virtual del dispositivo de red virtual, el dispositivo de red virtual no tiene establecido linkprop=phys-state.
Solución alternativa: solo establezca linkprop=phys-state cuando el dominio esté activo.
ID de bug 22828100: si un conmutador virtual tiene conectados dispositivos de red virtual con linkprop=phys-state, el conmutador virtual al que están conectados debe tener un dispositivo NIC válido asociado especificado por la propiedad net-dev. El valor de la propiedad net-dev debe ser el nombre de un dispositivo de red válido.
Si la acción se realiza utilizando net-dev=, el conmutador virtual aún muestra linkprop=phys-state aunque el valor de la propiedad net-dev no sea un dispositivo NIC válido.
Solución alternativa: primero, desconecte todos los dispositivos de red virtual conectados al conmutador virtual y, luego, elimine el conmutador virtual. A continuación, vuelva a crear el conmutador virtual con un dispositivo net-dev válido asociado y luego vuelva a crear todos los dispositivos de red virtual.
ID de bug 21616429: el software de Oracle VM Server for SPARC 3.3 presentó solamente compatibilidad de socket con Servidores Fujitsu M12 y Servidores Fujitsu M10.
El software que se ejecuta en servidores Oracle SPARC y versiones de Oracle VM Server for SPARC anteriores a 3.3 no se puede volver a crear con restricciones de socket desde un archivo XML.
Falla el intento de volver a crear un dominio con restricciones de socket desde un archivo XML con una versión anterior del software Oracle VM Server for SPARC o en un servidor Oracle SPARC con el siguiente mensaje:
primary# ldm add-domain -i ovm3.3_socket_ovm11.xml socket not a known resource
Si se está ejecutando Oracle VM Server for SPARC 3.2 en un Servidor Fujitsu M12 o un Fujitsu M10 Server e intenta volver a crear un dominio con restricciones de socket desde un archivo XML, el comando fallará con varios mensajes de error, como el siguiente:
primary# ldm add-domain -i ovm3.3_socket_ovm11.xml Unknown property: vcpus primary# ldm add-domain -i ovm3.3_socket_ovm11.xml perf-counters property not supported, platform does not have performance register access capability, ignoring constraint setting.
Solución alternativa: edite el archivo XML para eliminar las secciones que hacen referencia al tipo de recurso socket.
ID de bug 21289174: en un servidor SPARC, una zona de núcleo en ejecución en un dominio Oracle VM Server for SPARC bloqueará la migración en directo de un dominio invitado. Se mostrará el siguiente mensaje de error:
Guest suspension failed because Kernel Zones are active. Stop Kernel Zones and retry.
Solución alternativa: opte por una de estas soluciones:
Detenga la ejecución de la zona de núcleo.
# zoneadm -z zonename shutdown
Suspenda la zona de núcleo.
# zoneadm -z zonename suspend
Realice una migración en directo de la zona del núcleo a otro sistema antes de realizar la migración al dominio invitado.
Consulte el Capítulo 3, Migrating an Oracle Solaris Kernel Zone de Creating and Using Oracle Solaris Kernel Zones.
ID de bug 20425271: si se inicia una recuperación después de quedar en factory-default, el modo de recuperación falla si el sistema se inicia desde un dispositivo diferente del que se inició en la configuración que estaba activa anteriormente. Este fallo puede ocurrir si la configuración activa utiliza un dispositivo de inicio distinto del dispositivo de inicio factory-default.
Solución alternativa: realice los siguientes pasos cada vez que desee guardar una nueva configuración del SP.
Determine la ruta PCI completa de acceso al dispositivo de inicio para el dominio primary.
Use esta ruta de acceso para el comando ldm set-var en el paso 4.
Elimine cualquier propiedad de boot-device establecida actualmente del dominio primary.
Solo es necesario llevar a cabo este paso si la propiedad boot-device tiene un juego de valores. Si la propiedad no tiene un juego de valores, intente eliminar los resultados de la propiedad boot-device del mensaje boot-device not found.
primary# ldm rm-var boot-device primary
Guarde la configuración actual en el SP.
primary# ldm add-spconfig config-name
Defina explícitamente la propiedad boot-device para el dominio primary.
primary# ldm set-var boot-device=value primary
Si establece la propiedad boot-device después de guardar la configuración del SP, según se describe, el dispositivo de inicio especificado se inicia cuando se activa el modo de recuperación.
Recuperación: si el modo de recuperación ya ha fallado, según se describe, realice los siguientes pasos:
Defina explícitamente como dispositivo de inicio el dispositivo usado en la última configuración en ejecución.
primary# ldm set-var boot-device=value primary
Reinicie el dominio primary.
primary# reboot
El reinicio permite que la recuperación continúe.
ID de bug 19932842: el intento de definir una variable OBP de un dominio invitado puede fallar si se utiliza el comando eeprom u OBP antes de que se complete uno de los siguientes comandos:
ldm add-spconfig
ldm remove-spconfig
ldm set-spconfig
ldm bind
Este problema puede surgir cuando estos comandos demoran más de 15 segundos en completarse.
# /usr/sbin/eeprom boot-file\=-k promif_ldom_setprop: promif_ldom_setprop: ds response timeout eeprom: OPROMSETOPT: Invalid argument boot-file: invalid property
Recuperación: vuelva a intentar ejecutar el comando eeprom u OBP una vez que la operación ldm haya terminado.
Solución alternativa: vuelva a intentar ejecutar el comando eeprom u OBP en el dominio invitado afectado. Es posible que pueda evitar el problema con el comando ldm set-var en el dominio primary.
ID de bug 19449221: un dominio no puede tener más de 999 dispositivos de red virtual (vnet).
Solución alternativa: limite el número de vnet en un dominio a 999.
ID de bug 18001028: en el dominio raíz, la ruta del dispositivo Oracle Solaris para la función virtual del canal de fibra es incorrecta.
Por ejemplo, el nombre de ruta incorrecto es pci@380/pci@1/pci@0/pci@6/fibre-channel@0,2 mientras que debería ser pci@380/pci@1/pci@0/pci@6/SUNW,emlxs@0,2.
El resultado ldm list-io -l muestra la ruta correcta del dispositivo para las funciones virtuales del canal de fibra.
Solución alternativa: ninguna.
ID de bug 17036795: el sistema operativo Oracle Solaris 11.3 SRU 12 fusionó la funcionalidad de controlador de ssd y sd para dispositivos de canal de fibra en plataformas SPARC.
Este cambio afecta los nombres de nodo de dispositivo en la ruta del dispositivo físico. Los nombres de nodo de dispositivo cambian de ssd@ a disk@. Este cambio también afecta a los enlaces de controlador de dispositivo, que cambian de ssd a sd.
Este cambio no está activado por defecto para los sistemas Oracle Solaris 11.3.
Debe activar este cambio para realizar migraciones en directo de dominios que utilizan dispositivos de canal de fibra y HBA virtuales.
Antes de activar este cambio, asegúrese de que MPxIO ya esté activado mediante la ejecución del comando stmsboot -D fp -e.
Ejecute el comando format para determinar si MPxIO está activado. Cuando está activado, debe ver vhci en los nombres de dispositivo. De manera alternativa, si la salida de mpathadm -list lu está vacía, no se enumeran dispositivos MPxIO.
Use el comando beadm para crear un entorno de inicio (BE) nuevo. Al utilizar entornos de inicio, podrá restaurar fácilmente un entorno de inicio anterior si se producen problemas inesperados.
Monte el entorno de inicio y reemplace el archivo /etc/devices/inception_points por el archivo /etc/devices/inception_points.vhba. El archivo .vhba incluye algunos indicadores de función para activar este cambio.
Finalmente, reinicie después de activar el entorno de inicio nuevo.
# beadm create BE-name # beadm mount BE-name /mnt # cp /mnt/etc/devices/inception_points.vhba /mnt/etc/devices/inception_points # beadm umount BE-name # beadm activate BE-name # reboot
Después de reiniciar, use el comando prtconf -D | grep driver | grep sd para comprobar el cambio.
Si alguno de los discos utiliza el controlador ssd, significa que hay un problema con la configuración.
También puede utilizar el comando mpathadm list lu para mostrar varias rutas a los mismos discos si un HBA virtual y la función virtual de canal de fibra están configurados para ver los mismos LUN.
ID de bug 16979993: al intentar utilizar operaciones de eliminación de SR-IOV dinámicas en un dispositivo InfiniBand, se obtienen como resultado mensajes de error confusos e inadecuados.
Las operaciones de eliminación de SR-IOV dinámica no son compatibles con los dispositivos InfiniBand.
Solución alternativa: elimine las funciones virtuales de InfiniBand mediante uno de los siguientes procedimientos:
ID de bug 16864417: el comando ldm migrate -n no informa un fallo al intentar una migración entre un servidor SPARC T5, SPARC M5 o SPARC M6 y un servidor UltraSPARC T2 o SPARC T3.
Solución alternativa: ninguna.
ID de bug 16691046: si se asignan funciones virtuales desde el dominio raíz, es posible que el dominio de E/S no pueda proporcionar resistencia en las siguientes situaciones de conexión en caliente:
Cuando se agrega un complejo de raíz (bus PCIe) de forma dinámica al dominio raíz y, a continuación, se crean las funciones virtuales y se las asigna al dominio de E/S.
Cuando se agrega en caliente una tarjeta SR-IOV al dominio raíz al que pertenece el complejo de raíz y, a continuación, se crean las funciones virtuales y se las asigna al dominio de E/S.
Cuando se sustituye o se agrega una tarjeta PCIe a una ranura vacía (ya se mediante conexión en caliente o cuando el dominio raíz está desactivado) en el complejo de raíz que pertenece al dominio raíz. Este dominio raíz proporciona funciones virtuales desde el complejo de raíz al dominio de E/S.
Solución alternativa: realice uno de los siguientes pasos:
Si el complejo de raíz ya proporciona funciones virtuales al dominio de E/S y agrega, elimina o sustituye una tarjeta PCIe del complejo de raíz (mediante conexión en caliente o cuando el dominio raíz está desactivado), debe reiniciar el dominio raíz y el dominio de E/S.
Si el complejo de raíz no tiene funciones virtuales asignadas actualmente al dominio de E/S y agrega una tarjeta SR-IOV u otra tarjeta PCIe al complejo de raíz, debe detener el dominio raíz para agregar la tarjeta PCIe. Una vez que se ha reiniciado el dominio de raíz, puede asignar funciones virtuales desde el complejo de raíz al dominio de E/S.
Si desea agregar un nuevo bus PCIe al dominio raíz y, a continuación, crear y asignar funciones virtuales desde el bus al dominio de E/S, lleve a cabo uno de los siguientes pasos y, a continuación, reinicie el dominio raíz:
Agregue el bus durante un reconfiguración retrasada.
Agregue el bus de forma dinámica.
ID de bug 16659506: un dominio invitado está en estado de transición (t) tras un reinicio del dominio primary. Este problema se produce cuando hay una gran cantidad de funciones virtuales configuradas en el sistema.
Solución alternativa: para evitar este problema, vuelva a intentar ejecutar el comando de inicio del disco OBP varias veces para evitar un inicio desde la red.
Realice los siguientes pasos en cada dominio:
Acceda a la consola del dominio.
primary# telnet localhost 5000
Establezca la propiedad boot-device.
ok> setenv boot-device disk disk disk disk disk disk disk disk disk disk net
La cantidad de entradas de disk que especifique como valor de la propiedad boot-device depende de la cantidad de funciones virtuales que haya configuradas en el sistema. En sistemas más pequeños, es posible que pueda incluir menos instancias de disk en el valor de la propiedad.
Verifique que la propiedad boot-device esté establecida correctamente mediante el comando printenv.
ok> printenv
Vuelva a la consola del dominio primary.
Repita los pasos de 1 a 4 para cada dominio del sistema.
Reinicie el dominio primary.
primary# shutdown -i6 -g0 -y
ID de bug 16284767: esta advertencia sobre la consola de Oracle Solaris significa que el suministro de interrupciones se ha agotado mientras se conectan los controladores de los dispositivos de E/S:
WARNING: ddi_intr_alloc: cannot fit into interrupt pool
Esta limitación se aplica solo a los sistemas SPARC admitidos anteriores a los servidores serie SPARC M7 y SPARC T7.
El hardware proporciona una cantidad infinita de interrupciones, de modo que Oracle Solaris limita la cantidad que cada dispositivo puede utilizar. Hay un límite predeterminado diseñado para satisfacer las necesidades de las configuraciones del sistema típicas; sin embargo, este límite puede necesitar un ajuste para determinadas configuraciones del sistema.
Específicamente, es posible que sea necesario ajustar el límite si el sistema está particionado en varios dominios lógicos y si hay demasiados dispositivos de E/S asignados a algún dominio invitado. Oracle VM Server for SPARC divide el total de las interrupciones en pequeños conjuntos proporcionados a los dominios invitados. Si hay demasiados dispositivos de E/S asignados a un dominio invitado, el suministro puede ser demasiado pequeño para proporcionar a cada dispositivo el límite predeterminado de interrupciones. Por lo tanto, el suministro se agota antes de que se conecten completamente todos los controladores.
Algunos controladores proporcionan una rutina de devolución de llamada opcional que le permite a Oracle Solaris ajustar automáticamente sus interrupciones. El límite predeterminado no se aplica a estos controladores.
Solución alternativa: utilice las macros MDB ::irmpools and ::irmreqs para determinar cómo se utilizan las interrupciones. La macro ::irmpools muestra el suministro total de interrupciones dividido en agrupaciones. La macro ::irmreqs muestra los dispositivos asignados a cada agrupación. Para cada dispositivo, ::irmreqs muestra si el límite predeterminado se aplica por una rutina de devolución de llamada opcional, la cantidad de interrupciones solicitadas por cada controlador y la cantidad de interrupciones que recibe el controlador.
Las macros no muestran información sobre los controladores que no se pueden conectar. Sin embargo, la información que se muestra ayuda a calcular la medida hasta la que se puede ajustar el límite predeterminado. Cualquier dispositivo que utiliza más de una interrupción sin proporcionar una rutina de devolución de llamada puede forzarse a utilizar menos interrupciones ajustando el límite predeterminado. La reducción del límite predeterminado por debajo de la cantidad que utiliza el dispositivo puede dar como resultado la liberación de interrupciones que usan otros dispositivos.
Para ajustar el límite predeterminado, establezca la propiedad ddi_msix_alloc_limit en un valor de 1 a 8 en el archivo /etc/system. A continuación, reinicie el sistema para que el cambio surta efecto.
Para maximizar el rendimiento, comience por asignar los mayores valores y reducir los valores en incrementos pequeños hasta que el sistema se inicie correctamente sin advertencias. Use las macros ::irmpools y ::irmreqs para medir el impacto del ajuste en todos los controladores conectados.
Por ejemplo, suponga que las siguientes advertencias se emiten durante el inicio del SO Oracle Solaris en un dominio invitado:
WARNING: emlxs3: interrupt pool too full. WARNING: ddi_intr_alloc: cannot fit into interrupt pool
Las macros ::irmpools y ::irmreqs muestran la siguiente información:
# echo "::irmpools" | mdb -k ADDR OWNER TYPE SIZE REQUESTED RESERVED 00000400016be970 px#0 MSI/X 36 36 36 # echo "00000400016be970::irmreqs" | mdb -k ADDR OWNER TYPE CALLBACK NINTRS NREQ NAVAIL 00001000143acaa8 emlxs#0 MSI-X No 32 8 8 00001000170199f8 emlxs#1 MSI-X No 32 8 8 000010001400ca28 emlxs#2 MSI-X No 32 8 8 0000100016151328 igb#3 MSI-X No 10 3 3 0000100019549d30 igb#2 MSI-X No 10 3 3 0000040000e0f878 igb#1 MSI-X No 10 3 3 000010001955a5c8 igb#0 MSI-X No 10 3 3
El límite predeterminado en este ejemplo es de ocho interrupciones por dispositivo, lo cual no es suficiente para la conexión del dispositivo final emlxs3 con el sistema. Dado que todas las instancias de emlxs se comportan del mismo modo, supone que emlxs3 probablemente solicitó 8 interrupciones.
Al restar las 12 interrupciones utilizadas por todos los dispositivos igb de la agrupación total de 36 interrupciones, quedan 24 interrupciones disponibles para los dispositivos emlxs. La división de las 24 interrupciones por 4 sugiere que 6 interrupciones por dispositivo permitirían que todos los dispositivos emlxs se conecten con el mismo rendimiento. Por lo tanto, el siguiente ajuste se agrega al archivo /etc/system:
set ddi_msix_alloc_limit = 6
Cuando el sistema se inicia correctamente sin advertencias, las macros ::irmpools y ::irmreqs muestran la siguiente información actualizada:
# echo "::irmpools" | mdb -k ADDR OWNER TYPE SIZE REQUESTED RESERVED 00000400018ca868 px#0 MSI/X 36 36 36 # echo "00000400018ca868::irmreqs" | mdb -k ADDR OWNER TYPE CALLBACK NINTRS NREQ NAVAIL 0000100016143218 emlxs#0 MSI-X No 32 8 6 0000100014269920 emlxs#1 MSI-X No 32 8 6 000010001540be30 emlxs#2 MSI-X No 32 8 6 00001000140cbe10 emlxs#3 MSI-X No 32 8 6 00001000141210c0 igb#3 MSI-X No 10 3 3 0000100017549d38 igb#2 MSI-X No 10 3 3 0000040001ceac40 igb#1 MSI-X No 10 3 3 000010001acc3480 igb#0 MSI-X No 10 3 3
ID de bug 16068376: en un servidor SPARC T5-8 con aproximadamente 128 dominios, es posible que algunos comandos ldm, como ldm list, muestren 0 segundos como el tiempo de actividad para todos los dominios.
Solución alternativa: inicie sesión en el dominio y utilice el comando uptime para determinar el tiempo de actividad del dominio.
ID de bug 15819714: en algunas circunstancias poco comunes, el comando ldm list -o status informa un porcentaje de finalización incorrecto cuando se utiliza para observar el estado de una migración en un dominio de control.
Este problema no afecta a los dominios que se migran ni a los daemons de ldmd en los dominios de control de origen o destino.
Solución alternativa: ejecute el comando ldm list -o status en el otro dominio de control que está presente en la migración para observar el progreso.
ID de bug 15783031: puede experimentar problemas al usar el comando ldm init-system para restaurar una configuración de dominio que ha utilizado operaciones de E/S directa o SR-IOV.
Surge un problema si una o más de las siguientes operaciones se han realizado en la configuración que se va a restaurar:
Una ranura se ha eliminado de un bus que sigue siendo propiedad del dominio primary.
Una función virtual se ha creado a partir de una función física que es propiedad del dominio primary.
Una función virtual se ha asignado al dominio primary, a otros dominios invitados, o a ambos.
Un complejo raíz se ha eliminado del dominio primary y se ha asignado a un dominio invitado, y se utiliza como base para otras operaciones de virtualización de E/S.
Es decir, ha creado un dominio raíz que no es primary y ha realizado alguna de las operaciones anteriores.
Si realizó cualquiera de las acciones anteriores, lleve a cabo la solución alternativa que se muestra en Funciones SR-IOV y de E/S directa de PCIe de Oracle VM Server for SPARC (ID de documento 1325454.1) (https://support.oracle.com/epmos/faces/SearchDocDisplay?amp;_adf.ctrl-state=10c69raljg_77&_afrLoop=506200315473090).
ID de bug 15776123: si el comando cputrack se ejecuta en un dominio invitado mientras ese dominio se migra a un servidor SPARC T4, es posible que se produzca un aviso grave en el dominio invitado de la máquina de destino tras la migración.
Solución alternativa: no ejecute el comando cputrack durante la migración de un dominio invitado a un servidor SPARC T4.
ID de bug 15775637: un dominio de E/S tiene un límite para el número de recursos de interrupción disponibles por cada complejo de raíz.
En los servidores SPARC T3 y SPARC T4, el límite es de aproximadamente 63 vectores MSI/X. Cada función virtual igb utiliza tres interrupciones. La función virtual ixgbe utiliza dos interrupciones.
Si asigna una gran cantidad de funciones virtuales a un dominio, se agotan los recursos del sistema del dominio necesarios para admitir estos dispositivos. Aparecerán mensajes similares a los siguientes:
WARNING: ixgbevf32: interrupt pool too full. WARNING: ddi_intr_alloc: cannot fit into interrupt pool
ID de bug 15771384: la consola invitada de un dominio puede detenerse si se realizan intentos reiterados de conectarse a la consola antes y durante el momento en que la consola se enlaza. Por ejemplo, esto puede suceder si utiliza una secuencia de comandos automatizada para capturar la consola como un dominio que se migra en el equipo.
Solución alternativa: para activar la consola, ejecute los siguientes comandos en el dominio que aloja al concentrador de la consola del dominio (normalmente el dominio de control):
primary# svcadm disable vntsd primary# svcadm enable vntsd
ID de bug 15761509: utilice solo tarjetas PCIe que admiten la función de E/S directa. Estas tarjetas se enumeran en support document (https://support.oracle.com/CSP/main/article?cmd=show&type=NOT&doctype=REFERENCE&id=1325454.1).
Solución alternativa: utilice el comando ldm add-io para agregar la tarjeta al dominio primary.
ID de bug 15701865: si intenta realizar una migración en directo de un dominio que depende de un dominio inactivo en el equipo de destino, se produce un error de segmentación en el daemon ldmd y se produce un bloqueo. El daemon ldmd se reinicia automáticamente, pero la migración se anula.
Solución alternativa: lleve a cabo una de las siguientes acciones antes de intentar la migración en directo:
Elimine la dependencia de invitado del dominio que se va a migrar.
Inicie el dominio maestro en el equipo de destino.
ID de bug 15701853: es posible que aparezca el mensaje No response en el log de Oracle VM Server for SPARC cuando la política DRM de un dominio cargado caduca una vez que el recuento de CPU se ha reducido significativamente. La salida del comando ldm list muestra que hay más recursos de CPU asignados al dominio de los que se muestran en la salida de psrinfo.
Solución alternativa: utilice el comando ldm set-vcpu para restablecer el número de CPU del dominio al valor que se muestra en el resultado de psrinfo.
ID de bug 15696986: si dos comandos ldm migrate se ejecutan de forma simultánea entre los dos sistemas en “dirección opuesta”, es posible que los dos comandos se bloqueen y que nunca se completen. Se presenta una situación de dirección opuesta cuando se inicia simultáneamente una migración en el equipo A para el equipo B y una migración en el equipo B para el equipo A.
El bloqueo se produce incluso si los procesos de migración se inician como ejecuciones simuladas mediante la opción –n. Cuando se produce este problema, se pueden bloquear todos los demás comandos ldm.
Recuperación: reinicie el Administrador de dominios lógicos en el equipo de origen y el de destino:
primary# svcadm restart ldmd
Solución alternativa: ninguna.
ID de bug 15668368: un servidor SPARC T3-1 se puede instalar con discos de dos puertos, a los que se puede acceder mediante dos dispositivos de E/S directa diferentes. En este caso, asignar estos dos dispositivos de E/S directa a dominios diferentes puede provocar que los discos se utilicen en ambos dominios y que se vean afectados en función del uso real de esos discos.
Solución alternativa: no asigne dispositivos de E/S directa con acceso al mismo conjunto de discos a diferentes dominios de E/S. Para determinar si tiene discos de dos puertos en el servidor SPARC T3-1, ejecute el siguiente comando en el SP:
-> show /SYS/SASBP
Si el resultado incluye el valor fru_description siguiente, el sistema correspondiente tiene discos de dos puertos:
fru_description = BD,SAS2,16DSK,LOUISE
Si se encuentran discos de dos puertos en el sistema, asegúrese de que estos dos dispositivos de E/S directa estén siempre asignados al mismo dominio:
pci@400/pci@1/pci@0/pci@4 /SYS/MB/SASHBA0 pci@400/pci@2/pci@0/pci@4 /SYS/MB/SASHBA1
ID de bug 15664666: cuando se crea una dependencia de restablecimiento, el comando ldm stop -a puede generar que se reinicie un dominio con una dependencia de restablecimiento en lugar de que solo se detenga.
Solución alternativa: en primer lugar, ejecute el comando ldm stop en el dominio maestro. Luego, ejecute el comando ldm stop en el dominio esclavo. Si la detención inicial del dominio esclavo genera un error, ejecute el comando ldm stop -f en el dominio esclavo.
ID de bug 15600969: si todas las unidades criptográficas del hardware se eliminan dinámicamente de un dominio en ejecución, la estructura criptográfica no puede cambiar a los proveedores de software criptográficos y se terminan todas las conexiones ssh.
Este problema solo se aplica a servidores UltraSPARC T2, UltraSPARC T2 Plus y SPARC T3.
Recuperación: vuelva a establecer las conexiones ssh una vez que todas las unidades criptográficas se hayan eliminado del dominio.
Solución alternativa: establezca UseOpenSSLEngine=no en el archivo /etc/ssh/sshd_config del servidor y ejecute el comando svcadm restart ssh.
Todas las conexiones ssh ya no utilizarán las unidades criptográficas de hardware (y, por lo tanto, no se beneficiarán de las mejoras de rendimiento relacionadas) y las conexiones ssh no se desconectarán cuando se eliminen dichas unidades.
ID de bug 15518409: si no tiene una red configurada en el equipo y hay un cliente del servicio de información de red (NIS) en ejecución, el Administrador de dominios lógicos no se iniciará en el sistema.
Solución alternativa: desactive el cliente NIS en el equipo no conectado a la red:
# svcadm disable nis/client
ID de bug 15513998: en ocasiones, después de que un dominio se ha migrado, no es posible conectarse a la consola de ese dominio.
Tenga en cuenta que este problema se produce cuando el dominio migrado ejecuta una versión de SO posterior a Oracle Solaris 11.3.
Solución alternativa: reinicie el servicio SMF vntsd para desactivar las conexiones con la consola:
# svcadm restart vntsd
ID de bug 15453968: la instalación en red simultánea de varios dominios invitados no se realiza correctamente en los sistemas que tienen un grupo de consolas común.
Solución alternativa: solo realice una instalación en red de dominios invitados que tengan su propio grupo de consolas. Este error solo se observa en dominios que comparten un grupo de consolas común entre varios dominios de instalación en red.
ID de bug 15368170: en algunos casos, el comportamiento del comando ldm stop-domain puede resultar confuso.
# ldm stop-domain -f domain-name
Si el dominio se encuentra en el indicador del depurador del módulo de núcleo, kmdb(1), se produce el siguiente mensaje de error al ejecutar el comando ldm stop-domain:
LDom <domain-name> stop notification failed
En esta sección, se incluyen los problemas y errores de la documentación de la versión Oracle VM Server for SPARC 3.5 que se han encontrado demasiado tarde para resolverlos.
Estos cambios no se reflejan en las páginas del comando man entregadas con el software de Oracle VM Server for SPARC 3.5 ni en la versión en japonés de Oracle VM Server for SPARC 3.5 Reference Manual, en OTN.
En la página del comando man ldmd(1M) falta la siguiente descripción de la propiedad de SMF ldmd/migration_adi_legacy_compat:
Especifica si se debe permitir una migración de dominio entre servidores que admiten Silicon Secured Memory (SSM) aunque uno de los equipos no sea compatible con la migración de la información sobre la versión de la integridad de datos de aplicaciones (ADI) que se introduce en Oracle VM Server for SPARC 3.5.
Si el equipo de origen y el de destino están ejecutando las versiones más recientes del software de Oracle VM Server for SPARC, no es necesario que utilice esta propiedad de SMF.
![]() | Precaución - Si desea realizar una migración de dominio en los servidores que admiten SSM, lo más recomendable es que ejecuten al menos el software de Oracle VM Server for SPARC 3.5. Si esto no es posible, tenga especial cuidado al usar la propiedad de SMF ldmd/migration_adi_legacy_compat. El uso incorrecto de esta propiedad puede tener como resultado un comportamiento indefinido de la aplicación si ADI está en uso en el dominio que se está migrando. |
Por defecto, el valor de la propiedad es false, lo que impide una migración de dominio, a menos que tanto el equipo de origen como el de destino admitan SSM y ejecuten la versión necesaria del software de Oracle VM Server for SPARC. Esta propiedad no afecta a los servidores que no admiten SSM.
Cuando el valor es true, la migración de dominio continúa sin admitir la migración de la información sobre la versión de ADI.
Por lo tanto, si el equipo de origen o el equipo de destino ejecuta una versión del software de Oracle VM Server for SPARC que es anterior a la versión 3.5, que no admite la migración de la información sobre la versión de ADI, la migración se permite.
Solo defina el valor de la propiedad de SMF ldmd/migration_adi_legacy_compat en true si se cumplen las dos circunstancias que se describen a continuación:
No puede actualizar el equipo de origen y el equipo de destino a una versión del software de Oracle VM Server for SPARC que admita la migración de la información sobre la versión de ADI.
Está seguro de que el control de versiones de ADI no está en uso en el dominio que se va a migrar.
Al definir esta propiedad en true se permiten las migraciones en que la información sobre la versión de ADI no se transfiere al equipo de destino. Esta situación puede tener como resultado un comportamiento indefinido de la aplicación si ADI está en uso en el dominio que se está migrando.
Las versiones de Oracle VM Server for SPARC anteriores a la versión 3.5 no reconocen la propiedad de SMF ldmd/migration_adi_legacy_compat. El uso de esta propiedad es aplicable únicamente en un equipo de origen o un equipo de destino que ejecute al menos Oracle VM Server for SPARC 3.5.
La página del comando man ldm(1M) incluye las siguientes actualizaciones:
El nuevo texto del primer párrafo es el siguiente:
El subcomando set-domain le permite modificar las propiedades, como boot-policy, mac-addr, hostid, failure-policy, extended-mapin-space, master y max-cores de cada dominio. No puede usar este comando para actualizar recursos.
La nueva descripción de la opción –i es la siguiente:
–i file especifica el archivo de configuración XML que se debe usar al definir las propiedades del dominio lógico.
Solo los nodos ldom_info especificados en el archivo XML se analizan. Los nodos de recursos, como vcpu, mau y memory se ignoran.
Si la propiedad hostid del archivo XML ya está en uso, se produce el siguiente mensaje de error al ejecutar el comando ldm set-domain -i:
Hostid host-ID is already in use
Antes de volver a ejecutar el comando ldm set-domain -i, elimine la entrada hostid del archivo XML.
La página del comando man ldm(1M) hace referencia de manera incorrecta a un buffer de historial de comandos que puede ver mediante el comando ldm list-history.
El primero y el segundo párrafos de la sección Historial de comandos se actualizaron con los siguientes párrafos:
Use el comando ldm list-history para ver el log de historial de comandos de Oracle VM Server for SPARC. Este log captura los comandos ldm que se ejecutan por medio de la interfaz XMPP. Por defecto, el número de comandos que muestra el comando ldm list-history es diez.
Para cambiar el número de salida de los comandos por el comando ldm list-history, use el comando ldm set-logctl para definir el valor de la propiedad history. Si define history=0, se desactiva el guardado del historial de comandos. Puede volver a activar esta función al definir la propiedad history en un valor distinto de cero.
La descripción de la propiedad history en la sección Operaciones de registro de control se actualizó como se indica a continuación:
history=num especifica el número de salida de los comandos por el comando ldm list-history. Al definir el valor en 0 se desactiva el guardado del historial de comandos.
La descripción de la opción –a en la sección Visualizar capacidades de registro se actualizó como se indica a continuación:
–a muestra los valores de capacidad de registro para todos los tipos de registro y el número de salida de los comandos por el comando ldm list-history.