Notas da versão Oracle Solaris 10 9/10

Capítulo 3 Problemas específicos do sistema

Este capítulo descreve problemas específicos de servidores Sun de médio porte e servidores de ponta. Os servidores Sun atuais são parte da família do sistema Sun Fire. Servidores antigos são parte da família do sistema Sun Enterprise.


Observação –

As notas da versão do conjunto de teste de validação Sun são agora documentos separados e podem ser encontrados em http://www.sun.com/.


Reconfiguração dinâmica em sistemas de ponta do Oracle Sun Fire

Esta seção descreve os maiores erros DR do lado do domínio em sistemas de ponta Sun Fire que executam o software Oracle Solaris 10:

Para informação sobre erros DR em serviços de gerenciamento Sun, consulte as Notas de versão SMS para a versão SMS que está em execução no seu sistema.


Observação –

Esta informação se aplica apenas à DR quando está em execução nos servidores listados nesta seção. Para informação sobre DR em outros servidores, consulte as Notas da versão, Documentos de notas do produto ou seções que descrevem estes servidores.


Softwares conhecidos e erros de hardware

Os erros de software e hardware a seguir se aplicam aos sistemas de ponta do Sun Fire.

O GigaSwift Ethernet MMF Link falha com o switch CISCO 4003 depois de anexação do DR

O vínculo entre um sistema com um Sun GigaSwift Ethernet MMF Option X1151A e certos switches CISCO falha. A falha ocorre quando se tenta executar uma operação DR em um sistema que está anexado a um dos switches a seguir:

Este problema não é visto em um switch CISCO 6509.

Solução alternativa: utilize outro switch. Alternativamente, é possível consultar a Cisco para um patch para os switches listados.

Reconfiguração dinâmica em sistemas de médio porte do Oracle Sun Fire

Esta seção descreve problemas principais que são relacionados ao DR nos sistemas de médio porte Sun Fire a seguir:


Observação –

Esta informação se aplica apenas à DR quando está em execução nos servidores listados nesta seção. Para informação sobre DR em outros servidores, consulte as Notas da versão, Documentos de notas do produto ou seções que descrevem estes servidores.


Firmware do controlador do sistema mínimo

Tabela 3–1 mostra as combinações aceitáveis do software Oracle Solaris e firmware do Controlador do sistema (SC) para cada sistema de médio porte Sun Fire a executar o DR.


Observação –

Para melhor utilizar os últimos recursos de firmware e erros resolvidos, execute o firmware SC mais recente no sistema de médio porte Sun Fire. Para informações mais recentes do patch, consulte http://sunsolve.sun.com.


Tabela 3–1 Firmware SC mínimo para cada plataforma e versão Oracle Solaris

Plataforma 

Versão Oracle Solaris 

Firmware SC mínimo  

Sun Fire E6900/E4900 com UltraSPARC IV+ 

Solaris 10 3/05 HW1 (versão limitada) ou Solaris 10 1/06 

5.19.0 

E6900/E4900 sem UltraSPARC IV+ 

Solaris 9 4/04 

5.16.0 

Sun Fire 6800/4810/4800/3800 

Solaris 9 4/04 

5.16.0 

Sun Fire 6800/4810/4800/3800 

Solaris 9 

5.13.0 

É possível atualizar o firmware do sistema para o sistema de médio porte Sun Fire ao conectar a um servidor FTP ou HTTP onde as imagens do firmware são armazenadas. Para mais informações, recorra aos arquivos LEIAME e Install.info. Estes arquivos estão incluídos nas versões do firmware que estão executando no domínio. É possível baixar os patches Sun em http://sunsolve.sun.com.

Erros conhecidos do software DR

Esta seção lista erros importantes do DR.

O removedor de dispositivos de rede falha quando um programa está mantendo o dispositivo aberto (5054195)

Se um processo estiver mantendo aberto um dispositivo de rede, qualquer operação DR que envolver este dispositivo falha. Daemons e processos que mantêm contagem de referência param a conclusão das operações DR.

Solução alternativa: como superusuário, efetue os passos a seguir:

  1. Remova ou renomeie o diretório /rplboot.

  2. Desligue os serviços NFS.


    # sh /etc/init.d/nfs.server stop
    
  3. Desligue os serviços do Servidor de inicialização.


    # sh /etc/init.d/boot.server stop
    
  4. Efetue a operação de desanexação do DR.

  5. Reinicie os serviços NFS.


    # sh /etc/init.d/nfs.server start
    
  6. Reinicie os serviços do Servidor de inicialização.


    # sh /etc/init.d/boot.server start
    

Notas da versão Sun Enterprise 10000

Esta seção descreve problemas que envolvem os seguintes recurso no servidor Sun Enterprise 10000:


Observação –

O software Oracle Solaris 10 pode ser executado em domínios individuais dentro de um sistema Sun Enterprise 10000. No entanto, o Processador de serviço do sistema Sun Enterprise 10000 não é suportado por esta versão.


Requisitos do Processador de serviço do sistema

O software SSP 3.5 é necessário no Processador de serviço do sistema (SSP) para suportar o software Oracle Solaris 10. Instale o SSP 3.5 no SSP primeiro. Então, é possível instalar e atualizar para o sistema operacional Oracle Solaris 10 em um domínio Sun Enterprise 10000.

O software SSP 3.5 também é necessário para que o domínio possa ser configurado adequadamente para o modelo DR 3.0.

Problemas de reconfiguração dinâmica

Esta seção descreve problemas diferentes que envolvem a reconfiguração dinâmica em domínios Sun Enterprises 10000.

Modelo DR 3.0

Utilize o DR 3.0 em domínios Sun Enterprise 10000 que executam o sistema operacional Oracle Solaris iniciando com a versão Solaris 9 12/03. O modelo DR 3.0 refere-se à funcionalidades que utilizam os comandos em SSP para efetuar as seguintes operações de domínio DR:

É possível executar o comando cfgadm em domínios para obter informação do status da placa. O modelo DR 3.0 também interage com o Reconfiguration Coordination Manager (RCM) para coordenar as operações DR com outros aplicativos que estão sendo executados em um domínio.

Para detalhes sobre o modelo DR 3.0, refira-se ao Sun Enterprise 10000 Dynamic Reconfiguration User Guide.

DR e processos de usuários vinculado

Para esta versão Oracle Solaris, o DR não desvincula mais automaticamente os processos de usuários das CPUs que estão sendo desanexados. Efetue esta operação antes de iniciar uma sequência de desanexação. A operação de drenagem falha se as CPUs se encontram com o processos vinculados.

O removedor de dispositivos de rede falha quando um programa está mantendo o dispositivo aberto (5054195)

Se um processo estiver mantendo aberto um dispositivo de rede, qualquer operação DR que envolver este dispositivo falha. Daemons e processos que mantêm contagem de referência param a conclusão das operações DR.

Solução alternativa: como superusuário, efetue os passos a seguir:

  1. Remova ou renomeie o diretório /rplboot.

  2. Desligue os serviços NFS.


    # sh /etc/init.d/nfs.server stop
    
  3. Desligue os serviços do Servidor de inicialização.


    # sh /etc/init.d/boot.server stop
    
  4. Efetue a operação de desanexação do DR.

  5. Reinicie os serviços NFS.


    # sh /etc/init.d/nfs.server start
    
  6. Reinicie os serviços do Servidor de inicialização.


    # sh /etc/init.d/boot.server start
    

Redes InterDomain

Para um domínio se tornar parte de uma rede InterDomain, todas as placas com memória ativa no domínio devem ter pelo menos uma CPU ativa.

Variáveis do PROM OpenBoot

Antes de emitir o comando boot net do prompt do PROM OpenBoot (OK), verifique se a variável local-mac-address? está configurada para false. Esta configuração é a configuração padrão de fábrica. Se a variável está configurada para true, assegure-se de que este valor seja uma configuração local apropriada.


Cuidado – Cuidado –

Um local-mac-address? que está configurado para true pode impedir o domínio de inicializar com com êxito através da rede.


Em uma janela netcon, é possível utilizar o comando a seguir no prompt PROM OpenBoot para exibir valores das variáveis do PROM OpenBoot:


OK printenv

Para redefinir a variável local-mac-address? para a configuração padrão. utilize o comando setenv:


OK setenv local-mac-address? false

Reconfiguração dinâmica em sistemas de médio porte Oracle Sun Enterprise

Esta seção contém as informações mais recentes sobre a funcionalidade dynamic reconfiguration (DR) para os servidores de médio porte que estão executando o software Oracle Solaris 10:

Para mais informações sobre a Reconfiguração dinâmica do servidor Sun Enterprise, refira-se ao Guia do usuário para reconfiguração dinâmica para sistemas Sun Enterprise 3x00/4x00/5x00/6x00. A versão Oracle Solaris 10 inclui suporte a toda CPU/placas de memória e para a maioria das placas de E/S nos sistemas que foram mencionados na lista anterior.

Hardware suportado

Antes de prosseguir, tenha certeza de que o sistema suporta a reconfiguração dinâmica. Se o sistema estiver em um outro design, a mensagem a seguir aparece no console ou no console de logs. Tal sistema não é apropriado para a reconfiguração dinâmica.


Hot Plug not supported in this system

As placas de E/S a seguir não são atualmente suportadas:

Notas do software

Esta seção fornece informações gerais de software sobre o DR.

Ativando a reconfiguração dinâmica

Para ativar a reconfiguração dinâmica, configure duas variáveis no arquivo /etc/system. Defina também uma variável adicional para permitir a remoção da CPU/placas de memória. Realize os passos seguintes:

  1. Efetue logon como superusuário.

  2. Edite o arquivo /etc/system adicionando a linhas a seguir:


    set pln:pln_enable_detach_suspend=1
    set soc:soc_enable_detach_suspend=1
    
  3. Para ativar a remoção de uma CPU/placa de memória, adicione esta linha ao arquivo:


    set kernel_cage_enable=1
    

    Configurando esta variável, é ativada a operação de desconfiguração da memória.

  4. Reinicialize o sistema para aplicar as alterações.

Teste de quiesce

Inicie o teste de quiesce com o comando a seguir:


 # cfgadm -x quiesce-test sysctr10:slot number

Em sistemas grandes, o teste de quiesce pode executar por até um minuto. Durante este tempo, nenhuma mensagem é exibida se o cfgadm não encontrar drivers incompatíveis.

Lista de placas desativadas

Tentar conectar um placa que está na lista de placas desativadas pode produzir uma mensagem de erro:


# cfgadm -c connect sysctrl0:slotnumber







cfgadm: Hardware specific failure: connect failed:
board is disabled: must override with [-f][-o enable-at-boot]

Para ignorar a condição de desativada, duas opções estão disponíveis:

Para remover todas as placas da lista de placas desativadas, escolha uma de duas opções, dependendo do prompt o qual o comando é emitido:

Para mais informação sobre a configuração disabled-board-list, refira-se à seção “Variáveis NVRAM específicas” no manual Notas de plataforma: sistemas Sun Enterprise 3x00, 4x00, 5x00 e 6x00. Este manual é parte do conjunto de documentação nesta versão.

Lista de memória desativada

Informação sobre a configuração PROM OpenBoot disabled-memory-list é publicada nesta versão. Consulte o “Variáveis NVRAM específicas” em Notas de plataforma: sistemas Sun Enterprise 3x00, 4x00, 5x00 e 6x00 na documentação Oracle Solaris, em hardware Sun.

Descarregando drivers desanexados sem segurança

Se necessitar descarregar drivers desanexados sem segurança, utilize a linha de comando modinfo para encontrar os módulos IDs dos drivers. É possível utilizar os módulos IDs no comando modunload para descarregar os drivers desanexados sem segurança.

Falha de autoteste durante uma sequência de conexão

Remova a placa do sistema assim que a mensagem de erro for exibida durante uma sequência de conexão da DR:


cfgadm: Hardware specific failure: connect failed: firmware operation error

O autoteste da placa falhou, e remover a placa evita erros de reconfiguração que podem ocorrer durante a próxima reinicialização.

O status do autoteste falho não permite mais operações. Além disso, se desejar repetir a operação falha imediatamente, é necessário primeiro remover a placa e depois reinserí-la.

Erros conhecidos

A lista a seguir é sujeita a alterações a qualquer momento.

O removedor de dispositivos de rede falha quando um programa está mantendo o dispositivo aberto (5054195)

Se um processo estiver mantendo aberto um dispositivo de rede, qualquer operação DR que envolver este dispositivo falha. Daemons e processos que mantêm contagem de referência param a conclusão das operações DR.

Solução alternativa: como superusuário, efetue os passos a seguir:

  1. Remova ou renomeie o diretório /rplboot.

  2. Desligue os serviços NFS.


    # sh /etc/init.d/nfs.server stop
    
  3. Desligue os serviços do Servidor de inicialização.


    # sh /etc/init.d/boot.server stop
    
  4. Efetue a operação de desanexação do DR.

  5. Reinicie os serviços NFS.


    # sh /etc/init.d/nfs.server start
    
  6. Reinicie os serviços do Servidor de inicialização.


    # sh /etc/init.d/boot.server start