Este capítulo descreve problemas específicos de servidores Sun de médio porte e servidores de ponta. Os servidores Sun atuais são parte da família do sistema Sun Fire. Servidores antigos são parte da família do sistema Sun Enterprise.
As notas da versão do conjunto de teste de validação Sun são agora documentos separados e podem ser encontrados em http://www.sun.com/.
Esta seção descreve os maiores erros DR do lado do domínio em sistemas de ponta Sun Fire que executam o software Oracle Solaris 10:
Sun Fire 25K
Sun Fire 20K
Sun Fire 15K
Sun Fire 12K
Para informação sobre erros DR em serviços de gerenciamento Sun, consulte as Notas de versão SMS para a versão SMS que está em execução no seu sistema.
Esta informação se aplica apenas à DR quando está em execução nos servidores listados nesta seção. Para informação sobre DR em outros servidores, consulte as Notas da versão, Documentos de notas do produto ou seções que descrevem estes servidores.
Os erros de software e hardware a seguir se aplicam aos sistemas de ponta do Sun Fire.
O vínculo entre um sistema com um Sun GigaSwift Ethernet MMF Option X1151A e certos switches CISCO falha. A falha ocorre quando se tenta executar uma operação DR em um sistema que está anexado a um dos switches a seguir:
Switch CISCO WS-c4003 (f/w: WS-C4003 Software, Versão NmpSW: 4.4(1))
Switch CISCO WS-c4003 (f/w: WS-C4003 Software, Versão NmpSW: 7.1(2))
Switch CISCO WS-c5500 (f/w: WS-C5500 Software, Versão McpSW: 4.2(1) e NmpSW: 4.2(1))
Este problema não é visto em um switch CISCO 6509.
Solução alternativa: utilize outro switch. Alternativamente, é possível consultar a Cisco para um patch para os switches listados.
Esta seção descreve problemas principais que são relacionados ao DR nos sistemas de médio porte Sun Fire a seguir:
Sun Fire E6900
Sun Fire E4900
Sun Fire E6800
Sun Fire E4810
Sun Fire E4800
Sun Fire E3800
Esta informação se aplica apenas à DR quando está em execução nos servidores listados nesta seção. Para informação sobre DR em outros servidores, consulte as Notas da versão, Documentos de notas do produto ou seções que descrevem estes servidores.
Tabela 3–1 mostra as combinações aceitáveis do software Oracle Solaris e firmware do Controlador do sistema (SC) para cada sistema de médio porte Sun Fire a executar o DR.
Para melhor utilizar os últimos recursos de firmware e erros resolvidos, execute o firmware SC mais recente no sistema de médio porte Sun Fire. Para informações mais recentes do patch, consulte http://sunsolve.sun.com.
Plataforma |
Versão Oracle Solaris |
Firmware SC mínimo |
---|---|---|
Sun Fire E6900/E4900 com UltraSPARC IV+ |
Solaris 10 3/05 HW1 (versão limitada) ou Solaris 10 1/06 |
5.19.0 |
E6900/E4900 sem UltraSPARC IV+ |
Solaris 9 4/04 |
5.16.0 |
Sun Fire 6800/4810/4800/3800 |
Solaris 9 4/04 |
5.16.0 |
Sun Fire 6800/4810/4800/3800 |
Solaris 9 |
5.13.0 |
É possível atualizar o firmware do sistema para o sistema de médio porte Sun Fire ao conectar a um servidor FTP ou HTTP onde as imagens do firmware são armazenadas. Para mais informações, recorra aos arquivos LEIAME e Install.info. Estes arquivos estão incluídos nas versões do firmware que estão executando no domínio. É possível baixar os patches Sun em http://sunsolve.sun.com.
Esta seção lista erros importantes do DR.
Se um processo estiver mantendo aberto um dispositivo de rede, qualquer operação DR que envolver este dispositivo falha. Daemons e processos que mantêm contagem de referência param a conclusão das operações DR.
Solução alternativa: como superusuário, efetue os passos a seguir:
Remova ou renomeie o diretório /rplboot.
Desligue os serviços NFS.
# sh /etc/init.d/nfs.server stop |
Desligue os serviços do Servidor de inicialização.
# sh /etc/init.d/boot.server stop |
Efetue a operação de desanexação do DR.
Reinicie os serviços NFS.
# sh /etc/init.d/nfs.server start |
Reinicie os serviços do Servidor de inicialização.
# sh /etc/init.d/boot.server start |
Esta seção descreve problemas que envolvem os seguintes recurso no servidor Sun Enterprise 10000:
Requisitos do Processador de serviço do sistema
Reconfiguração dinâmica (DR)
Rede de InterDomain (IDNs)
O sistema operacional Oracle Solaris nos domínios Sun Enterprise 10000
O software Oracle Solaris 10 pode ser executado em domínios individuais dentro de um sistema Sun Enterprise 10000. No entanto, o Processador de serviço do sistema Sun Enterprise 10000 não é suportado por esta versão.
O software SSP 3.5 é necessário no Processador de serviço do sistema (SSP) para suportar o software Oracle Solaris 10. Instale o SSP 3.5 no SSP primeiro. Então, é possível instalar e atualizar para o sistema operacional Oracle Solaris 10 em um domínio Sun Enterprise 10000.
O software SSP 3.5 também é necessário para que o domínio possa ser configurado adequadamente para o modelo DR 3.0.
Esta seção descreve problemas diferentes que envolvem a reconfiguração dinâmica em domínios Sun Enterprises 10000.
Utilize o DR 3.0 em domínios Sun Enterprise 10000 que executam o sistema operacional Oracle Solaris iniciando com a versão Solaris 9 12/03. O modelo DR 3.0 refere-se à funcionalidades que utilizam os comandos em SSP para efetuar as seguintes operações de domínio DR:
addboard
moveboard
deleteboard
showdevices
rcfgadm
É possível executar o comando cfgadm em domínios para obter informação do status da placa. O modelo DR 3.0 também interage com o Reconfiguration Coordination Manager (RCM) para coordenar as operações DR com outros aplicativos que estão sendo executados em um domínio.
Para detalhes sobre o modelo DR 3.0, refira-se ao Sun Enterprise 10000 Dynamic Reconfiguration User Guide.
Para esta versão Oracle Solaris, o DR não desvincula mais automaticamente os processos de usuários das CPUs que estão sendo desanexados. Efetue esta operação antes de iniciar uma sequência de desanexação. A operação de drenagem falha se as CPUs se encontram com o processos vinculados.
Se um processo estiver mantendo aberto um dispositivo de rede, qualquer operação DR que envolver este dispositivo falha. Daemons e processos que mantêm contagem de referência param a conclusão das operações DR.
Solução alternativa: como superusuário, efetue os passos a seguir:
Remova ou renomeie o diretório /rplboot.
Desligue os serviços NFS.
# sh /etc/init.d/nfs.server stop |
Desligue os serviços do Servidor de inicialização.
# sh /etc/init.d/boot.server stop |
Efetue a operação de desanexação do DR.
Reinicie os serviços NFS.
# sh /etc/init.d/nfs.server start |
Reinicie os serviços do Servidor de inicialização.
# sh /etc/init.d/boot.server start |
Para um domínio se tornar parte de uma rede InterDomain, todas as placas com memória ativa no domínio devem ter pelo menos uma CPU ativa.
Antes de emitir o comando boot net do prompt do PROM OpenBoot (OK), verifique se a variável local-mac-address? está configurada para false. Esta configuração é a configuração padrão de fábrica. Se a variável está configurada para true, assegure-se de que este valor seja uma configuração local apropriada.
Um local-mac-address? que está configurado para true pode impedir o domínio de inicializar com com êxito através da rede.
Em uma janela netcon, é possível utilizar o comando a seguir no prompt PROM OpenBoot para exibir valores das variáveis do PROM OpenBoot:
OK printenv |
Para redefinir a variável local-mac-address? para a configuração padrão. utilize o comando setenv:
OK setenv local-mac-address? false |
Esta seção contém as informações mais recentes sobre a funcionalidade dynamic reconfiguration (DR) para os servidores de médio porte que estão executando o software Oracle Solaris 10:
Sun Enterprise 6x00
Sun Enterprise 5x00
Sun Enterprise 4x00
Sun Enterprise 3x00
Para mais informações sobre a Reconfiguração dinâmica do servidor Sun Enterprise, refira-se ao Guia do usuário para reconfiguração dinâmica para sistemas Sun Enterprise 3x00/4x00/5x00/6x00. A versão Oracle Solaris 10 inclui suporte a toda CPU/placas de memória e para a maioria das placas de E/S nos sistemas que foram mencionados na lista anterior.
Antes de prosseguir, tenha certeza de que o sistema suporta a reconfiguração dinâmica. Se o sistema estiver em um outro design, a mensagem a seguir aparece no console ou no console de logs. Tal sistema não é apropriado para a reconfiguração dinâmica.
Hot Plug not supported in this system |
As placas de E/S a seguir não são atualmente suportadas:
Digite 2 (gráficos)
Digite 3 (PCI)
Digite 5 (gráficos e SOC+)
Esta seção fornece informações gerais de software sobre o DR.
Para ativar a reconfiguração dinâmica, configure duas variáveis no arquivo /etc/system. Defina também uma variável adicional para permitir a remoção da CPU/placas de memória. Realize os passos seguintes:
Efetue logon como superusuário.
Edite o arquivo /etc/system adicionando a linhas a seguir:
set pln:pln_enable_detach_suspend=1 set soc:soc_enable_detach_suspend=1 |
Para ativar a remoção de uma CPU/placa de memória, adicione esta linha ao arquivo:
set kernel_cage_enable=1 |
Configurando esta variável, é ativada a operação de desconfiguração da memória.
Reinicialize o sistema para aplicar as alterações.
Inicie o teste de quiesce com o comando a seguir:
# cfgadm -x quiesce-test sysctr10:slot number |
Em sistemas grandes, o teste de quiesce pode executar por até um minuto. Durante este tempo, nenhuma mensagem é exibida se o cfgadm não encontrar drivers incompatíveis.
Tentar conectar um placa que está na lista de placas desativadas pode produzir uma mensagem de erro:
# cfgadm -c connect sysctrl0:slotnumber cfgadm: Hardware specific failure: connect failed: board is disabled: must override with [-f][-o enable-at-boot] |
Para ignorar a condição de desativada, duas opções estão disponíveis:
Utilizando a sinalização de força (-f)
# cfgadm -f -c connect sysctrl0:slot number |
Utilizando a opção ativa (-oenable-at-boot)
# cfgadm -o enable-at-boot -c connect sysctrl0:slot number |
Para remover todas as placas da lista de placas desativadas, escolha uma de duas opções, dependendo do prompt o qual o comando é emitido:
Do prompt do superusuário, digite:
# eeprom disabled-board-list= |
Do prompt PROM OpenBoot, digite:
OK set-default disabled-board-list |
Para mais informação sobre a configuração disabled-board-list, refira-se à seção “Variáveis NVRAM específicas” no manual Notas de plataforma: sistemas Sun Enterprise 3x00, 4x00, 5x00 e 6x00. Este manual é parte do conjunto de documentação nesta versão.
Informação sobre a configuração PROM OpenBoot disabled-memory-list é publicada nesta versão. Consulte o “Variáveis NVRAM específicas” em Notas de plataforma: sistemas Sun Enterprise 3x00, 4x00, 5x00 e 6x00 na documentação Oracle Solaris, em hardware Sun.
Se necessitar descarregar drivers desanexados sem segurança, utilize a linha de comando modinfo para encontrar os módulos IDs dos drivers. É possível utilizar os módulos IDs no comando modunload para descarregar os drivers desanexados sem segurança.
Remova a placa do sistema assim que a mensagem de erro for exibida durante uma sequência de conexão da DR:
cfgadm: Hardware specific failure: connect failed: firmware operation error |
O autoteste da placa falhou, e remover a placa evita erros de reconfiguração que podem ocorrer durante a próxima reinicialização.
O status do autoteste falho não permite mais operações. Além disso, se desejar repetir a operação falha imediatamente, é necessário primeiro remover a placa e depois reinserí-la.
A lista a seguir é sujeita a alterações a qualquer momento.
Se um processo estiver mantendo aberto um dispositivo de rede, qualquer operação DR que envolver este dispositivo falha. Daemons e processos que mantêm contagem de referência param a conclusão das operações DR.
Solução alternativa: como superusuário, efetue os passos a seguir:
Remova ou renomeie o diretório /rplboot.
Desligue os serviços NFS.
# sh /etc/init.d/nfs.server stop |
Desligue os serviços do Servidor de inicialização.
# sh /etc/init.d/boot.server stop |
Efetue a operação de desanexação do DR.
Reinicie os serviços NFS.
# sh /etc/init.d/nfs.server start |
Reinicie os serviços do Servidor de inicialização.
# sh /etc/init.d/boot.server start |