O Cliente NFS Relata uma Mensagem "NFS Server Not Responding"

Um cliente NFS relata uma mensagem "O Servidor NFS não está respondendo" de um ponto de acesso NFS.

Este é um guia geral de solução de problemas que abrange vários fatores relacionados a esta mensagem de erro do SO, que pode ter várias causas. Revise essas informações para ajudar a identificar a causa e suas dicas de solução de problemas associadas.

A causa desse problema pode ser qualquer uma das seguintes:

Causa 1: O próprio cliente NFS não pode se comunicar com o endereço IP do ponto de acesso NFS do serviço File Storage por causa de um problema relacionado ao SO ou ao Kernel.

Verifique as definições de rede TCP relacionadas ao SO, como:

  • Se a mensagem de erro está vindo de uma única instância ou de várias instâncias.
  • Verifique se você está usando o patch do kernel mais recente e o pacote nfs-utils.
  • Verifique a carga, o desempenho e o uso de memória da instância durante o período afetado.
  • Verifique as definições de MTU, em particular, verifique se há alguma incompatibilidade nas definições de MTU padrão.
  • Verifique se as definições iptables estão causando conexões NFS eliminadas ou negadas.

Causa 2: Existe um problema de comunicação de rede TCP (VCN) entre o cliente NFS e o ponto de acesso NFS.

Verifique se há problemas de comunicação de rede:

  • Verifique se algum firewall de rede está causando a eliminação de solicitações NFS.
  • Use rpcinfo -t <mount_target_IP> prognum para testar a conectividade de porta NFS, NFS e lockd do cliente NFS.
  • Use traceroute -n -T -p <NFS_ports> <mount_target_ip> para verificar a conectividade.
  • Use sudo traceroute --mtu <mount_target_IP> ou sudo tracepath <mount_target_IP> para verificar se há perdas e quedas de pacotes por causa de incompatibilidades no tamanho da MTU.
  • Use nfsstat -o net para verificar se há pacotes eliminados.
  • Use nfsiostat <mount_path> para verificar dados detalhados da solicitação, como retrans, RTT etc.
  • Use mountstats <mount_dir> para verificar se há estatísticas de RPC anormais.

Causa 3: O ponto de acesso NFS do File Storage, que atua como o próprio servidor NFS, não está respondendo.

Verifique ou colete o seguinte para problemas no ponto de acesso NFS:

  • Use dmesg -T para verificar se há problemas.
  • Verifique /var/log/messages para obter mensagens, incluindo o timestamp da mensagem com fuso horário.
  • Colete o OCID do sistema de arquivos ou do destino de montagem.

Em todos os casos, coletar uma captura de pacote do cliente NFS no momento do erro é útil para solucionar o problema ainda mais. Por exemplo:

tcpdump -i <interface_name> host <NFS_client_IP> -w /tmp/FSS.pcap

Para usuários do Windows, colete informações usando o Wireshark ou ferramentas semelhantes.

Como esses problemas podem estar relacionados a instâncias do serviço Compute e a uma VCN, eles podem exigir a solução coletiva de problemas. Envolva-se com o suporte da OCI e crie uma solicitação de serviço, se necessário.