Implantar o sistema de arquivos paralelo BeeGFS

O BeeGFS é um sistema de arquivos de cluster paralelo, desenvolvido com um forte foco no desempenho de entrada/saída e projetado para fácil instalação e gerenciamento. Usando o BeeGFS, você pode criar um servidor de arquivos de computação de alto desempenho (HPC) no Oracle Cloud Infrastructure.

O BeeGFS distribui de forma transparente os dados do usuário em vários servidores. Aumentando o número de servidores e discos no sistema, você pode dimensionar o desempenho e a capacidade do sistema de arquivos de pequenos clusters até sistemas de classe empresarial com milhares de nós.

Arquitetura

Esta arquitetura de referência usa uma região com um único domínio de disponibilidade e sub-redes regionais. Você pode usar a mesma arquitetura de referência em uma região com vários domínios de disponibilidade. Recomendamos que você use sub-redes regionais para sua implantação, independentemente do número de domínios de disponibilidade.

O diagrama a seguir ilustra essa arquitetura de referência.

Veja a seguir a descrição da ilustração architecture-deploy-beegfs.png
Descrição da ilustração architecture-deploy-beegfs.png

A arquitetura tem os seguintes componentes:

  • Região

    Uma região é uma área geográfica localizada composta de um ou mais domínios de disponibilidade. As regiões são independentes de outras regiões e vastas distâncias podem separá-las (entre países ou continentes).

  • Domínios de disponibilidade

    Os domínios de disponibilidade são data centers independentes e independentes em uma região. Os recursos físicos em cada domínio de disponibilidade são isolados dos recursos nos outros domínios de disponibilidade, o que fornece tolerância a falhas. Os domínios de disponibilidade não compartilham infraestrutura, como energia ou resfriamento, ou a rede de domínios de disponibilidade interna. Portanto, é improvável que uma falha em um domínio de disponibilidade afete os outros domínios de disponibilidade na região.

  • Domínios de falha

    Um domínio de falha é um agrupamento de hardware e infraestrutura dentro de um domínio de disponibilidade. Cada domínio de disponibilidade tem três domínios de falha com energia e hardware independentes. Quando você coloca instâncias do serviço Compute em vários domínios de falha, os aplicativos podem tolerar falhas físicas do servidor, manutenção do sistema e muitas falhas comuns de rede e energia dentro do domínio de disponibilidade.

  • Rede virtual na nuvem (VCN) e sub-redes

    VCN é uma rede definida por software que você configura em uma região do Oracle Cloud Infrastructure. As VCNs podem ser segmentadas em sub-redes, que podem ser específicas de uma região ou de um domínio de disponibilidade. As sub-redes específicas da região e do domínio de disponibilidade podem coexistir na mesma VCN. Uma sub-rede pode ser pública ou privada.

  • Listas de segurança

    Para cada sub-rede, você pode criar regras de segurança que especifiquem a origem, o destino e o tipo de tráfego que devem ser permitidos dentro e fora da sub-rede.

  • Tabelas de roteamento

    As tabelas de roteamento virtuais contêm regras para rotear o tráfego de sub-redes para destinos fora da VCN, geralmente por meio de gateways.

  • Gateway de Internet

    O gateway de internet permite o tráfego entre a VCN e a internet pública.

  • Nós do cliente

    Clientes são instâncias do serviço Compute que acessam o sistema de arquivos BeeGFS.

  • Servidor de gerenciamento

    O servidor de gerenciamento (MGS) é um ponto de encontro para os metadados, armazenamento e serviços de cliente do BeeGFS. Um MGS armazena informações de configuração para um ou mais sistemas de arquivos e fornece essas informações a outros hosts. Este recurso global pode suportar vários sistemas de arquivos.

  • Serviço de metadados

    O MDS (serviço de metadados) armazena informações sobre os dados, como informações de diretório, propriedade de arquivos e diretórios e a localização do conteúdo do arquivo de usuário nos alvos de armazenamento. O serviço de metadados é um serviço de ampliação, o que significa que você pode usar um ou mais serviços de metadados em um sistema de arquivos BeeGFS.

    O conteúdo de metadados é armazenado em volumes chamados alvos de metadados (MDTs).

  • Serviço Object Storage

    O serviço Object Storage (OSS) é o principal serviço para armazenar conteúdo de arquivos do usuário ou arquivos de partes de dados. Os servidores de Armazenamento de Objetos também são chamados de servidores de armazenamento.

    Semelhante ao serviço de metadados, o serviço Object Storage é baseado em um design de ampliação. Uma instância de SO tem um ou mais alvos de armazenamento de objetos.

    Cada servidor de armazenamento fornece acesso a um conjunto de volumes de armazenamento, chamados OSTs (Object Storage targets). Cada OST contém vários objetos binários que representam os dados dos arquivos.

Recomendações

Seus requisitos podem ser diferentes da arquitetura descrita aqui. Use as recomendações a seguir como ponto de partida.

  • VCN

    Ao criar a VCN, determine quantos endereços IP seus recursos de nuvem em cada sub-rede exigem. Usando a notação CIDR (Classless Inter-Domain Routing), especifique uma máscara de sub-rede e um intervalo de endereços de rede que seja grande o suficiente para os endereços IP necessários. Use um intervalo de endereços que esteja dentro do espaço de endereço IP privado padrão.

    Selecione um intervalo de endereços que não se sobreponha à sua rede local, para que você possa configurar uma conexão entre o VCN e sua rede local, se necessário.

    Depois de criar um VCN, você não poderá alterar seu intervalo de endereços.

    Ao projetar as sub-redes, considere o fluxo de tráfego e os requisitos de segurança. Anexe todas as instâncias de computação dentro da mesma camada ou atribuição à mesma sub-rede, que pode servir como um limite de segurança.

  • Listas de segurança

    Use listas de segurança para definir regras de entrada e saída que se aplicam a toda a sub-rede.

  • Host de Basção

    Um host bastião é usado para acessar qualquer nó na sub-rede privada. Use a forma VM.Standard.E2.1.

  • Servidor de Gerenciamento (MGS)

    Como o MGS não é intensivo em recursos, você pode optar por implantá-lo com o Servidor MDS. Se você implantá-lo separadamente, a forma do VM.Standard2.2 será suficiente.

    Use um volume em blocos de nível de desempenho balanceado de 50 GB. O volume em blocos pode ser redimensionado se mais espaço for necessário.

  • Servidor MDS (Metadata Service)

    Use uma forma VM.Standard2.8 ou superior. Os requisitos dependem se sua carga de trabalho é ou não intensiva em metadados (para cargas de trabalho de arquivos pequenos), quantas instâncias de metadados estão sendo executadas por nó e assim por diante.

    Para obter o desempenho mais alto, uma forma bare metal, como o BM.Standard2.52, é recomendada porque tem duas NICs físicas, cada uma com uma velocidade de rede de 25-Gbps. Use uma NIC para todo o tráfego para bloquear o armazenamento e use a outra NIC para dados de entrada nos nós MDS dos nós do cliente.

    Use o armazenamento de volume em blocos; o tamanho e o número são alterados por requisito de implantação para obter mais armazenamento. Se for necessário mais espaço, o volume em blocos poderá ser redimensionado.

  • Servidor OSS (Object Storage Service)

    Use o VM.Standard2.8 ou superior. O requisito depende do que o throughput Agregar E/S no GBps é necessário do sistema de arquivos.

    Para um desempenho mais alto, uma forma bare metal, como o BM.Standard2.52, é recomendada porque tem duas NICs físicas, cada uma com velocidade de rede de 25-Gbps. Use uma NIC para todo o tráfego para bloquear o armazenamento e use a outra NIC para dados de entrada nos nós do OSS dos nós do cliente.

  • Nós do Cliente

    Escolha uma forma de VM com base em seus planos de implantação. A forma determina a largura de banda da rede que está disponível para a instância ler e gravar no sistema de arquivos. Por exemplo, uma forma VM.Standard2.16 tem uma largura de banda de rede máxima de 16.4 Gbps, o que significa que o throughput máximo de E/S é 2.05 GBps.

    As formas Intel e AMD VM e bare metal Compute podem ser usadas para clientes.

Considerações

  • Desempenho

    Para obter o melhor desempenho, escolha a forma correta do Compute com largura de banda apropriada.

  • Disponibilidade

    Considere usar uma opção de alta disponibilidade com base no seu requisito de implantação.

  • Custo

    O serviço bare-metal fornece maior largura de banda da rede, mas por um custo mais alto. Avalie seus requisitos para escolher a forma de Computação apropriada.

  • Alertas e Monitoramento

    Configure o monitoramento e alertas sobre o uso da CPU e da memória para os nós MGS, MDS e OSS para ampliar ou reduzir a forma da VM conforme necessário.

Implantar

O código Terraform desta arquitetura de referência está disponível no GitHub.

Você pode implantar usando o script Terraform diretamente ou por meio do serviço Oracle Cloud Infrastructure Resource Manager.

  1. Vá para o GitHub.
  2. Clone ou faça download do repositório para o computador local.
  3. Para usar o script Terraform, siga as instruções no documento README.
  4. Para usar o Oracle Cloud Infrastructure Resource Manager, siga as instruções no README dentro do diretório orm do repositório.