BeeGFS 병렬 파일 시스템 배치

BeeGFS는 입력 출력 성능에 중점을 두고 쉽게 설치 및 관리할 수 있도록 설계된 병렬 클러스터 파일 시스템입니다. BeeGFS를 사용하여 Oracle Cloud Infrastructure에서 HPC(고성능 컴퓨팅) 파일 서버를 빌드할 수 있습니다.

BeeGFS는 사용자 데이터를 여러 서버에 투명하게 분산시킵니다. 시스템의 서버 및 디스크 수를 늘리면 작은 클러스터에서 수천 개의 노드가 포함된 엔터프라이즈급 시스템까지 파일 시스템의 성능과 용량을 확장할 수 있습니다.

구조

이 참조 아키텍처는 단일 가용성 도메인 및 지역별 서브넷이 있는 영역을 사용합니다. 여러 가용성 도메인이 있는 영역에서 동일한 참조 구조를 사용할 수 있습니다. 가용성 도메인 수에 관계없이 배치에 지역별 서브넷을 사용하는 것이 좋습니다.

다음 다이어그램은 이 참조 아키텍처를 보여 줍니다.

아래 링크를 누르면 Architecture-deploy-beegfs.png에 대한 설명을 볼 수 있습니다.
Architecture-deploy-beegfs.png에 대한 설명

아키텍처에는 다음과 같은 구성 요소가 있습니다:

  • 영역

    영역은 하나 이상의 가용성 도메인으로 구성된 지역화된 지리적 영역입니다. 지역은 다른 지역과 독립적이며, 방대한 거리는 국가 또는 대륙에서 분리할 수 있습니다.

  • 가용성 도메인

    가용성 도메인은 영역 내의 독립적인 독립형 데이터 센터입니다. 각 가용성 도메인의 물리적 리소스는 결함 허용 한도를 제공하는 다른 가용성 도메인의 리소스와 격리됩니다. 가용성 도메인은 전원, 냉각 또는 내부 가용성 도메인 네트워크와 같은 인프라를 공유하지 않습니다. 따라서 한 가용성 도메인의 실패는 해당 지역의 다른 가용성 도메인에 영향을 주지 않을 수 있습니다.

  • 장애 도메인

    결함 도메인은 가용성 도메인 내에서 하드웨어와 기반구조의 그룹화입니다. 각 가용성 도메인에는 독립적인 전원 및 하드웨어가 있는 3개의 장애 도메인이 있습니다. 여러 결함 도메인에 컴퓨트 인스턴스를 배치하면 응용 프로그램에서 물리적 서버 오류, 시스템 유지 관리, 가용성 도메인 내의 많은 공통 네트워킹 및 전원 오류를 허용할 수 있습니다.

  • VCN(가상 클라우드 네트워크) 및 서브넷

    VCN는 Oracle Cloud Infrastructure 지역에서 설정하는 소프트웨어 정의 네트워크입니다. VCN은 영역 또는 가용성 도메인에 특정한 서브넷으로 분할할 수 있습니다. 지역별 서브넷과 가용성 도메인별 서브넷은 모두 동일한 VCN에 공존할 수 있습니다. 서브넷은 공용 또는 전용일 수 있습니다.

  • 보안 목록

    각 서브넷에 대해 서브넷에서 허용되어야 하는 트래픽의 소스, 대상 및 유형을 지정하는 보안 규칙을 생성할 수 있습니다.

  • 경로 테이블

    가상 경로 테이블에는 일반적으로 게이트웨이를 통해 서브넷의 트래픽을 VCN 외부의 대상으로 경로 지정하는 규칙이 포함되어 있습니다.

  • 인터넷 게이트웨이

    인터넷 게이트웨이는 VCN와 공용 인터넷 간의 트래픽을 허용합니다.

  • 클라이언트 노드

    클라이언트는 BeeGFS 파일 시스템에 액세스하는 컴퓨트 인스턴스입니다.

  • 관리 서버

    MGS(Management Server) 는 BeeGFS 메타 데이터, 저장 영역 및 클라이언트 서비스를 위한 회의 지점입니다. MGS는 하나 이상의 파일 시스템에 대한 구성 정보를 저장하고 이 정보를 다른 호스트에 제공합니다. 이 전역 리소스는 여러 파일 시스템을 지원할 수 있습니다.

  • 메타데이터 서비스

    MDS(메타 데이터 서비스) 는 디렉토리 정보, 파일 및 디렉토리 소유권, 저장 영역 대상의 사용자 파일 내용 위치 등 데이터에 대한 정보를 저장합니다. 메타 데이터 서비스는 확장 서비스입니다. 즉, BeeGFS 파일 시스템에서 하나 이상의 메타 데이터 서비스를 사용할 수 있습니다.

    메타데이터 콘텐츠는 MDT(메타데이터 대상) 라는 볼륨에 저장됩니다.

  • 오브젝트 스토리지 서비스

    OSS(오브젝트 스토리지 서비스) 는 사용자 파일 컨텐츠 또는 데이터 청크 파일을 저장하기 위한 기본 서비스입니다. 오브젝트 스토리지 서버를 스토리지 서버라고도 합니다.

    메타데이터 서비스와 마찬가지로 오브젝트 스토리지 서비스는 스케일 아웃 설계를 기반으로 합니다. OS 인스턴스에는 하나 이상의 객체 저장 영역 대상이 있습니다.

    각 스토리지 서버는 OST(오브젝트 스토리지 대상) 라는 스토리지 볼륨 세트에 대한 액세스를 제공합니다. 각 OST에는 파일에 대한 데이터를 나타내는 여러 이진 객체가 포함되어 있습니다.

권장사항

요구 사항은 여기에 설명된 아키텍처와 다를 수 있습니다. 다음 권장 사항을 시작점으로 사용하십시오.

  • VCN

    VCN를 생성할 때 각 서브넷의 클라우드 리소스에 필요한 IP 주소 수를 결정합니다. CIDR(Classless Inter-Domain Routing) 표기법을 사용하여 필요한 IP 주소에 충분히 큰 서브넷 마스크 및 네트워크 주소 범위를 지정합니다. 표준 전용 IP 주소 공간 내에 있는 주소 범위를 사용합니다.

    필요한 경우 VCN와 온-프레미스 네트워크 간의 접속을 설정할 수 있도록 온-프레미스 네트워크와 겹치지 않는 주소 범위를 선택합니다.

    VCN를 생성한 후에는 주소 범위를 변경할 수 없습니다.

    서브넷을 설계할 때 트래픽 흐름 및 보안 요구사항을 고려하십시오. 보안 경계 역할을 할 수 있는 동일한 계층 또는 역할 내의 모든 컴퓨트 인스턴스를 동일한 서브넷에 연결합니다.

  • 보안 목록

    보안 목록을 사용하여 전체 서브넷에 적용되는 수신 및 송신 규칙을 정의합니다.

  • 배스천 호스트

    배스천 호스트는 전용 서브넷의 노드에 액세스하는 데 사용됩니다. VM.Standard. E2.1 구성을 사용합니다.

  • MGS(Management Server)

    MGS는 리소스를 많이 사용하는 것이 아니므로 MDS 서버와 함께 배치하도록 선택할 수 있습니다. 별도로 배치할 경우 VM.Standard2.2 구성으로도 충분합니다.

    50GB 용량의 성능 계층 블록 볼륨을 사용합니다. 공간이 더 필요한 경우 블록 볼륨의 크기를 조정할 수 있습니다.

  • MDS(Metadata Service) 서버

    VM.Standard2.8 이상 구성을 사용합니다. 요구 사항은 작업 로드가 메타 데이터를 많이 사용하는지 여부(작은 파일 작업 로드의 경우), 노드당 실행 중인 메타 데이터 인스턴스 수 등에 따라 달라집니다.

    최상의 성능을 위해서는 각각 25Gbs 네트워크 속도를 가진 두 개의 물리적 NIC가 있으므로 BM.Standard2.52 와 같은 베어메탈 구성을 사용하는 것이 좋습니다. 하나의 NIC를 모든 트래픽에 사용하여 스토리지를 차단하고 다른 NIC를 사용하여 클라이언트 노드에서 MDS 노드로 데이터를 수신합니다.

    블록 볼륨 저장 영역을 사용합니다. 추가 저장 영역의 경우 배치 요구 사항당 크기 및 수가 변경됩니다. 공간이 더 필요한 경우 블록 볼륨의 크기를 조정할 수 있습니다.

  • OSS(Object Storage Service) 서버

    VM.Standard2.8 이상을 사용합니다. 요구 사항은 파일 시스템에서 필요한 GBps의 집계 IO 처리량에 따라 달라집니다.

    최상의 성능을 위해서는 각각 25Gbs 네트워크 속도를 가진 두 개의 물리적 NIC가 있으므로 BM.Standard2.52 와 같은 베어메탈 구성을 사용하는 것이 좋습니다. 하나의 NIC를 모든 트래픽에 사용하여 스토리지를 차단하고 다른 NIC를 사용하여 클라이언트 노드에서 OSS 노드로 데이터를 수신합니다.

  • 클라이언트 노드

    배치 계획에 준하여 VM 구성을 선택하십시오. 구성에 따라 인스턴스가 파일 시스템을 읽고 쓸 수 있는 네트워크 대역폭이 결정됩니다. 예를 들어, VM.Standard2.16 구성의 최대 네트워크 대역폭은 16.4Gbps입니다. 즉, 최대 IO 처리량은 2.05 GBps 입니다.

    Intel 및 AMD VM과 베어메탈 컴퓨트 구성을 모두 클라이언트에 사용할 수 있습니다.

고려 사항

  • 성능

    최상의 성능을 얻으려면 적절한 대역폭을 사용하여 올바른 컴퓨트 구성을 선택하십시오.

  • 가용성

    배포 요구사항에 따라 고가용성 옵션을 사용하는 것이 좋습니다.

  • 비용

    베어메탈 서비스는 더 높은 네트워크 대역폭을 제공하지만 비용이 더 높습니다. 요구사항을 평가하여 적절한 컴퓨트 구성을 선택합니다.

  • 모니터링 및 경보

    MGS, MDS 및 OSS 노드의 CPU 및 메모리 사용량에 대한 모니터링 및 경보를 설정하여 필요에 따라 VM 구성을 확장하거나 축소합니다.

배치

이 참조 아키텍처에 대한 Terraform 코드는 GitHub에서 사용할 수 있습니다.

Terraform 스크립트를 직접 사용하거나 Oracle Cloud Infrastructure Resource Manager 서비스를 통해 배치할 수 있습니다.

  1. GitHub로 이동합니다.
  2. 저장소를 로컬 컴퓨터에 복제하거나 다운로드합니다.
  3. Terraform 스크립트를 사용하려면 README 문서의 지침을 따릅니다.
  4. Oracle Cloud Infrastructure Resource Manager를 사용하려면 저장소의 orm 디렉토리에 있는 README의 지침을 따릅니다.