작업 로드 모니터

모든 Oracle Cloud Infrastructure 서비스에 대한 모니터링 프로세스를 이해하고 채택합니다. 모니터링 서비스는 측정항목을 사용하여 측정항목이 알람 지정 트리거를 충족할 때 리소스 및 알람을 모니터하여 통지합니다.

작업 측정항목 분석

보안 아키텍트, 클라우드 운영 관리자, 네트워크 아키텍트

공정 척도를 정의, 수집 및 분석하여 이벤트에 대한 가시성을 확보합니다.

Oracle Cloud Infrastructure Monitoring 서비스는 리소스의 상태를 파악하고 애플리케이션 성능을 최적화하며 이례적인 상황에 실시간으로 대응하는 데 필요한 통찰력을 제공합니다. 경보를 설정하여 클라우드 인프라 및 서비스 전반의 중요한 변경사항에 대해 실시간으로 경보를 전송하여 적절한 조치를 신속하게 취할 수 있습니다.

상태 확인 정의

클라우드 구축자, 클라우드 운영 관리자, 보안 구축자

Oracle Cloud Infrastructure Health Checks 서비스는 호스트된 웹 사이트, API 엔드포인트 또는 외부 대상 로드 밸런서를 포함한 모든 공용 서비스의 가용성과 성능을 확인할 수 있도록 높은 빈도의 외부 모니터링을 사용자에게 제공합니다.

Oracle Cloud Infrastructure Health Checks를 사용하면 고객에게 영향을 미치는 가용성 문제를 즉시 파악할 수 있습니다.

컴퓨팅 서비스 모니터

보안 아키텍트, 클라우드 운영 관리자

운영 팀이 컴퓨트 서비스 측정항목을 사용하고 적용하는지 확인하십시오.

측정 단위, 알람 및 통지를 사용하여 다음을 모니터합니다.

  • 컴퓨트 인스턴스: 컴퓨트 인스턴스의 건전성, 용량 및 성능을 모니터링합니다.
  • Infrastructure Health: 컴퓨트 베어메탈 인스턴스의 상태, 용량 및 성능을 모니터링합니다.
  • Oracle Cloud Infrastructure Functions: Oracle Cloud Infrastructure Functions에 배포한 기능의 상태, 용량 및 성능을 모니터링할 수 있습니다.
  • Database Health: 데이터베이스 서비스의 상태, 용량 및 성능을 모니터합니다. Oracle Cloud Observability and Management Platform은 클라우드 데이터베이스를 위한 통합 데이터베이스 모니터링 및 관리 기능을 제공합니다.
  • 운영 체제 상태: auditd와 같은 OS 레벨 로깅 도구를 구현합니다.

네트워크 모니터링

보안 아키텍트, 클라우드 운영 관리자, 네트워크 아키텍트

다양한 네트워크 끝점에서 측정항목이 적용되는 방식을 채택합니다. 내부 VCN(가상 클라우드 네트워크) 및 연결(Oracle Cloud Infrastructure FastConnect 및 IPsec VPN) 또는 로드 밸런서에 대한 측정지표를 사용할 수 있습니다.

측정 단위, 알람 및 통지를 사용하여 다음을 모니터합니다.

  • VNIC Metrics: 네트워킹 서비스 VNIC(가상 네트워크 인터페이스 카드)의 상태, 용량 및 성능을 모니터합니다.
  • FastConnect 측정지표: 온프레미스 네트워크와 VCN(Oracle Cloud Infrastructure FastConnect 연결) 간 연결의 상태, 용량 및 성능을 모니터링합니다.
  • VPN Connect 측정항목: 온프레미스 네트워크와 VCN(IPSec VPN이라고도 함) 간 접속의 건전성, 용량 및 성능을 모니터합니다.
  • 서비스 게이트웨이 측정항목: 서비스 게이트웨이의 건전성, 용량 및 성능을 모니터합니다. 그러면 퍼블릭 인터넷에 리소스를 노출하지 않고 온프레미스 호스트 또는 VCN 호스트가 Oracle 서비스(예: 오브젝트 스토리지 및 Autonomous Database)에 비공개로 액세스할 수 있습니다.
  • Load Balancing Metrics: 클라이언트와 Application Server 간의 데이터 트래픽을 중개하는 역할을 하는 로드 밸런서의 상태, 용량 및 성능을 모니터합니다.
  • 고객 구내 장비: Oracle Cloud Infrastructure(OCI)에 연결되는 네트워크 경계 장비의 상태, 용량 및 성능을 모니터링합니다.
  • Oracle Cloud Logging Analytics로 VCN 플로우 로그를 사용으로 설정하고 수집하여 분석하고 흥미로운 패턴을 식별하고 필요에 따라 인사이트를 얻습니다.

OCI Network Command Center와 사용 가능한 도구를 사용하여 네트워크를 모니터하고 관찰합니다. OCI Network Command Center는 다양한 작업 사용 사례를 지원하기 위해 다음과 같은 관찰 가능성 도구를 제공합니다.

  • Network Visualizer

    직관적인 토폴로지 시각화를 제공하여 가상 네트워크 리소스 간의 연결 및 관계를 이해하고, 한 곳에서 구성을 검사하고, 구성 문제를 시각적으로 해결할 수 있습니다.

  • 네트워크 경로 분석기

    접근성 문제가 있는 경우 복잡한 가상 네트워크 구성 문제를 해결할 수 있습니다. 트래픽에 걸리는 네트워크 경로를 확인하고, 경로 지정 및 보안 구성 문제를 식별하며, 경로를 따라 구성 정보를 제공하는 자동화된 구성 분석을 제공합니다.

  • 영역 간 대기 시간

    OCI 리전 간 실시간 및 과거 대기 시간 정보를 제공합니다.

  • VCN 플로우 로그

    보안 및 네트워크 운영 사용 사례를 지원하는 데 중요한 네트워크 트래픽 원격 측정 기능을 제공합니다. 네트워크 트래픽에 대한 광범위한 인사이트를 확보하고, Kafka와 같은 표준 프로토콜을 사용하여 선택한 도구로 흐름 로그를 스트리밍하고, 규정 준수를 위해 OCI Object Storage에 흐름 로그를 보관할 수 있습니다. VCN 플로우 로그는 Oracle Cloud Infrastructure Logging Analytics, OCI Object Storage 또는 타사 시스템으로 전송될 수 있습니다.

  • VTAP(Virtual Test Access Point)

    보안 분석, 응용 프로그램 문제 해결 또는 네트워크 성능 문제를 위해 전체 패킷 캡처를 가능하게 하는 트래픽 미러링 기능을 제공합니다. VTAP는 패킷 컨텐츠 및 헤더를 분석하여 복잡한 네트워크 문제를 해결하는 데도 유용합니다.

데이터를 모니터합니다.

클라우드 구축자, 클라우드 운영 관리자, 보안 구축자

측정 지표, 경보 및 알림을 사용하여 데이터를 저장하는 데 사용하는 스토리지 서비스를 모니터링합니다.
  • Block Volume Metrics: 블록 볼륨 및 부트 볼륨의 처리량과 작업을 모니터합니다.
  • 오브젝트 스토리지 측정지표: 오브젝트 스토리지 버킷의 오브젝트 크기와 수를 모니터링합니다.
  • 파일 시스템 측정항목: 파일 시스템 및 마운트 대상의 건전성, 처리량, 요청 및 대기 시간을 모니터합니다.

각 측정항목에 대한 알람 집합 생성

DevOps 보안 아키텍트, Cloud Operations Manager

관련 서비스 측정항목에 대한 알람 집합을 생성합니다. 리소스가 내보낸 각 측정 단위에 대해 리소스 동작을 정의하는 알람을 생성합니다.
  • 위험에. 측정항목 값으로 표시된 대로 리소스가 작동 불가능해질 위험이 있습니다.
  • 비최적. 측정항목 값으로 표시된 대로 리소스가 비최적 레벨에서 수행되고 있습니다.
  • 리소스가 작동 또는 작동 중지 상태입니다. 리소스에 연결할 수 없거나 리소스가 작동하지 않습니다.

알람 튜닝

DevOps 보안 아키텍트, Cloud Operations Manager

주별과 같이 정기적으로 알람을 검토하여 최적의 구성을 보장합니다. 방법, 빈도 및 대상자를 포함하여 각 알람의 임계값, 심각도 및 통지 세부정보를 보정합니다.
너무 넓은 Metric 임계값은 불필요하게 alert를 발생시키지만 임계값이 너무 좁으면 정전 전에 수정 조치를 취하는 시간이 줄어듭니다.

최적의 알람 구성은 다음 요인을 해결합니다.

  • 리소스의 중요도입니다.
  • 적절한 리소스 동작입니다. 서비스 에코시스템의 컨텍스트 내에서 개별적으로 동작을 평가합니다. 지정된 기간 동안의 측정항목 값 변동을 검토한 후 필요에 따라 임계값을 조정합니다.
  • 수락 가능한 통지 노이즈입니다. 통지 방법(예: 전자메일 또는 PagerDuty), 적절한 수신자 및 반복 통지 빈도를 평가합니다.

서비스 로깅 사용

DevOps 보안 아키텍트, Cloud Operations Manager

서비스 로그는 Oracle Cloud Infrastructure(OCI) 서비스(예: API Gateway, Events, Functions, Load Balancing, Object Storage, VCN Flow Log)에서 내보낸 로그입니다. 이러한 지원되는 각 서비스에는 해당 서비스에 대한 로깅을 사용 또는 사용 안함으로 설정할 수 있는 로그 리소스가 있습니다.

리소스가 수행되고 액세스되는 방식을 설명하는 중요한 진단 정보가 필요한 경우에만 서비스 로깅을 사용으로 설정합니다.

필요에 따라 패턴 및 추세에 대한 더 나은 통찰력과 상세 분석을 위해 Oracle Cloud Infrastructure Logging Analytics를 사용하여 서비스 로그를 수집하는 것을 고려해 보십시오.

로그 보존 정책을 생성 및 유지 관리합니다.

Oracle Cloud Infrastructure Ops Insights 사용

보안 아키텍트, 클라우드 운영 관리자

Oracle Cloud Infrastructure Ops Insights는 데이터베이스 및 호스트 리소스 활용률과 용량에 대한 종합적인 통찰력을 제공하는 OCI 네이티브 서비스입니다.

Oracle Cloud Infrastructure Ops Insights는 다음과 같은 통합 애플리케이션으로 구성됩니다.

  • 용량 계획
  • Oracle SQL Warehouse

Oracle Cloud Guard 사용

DevOps 보안 아키텍트, Cloud Operations Manager

Oracle Cloud Guard는 고객이 Oracle Cloud에서 강력한 보안 상황을 모니터, 식별, 달성 및 유지보수할 수 있도록 지원하는 서비스입니다. 서비스를 사용하여 Oracle Cloud Infrastructure 리소스에서 구성과 관련된 보안 취약점을 조사하고 운영자와 사용자에게 위험한 활동을 조사합니다.

모든 구획을 모니터링하려면 Oracle Cloud Guard가 테넌시의 루트 레벨에서 사용으로 설정되었는지 확인하십시오.

감사 구성

DevOps 보안 아키텍트, Cloud Operations Manager

Oracle Cloud Infrastructure Audit 서비스는 지원되는 모든 Oracle Cloud Infrastructure(OCI) API(퍼블릭 애플리케이션 프로그래밍 인터페이스) 끝점에 대한 호출을 로그 이벤트로 자동 기록합니다. 현재 모든 서비스는 감사별 로깅을 지원합니다.

감사를 구성할 때 다음을 검토하십시오.

  • 감사 보존 기간을 검토합니다. 기본값은 365일로 설정됩니다.
  • OCI Audit 데이터에 액세스해야 하는 타사 툴이 있는 경우 OCI Audit 데이터를 Oracle Cloud Infrastructure Object Storage에 복사하도록 서비스 커넥터를 구성합니다.
  • 스토리지 버킷의 보존 기간이 적절하게 구성되었는지 확인하십시오.
  • 필요에 따라 패턴 및 추세에 대한 더 나은 통찰력과 세부 분석을 위해 OCI Log Analytics를 사용하여 감사 로그의 하위 집합을 수집하는 것을 고려하십시오.