Oracle Cloud에서 Informatica IDMC용 분석 플랫폼 배포

Oracle과 Informatica의 파트너십은 데이터베이스 및 데이터 관리 분야의 두 업계 리더를 하나로 통합하여 포괄적인 엔터프라이즈 데이터 웨어하우스와 레이크하우스 에코시스템을 제공합니다.

이 참조 아키텍처는 Informatica IDMC Secure Agent가 Oracle Cloud Infrastructure(OCI)에서 작동하는 방식을 보여줍니다. 300개 이상의 커넥터를 사용하여 광범위한 온프레미스 및 클라우드 소스에서 데이터를 내보낸 다음 분석 또는 데이터 과학 프로세스에서 사용할 Oracle Autonomous Database로 가져올 수 있습니다.

이 통합이 없으면 애플리케이션 데이터(예: Oracle E-Business Suite)에서 실행 가능한 정보에 액세스할 수 있지만 다른 데이터 소스로 이를 보강하여 귀중한 통찰력을 얻을 수는 없습니다. 또한 운영 시스템에서 분석 작업 로드를 실행하는 것은 바람직하지 않습니다.

이 참조 아키텍처는 전체 비즈니스 컨텍스트 내에 기술 솔루션을 배치합니다.



통합은 상호 작용 레코드를 포함하는 애플리케이션 데이터가 관리 계층의 다른 선별된 데이터 집합과 결합되고 착취 계층에서 실행 가능한 정보 및 통찰력으로 세분화된 분석 플랫폼을 제공합니다.

구조

이 참조 아키텍처는 Informatica IDMC Secure Agent가 Oracle Cloud Infrastructure(OCI)에서 작동하는 방식을 보여줍니다. 데이터는 온프레미스 및 클라우드 기반 엔터프라이즈 애플리케이션, 파일, 객체 저장소 및 데이터베이스에서 익스포트된 후 분석 또는 데이터 과학 프로세스에서 사용할 Oracle Autonomous Database로 임포트됩니다.

다음 다이어그램은 참조 구조의 기능을 나타낸 것입니다.



Infoatica-oci-oracle.zip

일반적으로 아키텍처에는 다음과 같은 논리적 분할이 포함됩니다. 이 참조 구조는 데이터 변환 모듈 및 데이터 지속성 구조 구성 요소에 중점을 둡니다.

  • 수집, 변환

    구조의 각 데이터 계층에서 사용할 데이터를 수집 및 세분화합니다.

  • 지속, 선별, 생성

    데이터의 접근 및 탐색을 용이하게 하여 현재 및 과거 비즈니스 뷰를 표시합니다. 원시 데이터와 세분화된 선별된 데이터를 모두 포함합니다. 관계형 기술의 경우 데이터는 논리적이거나 단순 관계형, 종단형, 차원형 또는 OLAP 형식으로 물리적으로 구조화될 수 있습니다. 비관계형 데이터의 경우 이 계층은 분석 프로세스의 출력 또는 특정 분석 작업에 최적화된 데이터를 포함하여 하나 이상의 데이터 풀을 포함합니다.

    Oracle Autonomous Data Warehouse는 데이터 웨어하우징 워크로드에 최적화된 자동 구동, 자가 보안, 자가 복구 데이터베이스 서비스입니다. 하드웨어를 구성 또는 관리하거나 소프트웨어를 설치할 필요가 없습니다. Oracle Cloud Infrastructure는 데이터베이스 생성과 데이터베이스 백업, 패치, 업그레이드 및 튜닝을 처리합니다.

  • 분석, 학습, 예측

    소비자에 대한 데이터의 논리적 비즈니스 뷰를 추상화합니다. 이 추상화는 개발, 대상 아키텍처로 마이그레이션 및 여러 통합 소스에서 단일 보고 계층의 프로비저닝에 대한 민첩한 접근 방식을 지원합니다.



informatica-oci-arch-oracle.zip

위 아키텍처에서 컴퓨트 구성은 Informatica Cloud Secure Agent를 호스트합니다. Informatica Cloud Secure Agent는 모든 작업을 실행하고 조직과 Informatica Intelligent Data Management Cloud 간의 방화벽 간 보안 통신을 지원하는 경량 프로그램입니다. Secure Agent는 작업을 실행할 때 Informatica Cloud 호스팅 기능에 연결하여 작업 정보에 액세스합니다. 소스 및 대상에 직접 안전하게 연결하고, 소스와 대상 간에 데이터를 전송하고, 작업 흐름을 조정하고, 프로세스를 실행하고, 추가 작업 요구사항을 수행합니다.

구조에는 다음과 같은 구성 요소가 있습니다.

  • 테넌시

    테넌시는 Oracle Cloud Infrastructure에 등록할 때 Oracle이 Oracle Cloud 내에서 설정하는 격리된 보안 파티션입니다. 테넌시 내 Oracle Cloud에서 리소스를 생성, 구성 및 관리할 수 있습니다. 테넌시는 회사 또는 조직과 동의어입니다. 일반적으로 회사는 단일 테넌시를 갖고 해당 테넌시 내의 조직 구조를 반영합니다. 일반적으로 단일 테넌시는 단일 구독에 연결되며, 단일 구독에는 일반적으로 하나의 테넌시만 있습니다.

  • 지역

    Oracle Cloud Infrastructure 지역은 가용성 도메인이라고 하는 하나 이상의 데이터 센터를 포함하는 지역화된 지리적 영역입니다. 지역은 다른 지역과 독립적이며, 방대한 거리로 이들을 분리할 수 있습니다(국가 또는 대륙 간).

  • 가용성 도메인

    가용성 도메인은 한 지역 내의 독립형 데이터 센터입니다. 각 가용성 도메인의 물리적 리소스는 내결함성을 제공하는 다른 가용성 도메인의 리소스와 분리됩니다. 가용성 도메인은 전원, 냉각 또는 내부 가용성 도메인 네트워크와 같은 인프라를 공유하지 않습니다. 따라서 하나의 가용성 도메인에서 장애가 발생하면 해당 영역의 다른 가용성 도메인에 영향을 주지 않습니다.

  • 구획

    구획은 Oracle Cloud Infrastructure 테넌시 내의 지역 간 논리적 파티션입니다. 구획을 사용하여 Oracle Cloud에서 리소스를 구성하고, 리소스에 대한 액세스를 제어하고, 사용 할당량을 설정합니다. 제공된 구획의 리소스에 대한 액세스를 제어하려면 리소스에 액세스할 수 있는 사용자 및 수행할 수 있는 작업을 지정하는 정책을 정의합니다.

  • VCN(가상 클라우드 네트워크) 및 서브넷

    VCN은 Oracle Cloud Infrastructure 영역에서 설정하는 커스터마이징 가능한 소프트웨어 정의 네트워크입니다. 기존의 데이터 센터 네트워크와 마찬가지로 VCN도 네트워크 환경을 완벽하게 제어할 수 있습니다. VCN에는 VCN을 생성한 후 변경할 수 있는 겹치지 않는 여러 CIDR 블록이 있을 수 있습니다. VCN을 서브넷으로 분할할 수 있으며, 지역 또는 가용성 도메인으로 범위가 지정될 수 있습니다. 각 서브넷은 VCN의 다른 서브넷과 겹치지 않는 연속적인 주소 범위로 구성됩니다. 서브넷을 생성한 후 크기를 변경할 수 있습니다. 서브넷은 공용 또는 전용일 수 있습니다.

  • 보안 목록

    각 서브넷에 대해 서브넷에 들어오고 나가야 하는 트래픽의 소스, 대상, 유형을 지정하는 보안 규칙을 생성할 수 있습니다.

  • 경로 테이블

    가상 라우트 테이블에는 일반적으로 게이트웨이를 통해 서브넷에서 VCN 외부의 대상으로 트래픽을 라우팅하는 규칙이 포함됩니다.

  • 인터넷 게이트웨이

    인터넷 게이트웨이는 VCN의 공용 서브넷과 공용 인터넷 사이의 트래픽을 허용합니다.

  • NAT(네트워크 주소 변환) 게이트웨이

    NAT 게이트웨이를 사용하면 VCN의 전용 리소스가 수신 인터넷 연결에 리소스를 노출하지 않고도 인터넷의 호스트에 접근할 수 있습니다.

  • 서비스 게이트웨이

    서비스 게이트웨이는 VCN에서 Oracle Cloud Infrastructure Object Storage와 같은 다른 서비스에 대한 접근을 제공합니다. VCN에서 Oracle 서비스로의 트래픽은 Oracle 네트워크 패브릭을 통해 이동하며 인터넷을 경유하지 않습니다.

  • 배스천 서비스

    Oracle Cloud Infrastructure Bastion은 공용 엔드포인트가 없는 리소스 및 베어메탈 및 가상 머신, Oracle MySQL Database Service, Autonomous Transaction Processing(ATP), Oracle Container Engine for Kubernetes(OKE) 및 SSH(Secure Shell Protocol) 접근을 허용하는 기타 리소스에 대한 제한적이고 시간 제한적인 보안 접근을 제공합니다. Oracle Cloud Infrastructure 배스천 서비스를 사용하면 점프 호스트를 배치하고 유지 관리하지 않고도 전용 호스트에 액세스할 수 있습니다. 또한 ID 기반 권한과 중앙 집중식, 감사 및 시간 제한 SSH 세션을 통해 보안 상태를 개선할 수 있습니다. Oracle Cloud Infrastructure Bastion은 배스천 접근을 위해 공용 IP가 필요하지 않으며 원격 접근을 제공할 때 원활하고 잠재적인 공격 표면을 없앨 수 있습니다.

  • 컴퓨트

    Oracle Cloud Infrastructure Compute 서비스를 사용하면 클라우드의 컴퓨트 호스트를 프로비저닝하고 관리할 수 있습니다. CPU, 메모리, 네트워크 대역폭, 스토리지 리소스 요구사항을 충족하는 구성으로 컴퓨트 인스턴스를 실행할 수 있습니다. 컴퓨트 인스턴스를 만든 후 안전하게 접근하고, 다시 시작하고, 볼륨을 연결 및 분리하고, 더 이상 필요하지 않을 때는 종료할 수 있습니다.

  • IAM(ID 및 액세스) 관리

    Oracle Cloud Infrastructure Identity and Access Management(IAM)는 Oracle Cloud Infrastructure(OCI) 및 Oracle Cloud Applications의 접근 제어 플레인입니다. IAM API 및 사용자 인터페이스를 통해 ID 도메인 및 ID 도메인 내의 리소스를 관리할 수 있습니다. 각 OCI IAM ID 도메인은 독립형 ID 및 액세스 관리 솔루션 또는 서로 다른 사용자 모집단을 나타냅니다.

  • 정책

    Oracle Cloud Infrastructure Identity and Access Management 정책은 어떤 리소스에 접근할 수 있는 사용자와 방법을 지정합니다. 접근 권한은 그룹 및 구획 레벨에서 부여되므로 특정 구획 또는 테넌시 내에서 그룹에 특정 유형의 접근 권한을 부여하는 정책을 작성할 수 있습니다.

  • 오브젝트 스토리지

    오브젝트 스토리지는 데이터베이스 백업, 애널리틱스 데이터, 이미지 및 비디오와 같은 풍부한 컨텐츠를 포함하여 모든 컨텐츠 유형의 구조적 및 비구조적 대량 데이터에 빠르게 접근할 수 있습니다. 인터넷을 통해 또는 클라우드 플랫폼 내에서 직접 안전하게 데이터를 저장하고 검색할 수 있습니다. 성능 또는 서비스 안정성이 저하되지 않으면서 스토리지를 원활하게 확장할 수 있습니다. 빠르고 즉각적이며 자주 액세스해야 하는 "핫" 스토리지에 표준 스토리지를 사용합니다. 장기간 보존하고 거의 액세스하지 않는 "콜드" 스토리지에 아카이브 스토리지를 사용합니다.

  • Autonomous Data Warehouse

    Oracle Autonomous Data Warehouse는 데이터 웨어하우징 워크로드에 최적화된 자동 구동, 자가 보안, 자가 복구 데이터베이스 서비스입니다. 하드웨어를 구성 또는 관리하거나 소프트웨어를 설치할 필요가 없습니다. Oracle Cloud Infrastructure는 데이터베이스 생성과 데이터베이스 백업, 패치, 업그레이드 및 튜닝을 처리합니다.

권장 사항

다음 권장사항을 Oracle Cloud에서 Informatica IDMC 플랫폼을 통합하는 시작점으로 사용하십시오.

요구 사항은 여기에 설명된 아키텍처와 다를 수 있습니다.

  • VCN(가상 클라우드 네트워크)

    VCN을 생성할 때 VCN의 서브넷에 연결할 리소스의 수에 따라 필요한 CIDR 블록 수 및 각 블록의 크기를 결정합니다. 표준 전용 IP 주소 공간 내에 있는 CIDR 블록을 사용합니다.

    전용 접속을 설정하려는 다른 네트워크(Oracle Cloud Infrastructure, 온프레미스 데이터 센터 또는 다른 클라우드 제공자)와 겹치지 않는 CIDR 블록을 선택합니다.

    VCN을 생성한 후 해당 CIDR 블록을 변경, 추가 및 제거할 수 있습니다.

    서브넷을 설계할 때는 트래픽 플로우와 보안 요구사항을 고려하십시오. 특정 계층 또는 역할 내의 모든 리소스를 보안 경계로 사용할 수 있는 동일한 서브넷에 연결합니다.

    지역 서브넷 사용

  • 가상 시스템 및 기타 권장 사항

    가상 시스템 크기 조정 및 기타 권장 사항은 Deploy(배치) 섹션의 링크를 참조하십시오.

  • 보안 목록

    보안 목록을 사용하여 전체 서브넷에 적용되는 수신 및 송신 규칙을 정의하십시오.

고려 사항

Oracle Cloud에서 Informatica IDMC 플랫폼을 통합할 때는 이러한 구현 옵션을 고려해 보십시오.

Informatica 통합 Data Refinery 데이터 지속성 플랫폼
권장사항 Informatica Intelligent Data Management Cloud(IDMC) Oracle Autonomous Data Warehouse(Adw)
기타 옵션 해당 사항 없음 Exadata
근거 Informatica는 Informatica IDMC를 가장 포괄적인 마이크로서비스 기반 API 기반의 AI 기반 엔터프라이즈 통합 서비스형 플랫폼으로 간주합니다. IDMC를 사용하면 Informatica가 통합 및 거버넌스 요구사항을 충족하는 데 사용할 수 있는 모든 클라우드 서비스를 유연하게 사용할 수 있습니다. ADW는 탄력적으로 확장되고 빠른 쿼리 성능을 제공하며 데이터베이스 관리가 필요 없는 사용하기 쉽고 완전한 자율운영 데이터베이스입니다. 또한 외부 테이블을 사용하여 오브젝트 스토리지에서 데이터에 직접 접근할 수 있습니다.

배치

Terraform 코드는 Oracle Cloud Infrastructure Resource Manager에서 샘플 스택으로 사용할 수 있습니다. GitHub에서 코드를 다운로드하고 요구 사항에 맞게 사용자 정의할 수도 있습니다.

  • Oracle Cloud Infrastructure Resource Manager의 샘플 스택을 사용하여 배포합니다.
    1. Oracle Cloud에 배포로 이동합니다.

      아직 사인인하지 않은 경우 테넌시 및 사용자 인증서를 입력합니다.

    2. 스택을 배치할 영역을 선택합니다.
    3. 화면 프롬프트와 지침에 따라 스택을 생성합니다.
    4. 스택을 생성한 후 Terraform 작업을 누르고 계획을 선택합니다.
    5. 작업이 완료될 때까지 기다린 후 계획을 검토합니다.

      변경하려면 Stack Details(스택 세부정보) 페이지로 돌아가서 Edit Stack(스택 편집)을 누르고 필요에 따라 변경합니다. 그런 다음 Plan 작업을 다시 실행합니다.

    6. 추가 변경이 필요하지 않은 경우 스택 세부정보 페이지로 돌아가서 Terraform 작업을 누르고 적용을 선택합니다.
  • GitHub에서 Terraform 코드를 사용하여 배포:
    1. GitHub으로 이동합니다.
    2. 저장소를 로컬 컴퓨터로 복제하거나 다운로드합니다.
    3. README 문서의 지침을 따릅니다.

로그 변경

이 로그에는 중요한 변경 사항이 나열됩니다.

수락

  • Authors: Larry Fumagalli, Wei Han
  • 제공자: Robert Lies