OCI 데이터 흐름 SQL 끝점 분석 개요

Oracle Analytics Cloud를 사용하여 오브젝트 스토리지, 데이터 레이크 및 애플리케이션에서 OCI 데이터 흐름 SQL 끝점의 데이터를 분석합니다.

데이터 흐름 SQL 끝점은 개발자, 데이터 과학자, 고급 분석가가 데이터 레이크에 있는 데이터를 직접 대화식으로 질의할 수 있도록 설계되었습니다.

OCI 데이터 흐름 SQL 끝점 사용 시의 이점

  • 성능을 위해 데이터를 이동하고 요약할 필요 없이 데이터 레이크에서 바로 대용량 이벤트 및 시계열 데이터를 분석할 수 있습니다.
  • 여러 애플리케이션 및 데이터 저장소(예: Enterprise Resource Planning)의 데이터를 오브젝트 스토리지로 통합하고 데이터의 출처에 관계없이 임시 질의를 수행할 수 있습니다.
  • 추출 및 사전 집계를 생략하고 모든 세분성 레벨에서 실시간 데이터에 대해 작업을 수행할 수 있습니다. 따라서 데이터를 준비할 때 시간과 노력을 절약할 수 있을 뿐만 아니라 보다 강력한 분석 기능을 사용할 수 있습니다.
성능을 위한 최적의 방법


  • Spark 클러스터 계층에서 인덱싱 및 캐싱을 활용하려면 단일 테이블 또는 뷰를 기반으로 데이터 집합을 생성합니다. 다중 테이블 조인에 기반한 데이터 집합은 지원되지만 권장되지는 않습니다.
  • OCI 데이터 흐름 SQL 끝점 클러스터를 구성할 때 incrementalCollect를 true로 설정합니다. 예를 들면 다음과 같습니다.

    spark.sql.thriftServer.incrementalCollect=true;

OCI 데이터 흐름 SQL 끝점에서 데이터 시각화

Oracle Analytics Cloud 워크북 편집기에서 OCI 데이터 흐름 SQL 끝점 테이블 또는 큐브를 여러 개 추가합니다. 테이블 또는 큐브를 선택하면 분석을 위해 데이터 집합에 차원 열 및 측정항목 열을 추가할 수 있습니다.