주:

Kerberos 없이 고가용성 클러스터에 대해 Oracle Big Data Service 색조에서 Trino 편집기 사용

소개

Oracle Big Data Service(BDS)는 사용자가 Hadoop 클러스터, Spark 클러스터, Trino 및 기타 빅데이터 서비스를 생성하고 관리할 수 있는 클라우드 기반 서비스입니다. 빅 데이터 분석의 세계에서 Trino는 대용량 데이터 세트에서 대화형 분석 쿼리를 실행하도록 설계된 고성능 분산 SQL 쿼리 엔진입니다. Trino를 사용하면 통합 SQL 인터페이스 내에서 Hadoop 분산 파일 시스템(HDFS), OCI 버킷, 기존 관계형 데이터베이스 등 여러 소스에서 데이터를 쿼리할 수 있습니다. 대기 시간이 짧은 대규모 데이터를 처리할 수 있는 능력 덕분에 데이터 엔지니어와 분석가 모두에게 강력한 도구가 되었습니다.

Trino와 BDS Hue를 통합하면 데이터 쿼리를 위한 원활한 인터페이스를 제공하여 데이터 쿼리 기능을 크게 향상시킬 수 있습니다. 이 사용지침서에서는 Kerberos 인증이 제자리에 없는 경우 Hue를 사용하여 HA(고가용성) 클러스터 환경에서 Trino 편집기를 사용으로 설정하는 단계를 안내합니다. 이러한 작업을 수행하면 Trino와 연결하고 강력한 쿼리 기능을 효과적으로 활용할 수 있도록 Hue 환경을 구성할 수 있습니다.

목표

필요 조건

주: 이 자습서에서는 사용자가 비Kerberos HA 클러스터로 작업한다고 가정합니다. Kerberos화된 환경을 사용하는 경우 Kerberos 인증과 관련된 추가 구성 단계가 필요합니다.

작업 1: Trino JDBC 드라이버 다운로드 및 설치

  1. Maven에서 Trino JDBC 드라이버 JAR 파일을 다운로드하고 JAR 파일을 BDS 환경의 UNO 노드(Hue가 실행 중인 경우)에 저장하지만, 이 자습서의 목적에 따라 /tmp 디렉토리에 배치됩니다.

  2. Trino 통합에 대한 색조를 구성합니다.

    1. Apache Ambari에 로그인하고 Hue, configAdvanced로 이동합니다.

    2. Advanced pseudo-distributed.ini을 누르고 interpreters를 찾습니다.

    색조 구성 선택

  3. 구성을 편집하려면 interpreters 섹션 내에 다음 구성을 추가합니다.

    색조 구성 편집

    JDBC URL이 Trino 조정자의 FQDN(전체 도메인 이름)과 일치하고 드라이버 클래스 이름이 올바른지 확인하십시오.

작업 2: Hue에 대한 Python 구성 업데이트

  1. Python 게이트웨이 구성을 찾아 수정합니다.

    Hue 서버(UNO)에서 /usr/odh/2.0.7/hue/build/env/lib/python2.7/site-packages/py4j-0.9-py2.7.egg/py4j/java_gateway.py 파일로 이동합니다.

    주: 편집하기 전에 이 파일의 백업을 생성하십시오.

  2. Python 파일을 편집합니다.

    1. java_gateway.py를 열고 classpath가 정의된 위치를 찾습니다.

    2. JDBC 드라이버 경로를 포함하려면 다음 행을 추가합니다. 이렇게 하면 Hue에서 Trino JDBC 드라이버를 찾아서 사용할 수 있습니다.

      python 구성 업데이트

작업 3: 색조 서비스 다시 시작

  1. Apache Ambari로 돌아가서 Hue 서비스를 다시 시작하여 새 구성을 적용합니다.

  2. Hue에서 편집기 사용을 확인합니다.

    1. 다시 시작한 후 Hue 서버 인터페이스를 열고 메뉴에 Trino 편집기가 나타나는지 확인합니다.

      Trino 편집기 메뉴

    2. 인증서를 입력하라는 메시지가 표시되면 Usernametrino으로, Passwordtrino로 입력합니다.

      인증

작업 4: Trino Editor를 사용하여 데이터 Query

  1. Trino 편집기에 액세스하여 sql query를 실행합니다.

    1. Trino 편집기로 이동하여 쿼리를 실행할 데이터베이스를 선택하십시오.

    2. 이제 Hue 내에서 Trino 인스턴스에 대해 SQL 쿼리를 실행할 수 있습니다.

      질의 실행

문제 해결 및 팁

다음 단계

이러한 작업을 수행하면 Trino 편집기를 BDS Hue 환경에 성공적으로 통합해야합니다. 이 통합은 데이터 쿼리 기능을 향상시켜 Hue에서 직접 Trino의 고급 쿼리 기능을 활용할 수 있도록 합니다. 문제가 발생하면 문제 해결 팁을 검토하거나 설명서 또는 커뮤니티 포럼에서 추가 지원을 받으십시오.

감사의 글

추가 학습 자원

docs.oracle.com/learn에서 다른 실습을 탐색하거나 Oracle Learning YouTube 채널에서 더 많은 무료 학습 콘텐츠에 액세스하세요. 또한 Oracle Learning Explorer가 되려면 education.oracle.com/learning-explorer을 방문하십시오.

제품 설명서는 Oracle Help Center를 참조하십시오.