참고:

ODBC 및 Kerberos를 사용하여 Alteryx를 Oracle Big Data Service Hive에 연결

소개

Oracle Big Data Service는 사용자가 Hadoop 클러스터, Spark 클러스터 및 기타 빅데이터 서비스를 생성하고 관리할 수 있도록 해주는 Oracle의 클라우드 기반 서비스입니다. 기본적으로 Oracle Big Data Service 클러스터는 사용자 이름 및 암호와 같은 단순 인증 방식을 사용하여 사용자 및 서비스를 인증합니다. 그러나 더 높은 수준의 보안이 필요한 조직에게는 충분하지 않을 수 있습니다.

Kerberos 인증은 분산 컴퓨팅 시스템을 보호하는 데 널리 사용되는 방식입니다. 사용자 및 서비스를 인증하는 안전한 방법을 제공하여 네트워크를 통해 안전하게 통신할 수 있습니다. Kerberos 사용 환경에서 사용자 및 서비스는 ID를 확인하고 리소스에 대한 액세스 권한을 부여하는 데 사용되는 암호화 키와 함께 실행됩니다.

Kerberos 인증은 노드 간에 강력한 인증 및 암호화를 사용으로 설정하여 Oracle Big Data Service 클러스터에 대한 추가 보안 계층을 제공할 수 있습니다.

목표

Kerberos화된 클러스터 내에서 Alteryx와 Oracle Big Data Service Hive 간의 원활한 연결을 설정하는 프로세스를 살펴보십시오. Kerberos 인증을 구현함으로써 데이터 처리 및 분석을 위한 안전한 환경을 보장할 수 있습니다.

필요 조건

필요한 서비스가 구성되고 포트가 열려 있는 OCI(Oracle Cloud Infrastructure)에서 실행되는 Oracle Big Data Service 클러스터입니다.

주: HA(고가용성) Oracle Big Data Service 클러스터에는 Kerberos가 설치되어 있습니다. 비HA 클러스터를 사용하려면 다음 필수 조건 목록이 필요합니다.

주: 이 자습서에서는 Oracle Big Data Service HA 클러스터를 사용하고 있습니다. 또한 다음 개념과 용어에 대한 기본적인 이해가 있어야 합니다.

작업 1: Oracle Big Data Service 클러스터 Kerberos화

  1. SSH 명령을 통해 또는 opc 사용자 인증서를 사용하여 ppk 파일에 putty를 사용하여 Oracle Big Data Service 클러스터 마스터 노드에 로그인합니다. 로그인한 후 권한을 root 사용자로 높입니다. 이 자습서에서는 putty를 사용하여 노드에 로그인했습니다.

  2. Ambari를 사용하여 실행 중인 모든 Hadoop 및 Spark 서비스를 중지합니다.

    Ambari Stop 서비스

  3. 다음 단계에 따라 bdsuser Administrator Kerberos 주체를 만듭니다.

    • Kadmin.local 명령을 사용하여 Kadmin 프롬프트를 입력합니다.

    • kadmin.local의 명령줄 프롬프트에서 addprinc 명령을 실행하여 bdsuser라는 새 Kerberos 주체를 만듭니다. 프롬프트가 나타나면 환경 설정의 암호를 선택하고 확인합니다.

      addprinc 명령 실행

    • exit를 입력하여 원래 프롬프트로 돌아갑니다. 기본적으로 여기에 사용된 영역은 krb5.conf에서 선택됩니다. 그러나 구성을 업데이트하여 영역을 사용자 정의할 수 있습니다.

  4. dcli -C "groupadd bdsusergroup 명령을 실행하여 bdsusergroup 그룹을 만듭니다.

  5. 프롬프트에 dcli -C "useradd -g bdsusergroup -G hdfs,hadoop,hive bdsuser" 명령을 입력하여 bdsuser 관리자 사용자를 만들고 클러스터의 각 노드에서 나열된 그룹에 추가합니다.

  6. linux id 명령을 사용하여 bdsuser 생성을 확인하고 그룹 멤버쉽을 나열합니다.

  7. Ambari를 사용하여 모든 Oracle Big Data Service 서비스를 시작합니다.

    Ambari 시작 서비스

  8. kinit bdsuser 명령을 사용하여 Kerberos 티켓을 생성하고 hadoop fs -ls / 명령을 사용하여 파일을 나열하여 bdsuser를 테스트합니다.

    명령 프롬프트

작업 2: Alteryx를 Oracle Big Data Service Hive에 연결

Oracle Big Data Service 클러스터의 Kerberos화를 살펴보았고 이제 ODBC 드라이버를 사용하여 Alteryx를 Kerberos화된 Oracle Big Data Service Hive와 연결하는 방법을 다룰 예정입니다.

Oracle Big Data Service Hive 데이터의 잠재력을 최대한 활용하려면 선호하는 도구와 연결을 설정하는 것이 중요합니다. 이 섹션에서는 Alteryx를 Oracle Big Data Service Hive에 연결하는 프로세스를 안내합니다. 이를 위해 Kerberos 인증을 사용하는 ODBC 연결을 구성합니다.

  1. 다음 단계에 따라 MIT Kerberos를 구성합니다.

    • krb5.confkrb5.keytab 파일을 클러스터 마스터 노드에서 C:\Program Files\MIT\Kerberos로 복사합니다.

    • Windows 호환성을 위해 파일 확장자를 .conf에서 .ini로 변경합니다.

    • 새 폴더 C:/temp를 생성합니다(폴더 및 경로는 사용자가 선택할 수 있음).

    • 다음 환경 변수를 설정합니다.

      환경 변수

    • 명령 프롬프트에서 Kinit bdsuser 명령을 실행하여 Kerberos 설정을 확인하고 티켓을 생성합니다.

  2. Windows 시스템에 ODBC 드라이버를 설치합니다. 메시지에 따라 드라이버를 설치합니다.

  3. 다음 단계에 따라 ODBC 드라이버를 구성합니다.

    • 마스터 및 유틸리티 노드에 대해 hosts 파일 C:\Windows\System32\drivers\etc에 DNS 및 IP 항목을 만듭니다.

      샘플 hosts 파일

    • ping 명령을 사용하여 hosts 파일 항목을 테스트합니다.

      대체 텍스트

  4. 시스템에서 ODBC 데이터 소스 관리자 도구를 열고 다음 단계를 수행합니다.

    • System DSN 탭을 선택합니다. Apache Hive용 Cloudera ODBC 드라이버 추가 및 선택을 누른 다음 완료를 누릅니다.

      시스템 DSN 탭

    • Hive 접속 구성을 위해 아래 스크린샷을 따르십시오.

      Hive 접속 구성

    • 테스트를 눌러 접속을 확인합니다. 모든 항목이 올바르게 설정된 경우 테스트가 성공했음을 나타내는 메시지가 표시되어야 합니다. OK(확인)를 눌러 설정을 저장합니다.

      Hive 접속 테스트

  5. Alteryx를 열고 다음 단계를 수행하십시오.

    • 파일로 이동하여 접속 관리를 선택하고 데이터 소스 추가를 누릅니다. 사용 가능한 기술 옵션에서 Hive를 선택합니다.

      연결 관리

    • 기술 옵션을 선택하면 DSN 이름을 제공해야 하는 다음 화면이 표시됩니다. 이전 단계에서 만든 ODBC DSN을 선택하고 저장을 누릅니다.

      연결 저장

    • 연결 설정을 완료했습니다. 이제 Hive의 데이터를 읽는 샘플 워크플로우를 구축해 보겠습니다. 샘플 워크플로우를 생성하려면 새 워크플로우를 누른 다음 입력 데이터 태스크를 끌어 놓습니다.

      새 워크플로우

    • 연결 리스트에서 Hive ODBC를 선택합니다.

      접속 목록

    • 데이터를 인출할 Hive 테이블을 선택합니다.

      Hive 테이블

    • 워크플로우를 실행하면 Alteryx가 Oracle Big Data Service Hive에서 데이터를 성공적으로 검색할 수 있음을 알 수 있습니다.

      워크플로우 실행

다음 단계

Kerberos 인증은 보안 Hadoop 클러스터의 필수 구성 요소입니다. Oracle Big Data Service 클러스터를 Kerberos화하면 민감한 데이터와 애플리케이션을 무단 액세스로부터 더 잘 보호할 수 있습니다. 클러스터를 Kerberos화하는 프로세스는 어려울 수 있지만 세부 사항을 신중하게 계획하고 주의하면 성공적인 구현을 보장할 수 있습니다. 또한 ODBC 및 Kerberos 인증을 사용하여 Oracle Big Data Service Hive에 Alteryx를 연결하는 것은 까다로울 수 있지만 설정한 후에는 Alteryx를 사용하여 Oracle Big Data Service 데이터를 분석하고 시각화할 수 있습니다. 이 자습서에 설명된 단계에 따라 쉽게 연결을 설정할 수 있어야 합니다.

문제가 발생하면 문제를 해결할 수 있습니다. 약간의 지속성을 통해 Alteryx를 Oracle Big Data Service Hive에 연결하여 데이터의 잠재력을 최대한 활용할 수 있습니다.

감사의 글

추가 학습 자원

docs.oracle.com/learn에서 다른 실습을 살펴보거나 Oracle Learning YouTube 채널에서 더 많은 무료 학습 콘텐츠에 액세스하십시오. 또한 Oracle Learning Explorer가 되려면 education.oracle.com/learning-explorer를 방문하십시오.

제품 설명서는 Oracle Help Center를 참조하십시오.