참고:

이 사용지침서에서는 Oracle Cloud에 접근해야 합니다. 무료 계정에 등록하려면 Oracle Cloud Infrastructure Free Tier 시작하기를 참조하십시오.
Oracle Cloud Infrastructure 인증서, 테넌시 및 구획에 대한 예제 값을 사용합니다. 실습을 완료하면 이러한 값을 클라우드 환경에 고유한 값으로 대체합니다.

ODBC 및 Kerberos를 사용하여 Alteryx를 Oracle Big Data Service Hive에 연결

소개

Oracle Big Data Service는 사용자가 Hadoop 클러스터, Spark 클러스터 및 기타 빅데이터 서비스를 생성하고 관리할 수 있도록 해주는 Oracle의 클라우드 기반 서비스입니다. 기본적으로 Oracle Big Data Service 클러스터는 사용자 이름 및 암호와 같은 단순 인증 방식을 사용하여 사용자 및 서비스를 인증합니다. 그러나 더 높은 수준의 보안이 필요한 조직에게는 충분하지 않을 수 있습니다.

Kerberos 인증은 분산 컴퓨팅 시스템을 보호하는 데 널리 사용되는 방식입니다. 사용자 및 서비스를 인증하는 안전한 방법을 제공하여 네트워크를 통해 안전하게 통신할 수 있습니다. Kerberos 사용 환경에서 사용자 및 서비스는 ID를 확인하고 리소스에 대한 액세스 권한을 부여하는 데 사용되는 암호화 키와 함께 실행됩니다.

Kerberos 인증은 노드 간에 강력한 인증 및 암호화를 사용으로 설정하여 Oracle Big Data Service 클러스터에 대한 추가 보안 계층을 제공할 수 있습니다.

목표

Kerberos화된 클러스터 내에서 Alteryx와 Oracle Big Data Service Hive 간의 원활한 연결을 설정하는 프로세스를 살펴보십시오. Kerberos 인증을 구현함으로써 데이터 처리 및 분석을 위한 안전한 환경을 보장할 수 있습니다.

Oracle Big Data Service 클러스터를 Kerberos화하는 방법 알아보기
Alteryx를 Oracle Big Data Service Hive에 연결하는 방법 알아보기

필요 조건

필요한 서비스가 구성되고 포트가 열려 있는 OCI(Oracle Cloud Infrastructure)에서 실행되는 Oracle Big Data Service 클러스터입니다.

주: HA(고가용성) Oracle Big Data Service 클러스터에는 Kerberos가 설치되어 있습니다. 비HA 클러스터를 사용하려면 다음 필수 조건 목록이 필요합니다.

Kerberos KDC(키 배포 센터) 및 Kerberos 관리 서버입니다. KDC 및 관리 서버를 별도의 서버에 설치 및 구성하거나 조직에서 제공하는 KDC 및 관리 서버를 사용할 수 있습니다.
Kerberos 주체 및 키 탭을 만들고 관리하는 데 사용되는 kadmin 유틸리티입니다.
사용자 또는 서비스 주체에 대한 Kerberos TGT(티켓 부여 티켓)를 얻는 데 사용되는 kinit 유틸리티입니다.
사용자 또는 서비스 주체의 자격 증명 캐시에 있는 티켓을 나열하는 데 사용되는 klist 유틸리티입니다.
Alteryx가 설치된 Windows 시스템입니다. 이 자습서의 구현을 위해 Alteryx 시험 버전을 사용했습니다.
MIT Kerberos
시스템에 설치된 ODBC 드라이버입니다.
Oracle Big Data Service 클러스터에 필요한 Kerberos 주체 및 키 탭입니다. 자세한 내용은 다음 절을 참조하십시오.
시스템에서 ODBC 데이터 소스 관리자 도구에 액세스합니다.

주: 이 자습서에서는 Oracle Big Data Service HA 클러스터를 사용하고 있습니다. 또한 다음 개념과 용어에 대한 기본적인 이해가 있어야 합니다.

Kerberos 주체: Kerberos 시스템에서 인증되는 엔티티입니다. 주체는 사용자 또는 서비스일 수 있습니다.
Keytabs: 주체의 보안 키를 포함하는 파일입니다. Keytabs는 서비스에서 KDC에 인증하는 데 사용됩니다.
영역: Kerberos 영역은 공통 KDC 데이터베이스를 공유하는 Kerberos 주체 모음입니다.
인증: 사용자 또는 서비스 주체의 ID를 확인하는 프로세스입니다.
권한 부여: 사용자 또는 서비스 주체가 액세스할 수 있는 리소스를 결정하는 프로세스입니다.

작업 1: Oracle Big Data Service 클러스터 Kerberos화

SSH 명령을 통해 또는 opc 사용자 인증서를 사용하여 ppk 파일에 putty를 사용하여 Oracle Big Data Service 클러스터 마스터 노드에 로그인합니다. 로그인한 후 권한을 root 사용자로 높입니다. 이 자습서에서는 putty를 사용하여 노드에 로그인했습니다.
Ambari를 사용하여 실행 중인 모든 Hadoop 및 Spark 서비스를 중지합니다.
다음 단계에 따라 bdsuser Administrator Kerberos 주체를 만듭니다.
- Kadmin.local 명령을 사용하여 Kadmin 프롬프트를 입력합니다.
- kadmin.local의 명령줄 프롬프트에서 addprinc 명령을 실행하여 bdsuser라는 새 Kerberos 주체를 만듭니다. 프롬프트가 나타나면 환경 설정의 암호를 선택하고 확인합니다.
- exit를 입력하여 원래 프롬프트로 돌아갑니다. 기본적으로 여기에 사용된 영역은 krb5.conf에서 선택됩니다. 그러나 구성을 업데이트하여 영역을 사용자 정의할 수 있습니다.
dcli -C "groupadd bdsusergroup 명령을 실행하여 bdsusergroup 그룹을 만듭니다.
프롬프트에 dcli -C "useradd -g bdsusergroup -G hdfs,hadoop,hive bdsuser" 명령을 입력하여 bdsuser 관리자 사용자를 만들고 클러스터의 각 노드에서 나열된 그룹에 추가합니다.
linux id 명령을 사용하여 bdsuser 생성을 확인하고 그룹 멤버쉽을 나열합니다.
Ambari를 사용하여 모든 Oracle Big Data Service 서비스를 시작합니다.
kinit bdsuser 명령을 사용하여 Kerberos 티켓을 생성하고 hadoop fs -ls / 명령을 사용하여 파일을 나열하여 bdsuser를 테스트합니다.

작업 2: Alteryx를 Oracle Big Data Service Hive에 연결

Oracle Big Data Service 클러스터의 Kerberos화를 살펴보았고 이제 ODBC 드라이버를 사용하여 Alteryx를 Kerberos화된 Oracle Big Data Service Hive와 연결하는 방법을 다룰 예정입니다.

Oracle Big Data Service Hive 데이터의 잠재력을 최대한 활용하려면 선호하는 도구와 연결을 설정하는 것이 중요합니다. 이 섹션에서는 Alteryx를 Oracle Big Data Service Hive에 연결하는 프로세스를 안내합니다. 이를 위해 Kerberos 인증을 사용하는 ODBC 연결을 구성합니다.

다음 단계에 따라 MIT Kerberos를 구성합니다.
- krb5.conf 및 krb5.keytab 파일을 클러스터 마스터 노드에서 C:\Program Files\MIT\Kerberos로 복사합니다.
- Windows 호환성을 위해 파일 확장자를 .conf에서 .ini로 변경합니다.
- 새 폴더 C:/temp를 생성합니다(폴더 및 경로는 사용자가 선택할 수 있음).
- 다음 환경 변수를 설정합니다.
- 명령 프롬프트에서 Kinit bdsuser 명령을 실행하여 Kerberos 설정을 확인하고 티켓을 생성합니다.
Windows 시스템에 ODBC 드라이버를 설치합니다. 메시지에 따라 드라이버를 설치합니다.
다음 단계에 따라 ODBC 드라이버를 구성합니다.
- 마스터 및 유틸리티 노드에 대해 hosts 파일 C:\Windows\System32\drivers\etc에 DNS 및 IP 항목을 만듭니다.
- ping 명령을 사용하여 hosts 파일 항목을 테스트합니다.
시스템에서 ODBC 데이터 소스 관리자 도구를 열고 다음 단계를 수행합니다.
- System DSN 탭을 선택합니다. Apache Hive용 Cloudera ODBC 드라이버 추가 및 선택을 누른 다음 완료를 누릅니다.
- Hive 접속 구성을 위해 아래 스크린샷을 따르십시오.
- 테스트를 눌러 접속을 확인합니다. 모든 항목이 올바르게 설정된 경우 테스트가 성공했음을 나타내는 메시지가 표시되어야 합니다. OK(확인)를 눌러 설정을 저장합니다.
Alteryx를 열고 다음 단계를 수행하십시오.
- 파일로 이동하여 접속 관리를 선택하고 데이터 소스 추가를 누릅니다. 사용 가능한 기술 옵션에서 Hive를 선택합니다.
- 기술 옵션을 선택하면 DSN 이름을 제공해야 하는 다음 화면이 표시됩니다. 이전 단계에서 만든 ODBC DSN을 선택하고 저장을 누릅니다.
- 연결 설정을 완료했습니다. 이제 Hive의 데이터를 읽는 샘플 워크플로우를 구축해 보겠습니다. 샘플 워크플로우를 생성하려면 새 워크플로우를 누른 다음 입력 데이터 태스크를 끌어 놓습니다.
- 연결 리스트에서 Hive ODBC를 선택합니다.
- 데이터를 인출할 Hive 테이블을 선택합니다.
- 워크플로우를 실행하면 Alteryx가 Oracle Big Data Service Hive에서 데이터를 성공적으로 검색할 수 있음을 알 수 있습니다.

다음 단계

Kerberos 인증은 보안 Hadoop 클러스터의 필수 구성 요소입니다. Oracle Big Data Service 클러스터를 Kerberos화하면 민감한 데이터와 애플리케이션을 무단 액세스로부터 더 잘 보호할 수 있습니다. 클러스터를 Kerberos화하는 프로세스는 어려울 수 있지만 세부 사항을 신중하게 계획하고 주의하면 성공적인 구현을 보장할 수 있습니다. 또한 ODBC 및 Kerberos 인증을 사용하여 Oracle Big Data Service Hive에 Alteryx를 연결하는 것은 까다로울 수 있지만 설정한 후에는 Alteryx를 사용하여 Oracle Big Data Service 데이터를 분석하고 시각화할 수 있습니다. 이 자습서에 설명된 단계에 따라 쉽게 연결을 설정할 수 있어야 합니다.

문제가 발생하면 문제를 해결할 수 있습니다. 약간의 지속성을 통해 Alteryx를 Oracle Big Data Service Hive에 연결하여 데이터의 잠재력을 최대한 활용할 수 있습니다.

감사의 글

Authors - Pavan Upadhyay(주요 클라우드 엔지니어), Saket Bihari(주요 클라우드 엔지니어)

추가 학습 자원

docs.oracle.com/learn에서 다른 실습을 살펴보거나 Oracle Learning YouTube 채널에서 더 많은 무료 학습 콘텐츠에 액세스하십시오. 또한 Oracle Learning Explorer가 되려면 education.oracle.com/learning-explorer를 방문하십시오.

제품 설명서는 Oracle Help Center를 참조하십시오.

제목 및 저작권 정보

Connect Alteryx to Oracle Big Data Service Hive Using ODBC and Kerberos

F85222-01

August 2023