Nota:
- Questa esercitazione richiede l'accesso a Oracle Cloud. Per iscriversi a un account gratuito, consulta Inizia a utilizzare Oracle Cloud Infrastructure Free Tier.
- Utilizza valori di esempio per le credenziali, la tenancy e i compartimenti di Oracle Cloud Infrastructure. Al termine del laboratorio, sostituisci questi valori con quelli specifici del tuo ambiente cloud.
Connettere Alteryx a Oracle Big Data Service Hive mediante ODBC e Kerberos
Introduzione
Oracle Big Data Service è un servizio basato su cloud fornito da Oracle che consente agli utenti di creare e gestire cluster Hadoop, cluster Spark e altri servizi per Big Data. Per impostazione predefinita, un cluster Oracle Big Data Service utilizza meccanismi di autenticazione semplici, come nome utente e password, per autenticare utenti e servizi. Tuttavia, ciò potrebbe non essere sufficiente per le organizzazioni che richiedono livelli di sicurezza più elevati.
L'autenticazione Kerberos è un meccanismo ampiamente utilizzato per proteggere i sistemi di elaborazione distribuiti. Offre un modo sicuro per autenticare utenti e servizi, consentendo loro di comunicare in modo sicuro tramite una rete. In un ambiente abilitato per Kerberos gli utenti e i servizi vengono forniti con chiavi di cifratura utilizzate per verificare la propria identità e autorizzare l'accesso alle risorse.
L'autenticazione Kerberos può fornire un livello aggiuntivo di sicurezza per un cluster Oracle Big Data Service abilitando l'autenticazione e la cifratura efficaci tra i nodi.
Obiettivi
Esplora il processo di stabilire la connettività trasparente tra Alteryx e Oracle Big Data Service Hive all'interno di un cluster gestito in container. Implementando l'autenticazione Kerberos, possiamo garantire un ambiente sicuro per l'elaborazione e l'analisi dei dati.
- Scopri come ingrandire il cluster Oracle Big Data Service
- Scopri come connettere Alteryx a Oracle Big Data Service Hive
Prerequisiti
Un cluster Oracle Big Data Service in esecuzione su Oracle Cloud Infrastructure (OCI) con i servizi configurati e le porte aperte richieste.
Nota: un cluster Oracle Big Data Service ad alta disponibilità (HA) è dotato di Kerberos installato. Se si desidera utilizzare un cluster non HA, è necessario disporre della seguente lista di prerequisiti.
-
Un server di amministrazione del KDC (Key Distribution Center) Kerberos e Kerberos. È possibile installare e configurare il KDC e il server di amministrazione su un server separato oppure utilizzare il KDC e il server di amministrazione forniti dall'organizzazione.
-
La utility
kadmin
utilizzata per creare e gestire le identità e le tabelle di chiavi Kerberos. -
La utility
kinit
utilizzata per ottenere un ticket di concessione ticket (TGT) Kerberos per un utente o un principal del servizio. -
La utility
klist
utilizzata per elencare i ticket nella cache delle credenziali di un utente o del principal del servizio. -
Un computer Windows con Alteryx installato. Per l'implementazione in questo tutorial, abbiamo usato la versione di prova di Alteryx.
-
MIT Kerberos.
-
Driver ODBC installato sul computer.
-
Le identità e le tabelle di chiavi Kerberos necessarie per il cluster Oracle Big Data Service. Ulteriori dettagli sono disponibili nelle seguenti sezioni.
-
Accedere allo strumento Amministratore origine dati ODBC del computer.
Nota: in questa esercitazione viene utilizzato un cluster HA di Oracle Big Data Service. È inoltre necessario avere una conoscenza di base dei seguenti concetti e terminologie:
-
Principali Kerberos: entità autenticata dal sistema Kerberos. I principal possono essere utenti o servizi.
-
Keytabs: file che contiene la chiave segreta di un principal. Le tabelle di chiavi vengono utilizzate dai servizi per l'autenticazione nel KDC.
-
Realm: un realm Kerberos è una raccolta di principal Kerberos che condividono un database KDC comune.
-
Autenticazione: il processo di verifica dell'identità di un utente o di un principal del servizio.
-
Autorizzazione: il processo di determinazione delle risorse a cui un utente o un principal del servizio è autorizzato ad accedere.
Task 1: Kerberizzare un cluster Oracle Big Data Service
-
Eseguire il login al nodo master del cluster di Oracle Big Data Service mediante un comando
SSH
o utilizzando putty con il fileppk
utilizzando le credenziali utenteopc
. Una volta eseguito il login, aumentare le autorizzazioni per l'utenteroot
. In questa esercitazione, abbiamo usato putty per eseguire il login ai nodi. -
Arresta tutti i servizi Hadoop e Spark in esecuzione utilizzando Ambari.
-
Creare il principal Kerberos dell'amministratore
bdsuser
effettuando le operazioni riportate di seguito.-
Immettere il prompt
Kadmin
utilizzando il comandoKadmin.local
. -
Al prompt della riga di comando di
kadmin.local
, eseguire il comandoaddprinc
per creare un nuovo principal Kerberos denominatobdsuser
. Quando richiesto, scegliere una password della preferenza e confermarla. -
Immettere
exit
per tornare al prompt originale. Per impostazione predefinita, il realm utilizzato qui è selezionato dakrb5.conf
. È tuttavia possibile personalizzare il realm aggiornando la configurazione.
-
-
Creare un gruppo
bdsusergroup
eseguendo il comandodcli -C "groupadd bdsusergroup
. -
Immettere il comando
dcli -C "useradd -g bdsusergroup -G hdfs,hadoop,hive bdsuser"
al prompt per creare l'utente amministratorebdsuser
e aggiungerlo ai gruppi elencati in ogni nodo del cluster. -
Utilizzare il comando linux
id
per confermare la creazione dibdsuser
e per elencare l'appartenenza ai gruppi. -
Avviare tutti i servizi Oracle Big Data Service utilizzando Ambari.
-
Eseguire il test di
bdsuser
generando un ticket Kerberos utilizzando il comandokinit bdsuser
e elencando i file con il comandohadoop fs -ls /
.
Task 2: Connettere Alteryx a Oracle Big Data Service Hive
Abbiamo analizzato la kernel del cluster Oracle Big Data Service e ora ci concentreremo sulla connessione di Alteryx con Oracle Big Data Service Hive Kerberized mediante il driver ODBC.
Per liberare tutto il potenziale dei dati Hive di Oracle Big Data Service, è fondamentale stabilire una connessione con i tuoi strumenti preferiti. In questa sezione ti guideremo lungo tutto il processo di connessione di Alteryx a Oracle Big Data Service Hive. A tale scopo, verrà configurata una connessione ODBC che utilizza l'autenticazione Kerberos.
-
Configurare MIT Kerberos seguendo questi passi.
-
Copiare i file
krb5.conf
ekrb5.keytab
dal nodo principale del cluster aC:\Program Files\MIT\Kerberos
. -
Modificare l'estensione del file da
.conf
a.ini
per garantire la compatibilità con Windows. -
Creare una nuova cartella
C:/temp
(la cartella e il percorso possono essere a scelta). -
Impostare la seguente variabile di ambiente.
-
Eseguire il comando
Kinit bdsuser
dal prompt dei comandi per verificare l'impostazione di Kerberos e generare il ticket.
-
-
Installare il driver ODBC nel computer Windows. Seguire i prompt per installare il driver.
-
Configurare il driver ODBC seguendo questi passi.
-
Creare voci DNS e IP nel file hosts
C:\Windows\System32\drivers\etc
per il nodo principale e il nodo della utility. -
Eseguire il test delle voci del file hosts utilizzando il comando
ping
.
-
-
Aprire lo strumento Amministratore origine dati ODBC sul computer e seguire questa procedura.
-
Scegliere la scheda DSN di sistema. Fare clic su Aggiungi e scegli Driver ODBC Cloudera per Apache Hive, quindi su Fine.
-
Seguire lo screenshot riportato di seguito per la configurazione della connessione Hive.
-
Fare clic su Test per controllare la connettività. Se tutto è impostato correttamente, dovrebbe essere visualizzato un messaggio che indica che il test è riuscito. Fare clic su OK per salvare l'impostazione.
-
-
Apri Alteryx e segui questi passaggi.
-
Andare a File, selezionare Gestisci connessione e fare clic su Aggiungi origine dati. Scegliere Hive dalle opzioni tecnologiche disponibili.
-
Dopo aver selezionato l'opzione tecnologica, verrà visualizzata la schermata successiva in cui è necessario specificare il nome DSN. Selezionare il DSN ODBC creato nel passo precedente e fare clic su Salva.
-
L'impostazione della connessione è terminata. Ora creiamo un workflow di esempio per leggere i dati da Hive. Per creare un workflow di esempio, fare clic su Nuovo workflow, quindi trascinare il task dei dati di input.
-
Selezionare ODBC Hive dalla lista di connessioni.
-
Selezionare la tabella Hive per recuperare i dati.
-
Eseguire il workflow e verificare che Alteryx possa recuperare i dati da Oracle Big Data Service Hive.
-
Passi successivi
L'autenticazione Kerberos è un componente essenziale di un cluster Hadoop sicuro. Kerberizzando il cluster Oracle Big Data Service, puoi proteggere meglio i tuoi dati riservati e le tue applicazioni da accessi non autorizzati. Mentre il processo di Kerberizing il tuo cluster può essere difficile, una pianificazione accurata e l'attenzione ai dettagli possono aiutare a garantire un'implementazione di successo. Inoltre, la connessione di Alteryx a Oracle Big Data Service Hive mediante l'autenticazione ODBC e Kerberos può essere un po' complicata, ma dopo averla impostata, sarà disponibile Alteryx per l'analisi e la visualizzazione dei dati di Oracle Big Data Service. Seguendo i passaggi descritti in questa esercitazione, dovresti essere in grado di configurare facilmente la connessione.
Se si verificano problemi, è possibile risolverli. Grazie a un po' di persistenza, potrai connettere Alteryx a Oracle Big Data Service Hive e sfruttare tutto il potenziale dei tuoi dati.
Collegamenti correlati
Riconoscimenti
- Autori - Pavan Upadhyay (Principal Cloud Engineer), Saket Bihari (Principal Cloud Engineer)
Altre risorse di apprendimento
Esplora altri laboratori su docs.oracle.com/learn o accedi a contenuti di formazione gratuiti sul canale YouTube di Oracle Learning. Inoltre, visitare education.oracle.com/learning-explorer per diventare Explorer di Oracle Learning.
Per la documentazione sul prodotto, visitare il sito Oracle Help Center.
Connect Alteryx to Oracle Big Data Service Hive Using ODBC and Kerberos
F85222-01
August 2023
Copyright © 2023, Oracle and/or its affiliates.