Nota:

Connettere Alteryx a Oracle Big Data Service Hive mediante ODBC e Kerberos

Introduzione

Oracle Big Data Service è un servizio basato su cloud fornito da Oracle che consente agli utenti di creare e gestire cluster Hadoop, cluster Spark e altri servizi per Big Data. Per impostazione predefinita, un cluster Oracle Big Data Service utilizza meccanismi di autenticazione semplici, come nome utente e password, per autenticare utenti e servizi. Tuttavia, ciò potrebbe non essere sufficiente per le organizzazioni che richiedono livelli di sicurezza più elevati.

L'autenticazione Kerberos è un meccanismo ampiamente utilizzato per proteggere i sistemi di elaborazione distribuiti. Offre un modo sicuro per autenticare utenti e servizi, consentendo loro di comunicare in modo sicuro tramite una rete. In un ambiente abilitato per Kerberos gli utenti e i servizi vengono forniti con chiavi di cifratura utilizzate per verificare la propria identità e autorizzare l'accesso alle risorse.

L'autenticazione Kerberos può fornire un livello aggiuntivo di sicurezza per un cluster Oracle Big Data Service abilitando l'autenticazione e la cifratura efficaci tra i nodi.

Obiettivi

Esplora il processo di stabilire la connettività trasparente tra Alteryx e Oracle Big Data Service Hive all'interno di un cluster gestito in container. Implementando l'autenticazione Kerberos, possiamo garantire un ambiente sicuro per l'elaborazione e l'analisi dei dati.

Prerequisiti

Un cluster Oracle Big Data Service in esecuzione su Oracle Cloud Infrastructure (OCI) con i servizi configurati e le porte aperte richieste.

Nota: un cluster Oracle Big Data Service ad alta disponibilità (HA) è dotato di Kerberos installato. Se si desidera utilizzare un cluster non HA, è necessario disporre della seguente lista di prerequisiti.

Nota: in questa esercitazione viene utilizzato un cluster HA di Oracle Big Data Service. È inoltre necessario avere una conoscenza di base dei seguenti concetti e terminologie:

Task 1: Kerberizzare un cluster Oracle Big Data Service

  1. Eseguire il login al nodo master del cluster di Oracle Big Data Service mediante un comando SSH o utilizzando putty con il file ppk utilizzando le credenziali utente opc. Una volta eseguito il login, aumentare le autorizzazioni per l'utente root. In questa esercitazione, abbiamo usato putty per eseguire il login ai nodi.

  2. Arresta tutti i servizi Hadoop e Spark in esecuzione utilizzando Ambari.

    Servizi di fermata Ambari

  3. Creare il principal Kerberos dell'amministratore bdsuser effettuando le operazioni riportate di seguito.

    • Immettere il prompt Kadmin utilizzando il comando Kadmin.local.

    • Al prompt della riga di comando di kadmin.local, eseguire il comando addprinc per creare un nuovo principal Kerberos denominato bdsuser. Quando richiesto, scegliere una password della preferenza e confermarla.

      Esegui comando addprinc

    • Immettere exit per tornare al prompt originale. Per impostazione predefinita, il realm utilizzato qui è selezionato da krb5.conf. È tuttavia possibile personalizzare il realm aggiornando la configurazione.

  4. Creare un gruppo bdsusergroup eseguendo il comando dcli -C "groupadd bdsusergroup.

  5. Immettere il comando dcli -C "useradd -g bdsusergroup -G hdfs,hadoop,hive bdsuser" al prompt per creare l'utente amministratore bdsuser e aggiungerlo ai gruppi elencati in ogni nodo del cluster.

  6. Utilizzare il comando linux id per confermare la creazione di bdsuser e per elencare l'appartenenza ai gruppi.

  7. Avviare tutti i servizi Oracle Big Data Service utilizzando Ambari.

    Servizi di avvio Ambari

  8. Eseguire il test di bdsuser generando un ticket Kerberos utilizzando il comando kinit bdsuser e elencando i file con il comando hadoop fs -ls /.

    Prompt dei comandi

Task 2: Connettere Alteryx a Oracle Big Data Service Hive

Abbiamo analizzato la kernel del cluster Oracle Big Data Service e ora ci concentreremo sulla connessione di Alteryx con Oracle Big Data Service Hive Kerberized mediante il driver ODBC.

Per liberare tutto il potenziale dei dati Hive di Oracle Big Data Service, è fondamentale stabilire una connessione con i tuoi strumenti preferiti. In questa sezione ti guideremo lungo tutto il processo di connessione di Alteryx a Oracle Big Data Service Hive. A tale scopo, verrà configurata una connessione ODBC che utilizza l'autenticazione Kerberos.

  1. Configurare MIT Kerberos seguendo questi passi.

    • Copiare i file krb5.conf e krb5.keytab dal nodo principale del cluster a C:\Program Files\MIT\Kerberos.

    • Modificare l'estensione del file da .conf a .ini per garantire la compatibilità con Windows.

    • Creare una nuova cartella C:/temp (la cartella e il percorso possono essere a scelta).

    • Impostare la seguente variabile di ambiente.

      Variabile di ambiente

    • Eseguire il comando Kinit bdsuser dal prompt dei comandi per verificare l'impostazione di Kerberos e generare il ticket.

  2. Installare il driver ODBC nel computer Windows. Seguire i prompt per installare il driver.

  3. Configurare il driver ODBC seguendo questi passi.

    • Creare voci DNS e IP nel file hosts C:\Windows\System32\drivers\etc per il nodo principale e il nodo della utility.

      File host di esempio

    • Eseguire il test delle voci del file hosts utilizzando il comando ping.

      Testo alternativo

  4. Aprire lo strumento Amministratore origine dati ODBC sul computer e seguire questa procedura.

    • Scegliere la scheda DSN di sistema. Fare clic su Aggiungi e scegli Driver ODBC Cloudera per Apache Hive, quindi su Fine.

      Scheda DSN di sistema

    • Seguire lo screenshot riportato di seguito per la configurazione della connessione Hive.

      Configurazione connessione Hive

    • Fare clic su Test per controllare la connettività. Se tutto è impostato correttamente, dovrebbe essere visualizzato un messaggio che indica che il test è riuscito. Fare clic su OK per salvare l'impostazione.

      Test della connessione Hive

  5. Apri Alteryx e segui questi passaggi.

    • Andare a File, selezionare Gestisci connessione e fare clic su Aggiungi origine dati. Scegliere Hive dalle opzioni tecnologiche disponibili.

      Gestisci connessione

    • Dopo aver selezionato l'opzione tecnologica, verrà visualizzata la schermata successiva in cui è necessario specificare il nome DSN. Selezionare il DSN ODBC creato nel passo precedente e fare clic su Salva.

      Salva connessione

    • L'impostazione della connessione è terminata. Ora creiamo un workflow di esempio per leggere i dati da Hive. Per creare un workflow di esempio, fare clic su Nuovo workflow, quindi trascinare il task dei dati di input.

      Nuovo workflow

    • Selezionare ODBC Hive dalla lista di connessioni.

      Lista di connessioni

    • Selezionare la tabella Hive per recuperare i dati.

      Tabelle Hive

    • Eseguire il workflow e verificare che Alteryx possa recuperare i dati da Oracle Big Data Service Hive.

      Esegui workflow

Passi successivi

L'autenticazione Kerberos è un componente essenziale di un cluster Hadoop sicuro. Kerberizzando il cluster Oracle Big Data Service, puoi proteggere meglio i tuoi dati riservati e le tue applicazioni da accessi non autorizzati. Mentre il processo di Kerberizing il tuo cluster può essere difficile, una pianificazione accurata e l'attenzione ai dettagli possono aiutare a garantire un'implementazione di successo. Inoltre, la connessione di Alteryx a Oracle Big Data Service Hive mediante l'autenticazione ODBC e Kerberos può essere un po' complicata, ma dopo averla impostata, sarà disponibile Alteryx per l'analisi e la visualizzazione dei dati di Oracle Big Data Service. Seguendo i passaggi descritti in questa esercitazione, dovresti essere in grado di configurare facilmente la connessione.

Se si verificano problemi, è possibile risolverli. Grazie a un po' di persistenza, potrai connettere Alteryx a Oracle Big Data Service Hive e sfruttare tutto il potenziale dei tuoi dati.

Riconoscimenti

Altre risorse di apprendimento

Esplora altri laboratori su docs.oracle.com/learn o accedi a contenuti di formazione gratuiti sul canale YouTube di Oracle Learning. Inoltre, visitare education.oracle.com/learning-explorer per diventare Explorer di Oracle Learning.

Per la documentazione sul prodotto, visitare il sito Oracle Help Center.