Nota:

Conexión de Alteryx a Oracle Big Data Service Hive mediante ODBC y Kerberos

Introducción

Oracle Big Data Service es un servicio basado en la nube proporcionado por Oracle que permite a los usuarios crear y gestionar clusters de Hadoop, clusters de Spark y otros servicios de big data. Por defecto, un cluster de Oracle Big Data Service utiliza mecanismos de autenticación simples, como el nombre de usuario y la contraseña, para autenticar usuarios y servicios. Sin embargo, puede que esto no sea suficiente para las organizaciones que requieren mayores niveles de seguridad.

La autenticación de Kerberos es un mecanismo ampliamente utilizado para proteger los sistemas informáticos distribuidos. Proporciona una forma segura de autenticar usuarios y servicios, lo que les permite comunicarse de forma segura a través de una red. En un entorno activado para Kerberos, los usuarios y los servicios se emiten con claves criptográficas que se utilizan para verificar su identidad y autorizar el acceso a los recursos.

La autenticación de Kerberos puede proporcionar una capa adicional de seguridad para un cluster de Oracle Big Data Service mediante la activación de una autenticación y un cifrado sólidos entre nodos.

Objetivos

Explore el proceso de establecer una conectividad perfecta entre Alteryx y Oracle Big Data Service Hive dentro de un cluster querberizado. Mediante la implementación de la autenticación de Kerberos, podemos garantizar un entorno seguro para el procesamiento y análisis de datos.

Requisitos

Cluster de Oracle Big Data Service que se ejecuta en Oracle Cloud Infrastructure (OCI) con los servicios necesarios configurados y puertos abiertos.

Nota: Un cluster de Oracle Big Data Service de alta disponibilidad (HA) incluye Kerberos instalado. Si desea utilizar un cluster que no sea de alta disponibilidad, necesita la siguiente lista de requisitos previos.

Nota: En este tutorial, estamos utilizando un cluster de HA de Oracle Big Data Service. También debe tener una comprensión básica de los siguientes conceptos y terminologías:

Tarea 1: Kerberización de un cluster de Oracle Big Data Service

  1. Conéctese al nodo maestro de cluster de Oracle Big Data Service mediante un comando SSH o utilizando putty con el archivo ppk mediante las credenciales de usuario opc. Una vez conectado, eleve sus permisos al usuario root. En este tutorial, hemos utilizado putty para conectarse a los nodos.

  2. Pare todos los servicios de Hadoop y Spark en ejecución mediante Ambari.

    Servicios de parada de Ambari

  3. Siga estos pasos para crear el principal de Kerberos de administrador de bdsuser.

    • Introduzca el indicador Kadmin con el comando Kadmin.local.

    • En el símbolo del sistema de kadmin.local, ejecute el comando addprinc para crear un nuevo principal de Kerberos denominado bdsuser. Cuando se le solicite, seleccione una contraseña de su preferencia y confírmela.

      Ejecutar comando addprinc

    • Introduzca exit para volver a la petición de datos original. Por defecto, el dominio utilizado aquí se selecciona de krb5.conf. Sin embargo, tiene la opción de personalizar el dominio mediante la actualización de la configuración.

  4. Cree un grupo bdsusergroup ejecutando el comando dcli -C "groupadd bdsusergroup.

  5. Introduzca el comando dcli -C "useradd -g bdsusergroup -G hdfs,hadoop,hive bdsuser" en el indicador para crear el usuario administrador bdsuser y agregarlo a los grupos enumerados en cada nodo del cluster.

  6. Utilice el comando linux id para confirmar la creación de bdsuser y mostrar su pertenencia a grupos.

  7. Inicie todos los servicios de Oracle Big Data Service mediante Ambari.

    Servicios de inicio de Ambari

  8. Pruebe bdsuser generando el ticket de Kerberos mediante el comando kinit bdsuser y muestre los archivos mediante el comando hadoop fs -ls /.

    Símbolo del sistema

Tarea 2: Conexión de Alteryx a Oracle Big Data Service Hive

Exploramos la querberización del cluster de Oracle Big Data Service y ahora sumergimos en conectar Alteryx con Oracle Big Data Service Hive Kerberizado mediante el controlador ODBC.

Para aprovechar todo el potencial de sus datos de Oracle Big Data Service Hive, es crucial establecer una conexión con sus herramientas preferidas. En esta sección, le guiaremos por el proceso de conexión de Alteryx a Oracle Big Data Service Hive. Para ello, configuraremos una conexión ODBC que utilice la autenticación Kerberos.

  1. Para configurar MIT Kerberos, siga estos pasos.

    • Copie el archivo krb5.conf y krb5.keytab del nodo maestro del cluster en C:\Program Files\MIT\Kerberos.

    • Cambie la extensión de archivo de .conf a .ini para compatibilidad con Windows.

    • Cree una nueva carpeta C:/temp (la carpeta y la ruta de acceso pueden ser de su elección).

    • Configure la siguiente variable de entorno.

      Variable de Entorno

    • Ejecute el comando Kinit bdsuser desde el símbolo del sistema para verificar la configuración de Kerberos y generar un ticket.

  2. Instale el controlador ODBC en la máquina de Windows. Siga las peticiones de datos para instalar el controlador.

  3. Siga estos pasos para configurar el controlador ODBC.

    • Realice entradas de DNS e IP en el archivo de hosts C:\Windows\System32\drivers\etc para el nodo maestro y de utilidad.

      Archivo de hosts de ejemplo

    • Pruebe las entradas del archivo de hosts mediante el comando ping.

      Texto alternativo

  4. Abra la herramienta ODBC Data Source Administrator en su máquina y siga estos pasos.

    • Seleccione el separador DSN de sistema. Haga clic en Agregar y seleccionar el controlador ODBC de Cloudera para Apache Hive y, a continuación, haga clic en Terminar.

      Separador DSN de Sistema

    • Siga la siguiente captura de pantalla para la configuración de conexión de Hive.

      Configuración de conexión de Hive

    • Haga clic en Probar para comprobar la conectividad. Si todo está configurado correctamente, debería ver un mensaje que indica que la prueba se ha realizado correctamente. Haga clic en Aceptar para guardar el valor.

      Probar conexión de Hive

  5. Abra Alteryx y siga estos pasos.

    • Vaya a Archivo, seleccione Gestionar conexión y haga clic en Agregar origen de datos. Seleccione Hive entre las opciones de tecnología disponibles.

      Gestionar conexión

    • Una vez que haya seleccionado la opción de tecnología, se le pedirá a la siguiente pantalla en la que debe proporcionar el nombre de DSN. Seleccione el DSN de ODBC que creó en el paso anterior y haga clic en Guardar.

      Guardar conexión

    • Terminamos con la configuración de la conexión. Ahora vamos a crear un flujo de trabajo de ejemplo para leer los datos de Hive. Para crear un flujo de trabajo de ejemplo, haga clic en Nuevo flujo de trabajo y, a continuación, arrastre y suelte la tarea de datos de entrada.

      Nuevo flujo de trabajo

    • Seleccione Hive ODBC en la lista de conexiones.

      Lista de Conexiones

    • Seleccione la tabla de Hive para recuperar los datos.

      Tablas de Hive

    • Ejecute el flujo de trabajo y podrá ver que Alteryx puede recuperar correctamente los datos de Oracle Big Data Service Hive.

      Ejecutar flujo de trabajo

Pasos Siguientes

La autenticación de Kerberos es un componente esencial de un cluster de Hadoop seguro. Al Kerberizar el cluster de Oracle Big Data Service, puede proteger mejor sus datos y aplicaciones confidenciales frente a accesos no autorizados. Si bien el proceso de Kerberización del cluster puede ser un desafío, una planificación cuidadosa y la atención a los detalles pueden ayudar a garantizar una implantación correcta. Además, conectar Alteryx a Oracle Big Data Service Hive mediante la autenticación ODBC y Kerberos puede ser un poco complicado, pero una vez que lo haya configurado, tendrá Alteryx para analizar y visualizar sus datos de Oracle Big Data Service. Si sigue los pasos descritos en este tutorial, podrá configurar la conexión fácilmente.

Si tiene problemas, puede solucionarlos. Con un poco de persistencia, podrá conectar Alteryx a Oracle Big Data Service Hive y aprovechar todo el potencial de sus datos.

Agradecimientos

Más recursos de aprendizaje

Explore otros laboratorios en docs.oracle.com/learn o acceda a más contenido de aprendizaje gratuito en el canal YouTube de Oracle Learning. Además, visite education.oracle.com/learning-explorer para convertirse en un explorador de Oracle Learning.

Para obtener documentación sobre los productos, visite Oracle Help Center.