Nota:
- Este tutorial requiere acceso a Oracle Cloud. Para registrarse en una cuenta gratuita, consulte Introducción a la capa gratuita de Oracle Cloud Infrastructure.
- Utiliza valores de ejemplo para las credenciales, el arrendamiento y los compartimentos de Oracle Cloud Infrastructure. Al finalizar el laboratorio, sustituya estos valores por otros específicos de su entorno en la nube.
Conexión de Alteryx a Oracle Big Data Service Hive mediante ODBC y Kerberos
Introducción
Oracle Big Data Service es un servicio basado en la nube proporcionado por Oracle que permite a los usuarios crear y gestionar clusters de Hadoop, clusters de Spark y otros servicios de big data. Por defecto, un cluster de Oracle Big Data Service utiliza mecanismos de autenticación simples, como el nombre de usuario y la contraseña, para autenticar usuarios y servicios. Sin embargo, puede que esto no sea suficiente para las organizaciones que requieren mayores niveles de seguridad.
La autenticación de Kerberos es un mecanismo ampliamente utilizado para proteger los sistemas informáticos distribuidos. Proporciona una forma segura de autenticar usuarios y servicios, lo que les permite comunicarse de forma segura a través de una red. En un entorno activado para Kerberos, los usuarios y los servicios se emiten con claves criptográficas que se utilizan para verificar su identidad y autorizar el acceso a los recursos.
La autenticación de Kerberos puede proporcionar una capa adicional de seguridad para un cluster de Oracle Big Data Service mediante la activación de una autenticación y un cifrado sólidos entre nodos.
Objetivos
Explore el proceso de establecer una conectividad perfecta entre Alteryx y Oracle Big Data Service Hive dentro de un cluster querberizado. Mediante la implementación de la autenticación de Kerberos, podemos garantizar un entorno seguro para el procesamiento y análisis de datos.
- Aprender a kerberizar el cluster de Oracle Big Data Service
- Aprenda a conectar Alteryx a Oracle Big Data Service Hive
Requisitos
Cluster de Oracle Big Data Service que se ejecuta en Oracle Cloud Infrastructure (OCI) con los servicios necesarios configurados y puertos abiertos.
Nota: Un cluster de Oracle Big Data Service de alta disponibilidad (HA) incluye Kerberos instalado. Si desea utilizar un cluster que no sea de alta disponibilidad, necesita la siguiente lista de requisitos previos.
-
Un servidor de administración de Kerberos y un centro de distribución de claves (KDC) de Kerberos. Puede instalar y configurar el KDC y el servidor de administración en un servidor independiente o utilizar el KDC y el servidor de administración proporcionados por su organización.
-
Utilidad
kadmin
utilizada para crear y gestionar principales y tablas de claves de Kerberos. -
La utilidad
kinit
utilizada para obtener un ticket de otorgamiento de tickets (TGT) de Kerberos para un usuario o principal de servicio. -
Utilidad
klist
utilizada para mostrar los tickets en la caché de credenciales de un usuario o principal de servicio. -
Una máquina Windows con Alteryx instalado. Para la implementación en este tutorial, hemos utilizado la versión de prueba de Alteryx.
-
MIT Kerberos.
-
El controlador ODBC instalado en la máquina.
-
Los principales y tablas de claves de Kerberos necesarios para el cluster de Oracle Big Data Service. Encontrará más detalles al respecto en las siguientes secciones.
-
Acceso a la herramienta ODBC Data Source Administrator de su máquina.
Nota: En este tutorial, estamos utilizando un cluster de HA de Oracle Big Data Service. También debe tener una comprensión básica de los siguientes conceptos y terminologías:
-
Principales de Kerberos: entidad autenticada por el sistema Kerberos. Los principales pueden ser usuarios o servicios.
-
Keytabs (Teclas de claves): archivo que contiene la clave secreta de un principal. Los servicios utilizan los separadores de claves para autenticarse en el KDC.
-
Dominios: un dominio Kerberos es una recopilación de principales de Kerberos que comparten una base de datos de KDC común.
-
Autenticación: proceso de verificación de la identidad de un usuario o principal de servicio.
-
Autorización: proceso para determinar a qué recursos puede acceder un usuario o un principal de servicio.
Tarea 1: Kerberización de un cluster de Oracle Big Data Service
-
Conéctese al nodo maestro de cluster de Oracle Big Data Service mediante un comando
SSH
o utilizando putty con el archivoppk
mediante las credenciales de usuarioopc
. Una vez conectado, eleve sus permisos al usuarioroot
. En este tutorial, hemos utilizado putty para conectarse a los nodos. -
Pare todos los servicios de Hadoop y Spark en ejecución mediante Ambari.
-
Siga estos pasos para crear el principal de Kerberos de administrador de
bdsuser
.-
Introduzca el indicador
Kadmin
con el comandoKadmin.local
. -
En el símbolo del sistema de
kadmin.local
, ejecute el comandoaddprinc
para crear un nuevo principal de Kerberos denominadobdsuser
. Cuando se le solicite, seleccione una contraseña de su preferencia y confírmela. -
Introduzca
exit
para volver a la petición de datos original. Por defecto, el dominio utilizado aquí se selecciona dekrb5.conf
. Sin embargo, tiene la opción de personalizar el dominio mediante la actualización de la configuración.
-
-
Cree un grupo
bdsusergroup
ejecutando el comandodcli -C "groupadd bdsusergroup
. -
Introduzca el comando
dcli -C "useradd -g bdsusergroup -G hdfs,hadoop,hive bdsuser"
en el indicador para crear el usuario administradorbdsuser
y agregarlo a los grupos enumerados en cada nodo del cluster. -
Utilice el comando linux
id
para confirmar la creación debdsuser
y mostrar su pertenencia a grupos. -
Inicie todos los servicios de Oracle Big Data Service mediante Ambari.
-
Pruebe
bdsuser
generando el ticket de Kerberos mediante el comandokinit bdsuser
y muestre los archivos mediante el comandohadoop fs -ls /
.
Tarea 2: Conexión de Alteryx a Oracle Big Data Service Hive
Exploramos la querberización del cluster de Oracle Big Data Service y ahora sumergimos en conectar Alteryx con Oracle Big Data Service Hive Kerberizado mediante el controlador ODBC.
Para aprovechar todo el potencial de sus datos de Oracle Big Data Service Hive, es crucial establecer una conexión con sus herramientas preferidas. En esta sección, le guiaremos por el proceso de conexión de Alteryx a Oracle Big Data Service Hive. Para ello, configuraremos una conexión ODBC que utilice la autenticación Kerberos.
-
Para configurar MIT Kerberos, siga estos pasos.
-
Copie el archivo
krb5.conf
ykrb5.keytab
del nodo maestro del cluster enC:\Program Files\MIT\Kerberos
. -
Cambie la extensión de archivo de
.conf
a.ini
para compatibilidad con Windows. -
Cree una nueva carpeta
C:/temp
(la carpeta y la ruta de acceso pueden ser de su elección). -
Configure la siguiente variable de entorno.
-
Ejecute el comando
Kinit bdsuser
desde el símbolo del sistema para verificar la configuración de Kerberos y generar un ticket.
-
-
Instale el controlador ODBC en la máquina de Windows. Siga las peticiones de datos para instalar el controlador.
-
Siga estos pasos para configurar el controlador ODBC.
-
Realice entradas de DNS e IP en el archivo de hosts
C:\Windows\System32\drivers\etc
para el nodo maestro y de utilidad. -
Pruebe las entradas del archivo de hosts mediante el comando
ping
.
-
-
Abra la herramienta ODBC Data Source Administrator en su máquina y siga estos pasos.
-
Seleccione el separador DSN de sistema. Haga clic en Agregar y seleccionar el controlador ODBC de Cloudera para Apache Hive y, a continuación, haga clic en Terminar.
-
Siga la siguiente captura de pantalla para la configuración de conexión de Hive.
-
Haga clic en Probar para comprobar la conectividad. Si todo está configurado correctamente, debería ver un mensaje que indica que la prueba se ha realizado correctamente. Haga clic en Aceptar para guardar el valor.
-
-
Abra Alteryx y siga estos pasos.
-
Vaya a Archivo, seleccione Gestionar conexión y haga clic en Agregar origen de datos. Seleccione Hive entre las opciones de tecnología disponibles.
-
Una vez que haya seleccionado la opción de tecnología, se le pedirá a la siguiente pantalla en la que debe proporcionar el nombre de DSN. Seleccione el DSN de ODBC que creó en el paso anterior y haga clic en Guardar.
-
Terminamos con la configuración de la conexión. Ahora vamos a crear un flujo de trabajo de ejemplo para leer los datos de Hive. Para crear un flujo de trabajo de ejemplo, haga clic en Nuevo flujo de trabajo y, a continuación, arrastre y suelte la tarea de datos de entrada.
-
Seleccione Hive ODBC en la lista de conexiones.
-
Seleccione la tabla de Hive para recuperar los datos.
-
Ejecute el flujo de trabajo y podrá ver que Alteryx puede recuperar correctamente los datos de Oracle Big Data Service Hive.
-
Pasos Siguientes
La autenticación de Kerberos es un componente esencial de un cluster de Hadoop seguro. Al Kerberizar el cluster de Oracle Big Data Service, puede proteger mejor sus datos y aplicaciones confidenciales frente a accesos no autorizados. Si bien el proceso de Kerberización del cluster puede ser un desafío, una planificación cuidadosa y la atención a los detalles pueden ayudar a garantizar una implantación correcta. Además, conectar Alteryx a Oracle Big Data Service Hive mediante la autenticación ODBC y Kerberos puede ser un poco complicado, pero una vez que lo haya configurado, tendrá Alteryx para analizar y visualizar sus datos de Oracle Big Data Service. Si sigue los pasos descritos en este tutorial, podrá configurar la conexión fácilmente.
Si tiene problemas, puede solucionarlos. Con un poco de persistencia, podrá conectar Alteryx a Oracle Big Data Service Hive y aprovechar todo el potencial de sus datos.
Enlaces relacionados
Agradecimientos
- Autores: Pavan Upadhyay (ingeniero principal de la nube), Saket Bihari (ingeniero principal de la nube)
Más recursos de aprendizaje
Explore otros laboratorios en docs.oracle.com/learn o acceda a más contenido de aprendizaje gratuito en el canal YouTube de Oracle Learning. Además, visite education.oracle.com/learning-explorer para convertirse en un explorador de Oracle Learning.
Para obtener documentación sobre los productos, visite Oracle Help Center.
Connect Alteryx to Oracle Big Data Service Hive Using ODBC and Kerberos
F85222-01
August 2023
Copyright © 2023, Oracle and/or its affiliates.