Observação:

Este tutorial requer acesso ao Oracle Cloud. Para se inscrever em uma conta gratuita, consulte Conceitos Básicos do Oracle Cloud Infrastructure Free Tier.
Ele usa valores de exemplo para credenciais, tenancy e compartimentos do Oracle Cloud Infrastructure. Ao concluir seu laboratório, substitua esses valores por valores específicos do seu ambiente de nuvem.

Ativar o Editor de Trino no Oracle Big Data Service Hue para Clusters de Alta Disponibilidade sem Kerberos

Introdução

O Oracle Big Data Service (BDS) é um serviço baseado na nuvem que permite aos usuários criar e gerenciar clusters do Hadoop, clusters do Spark, Trino e outros serviços de big data. No mundo da análise de big data, o Trino se destaca como um mecanismo de consulta SQL distribuído de alto desempenho projetado para executar consultas analíticas interativas em grandes conjuntos de dados. O Trino permite a consulta de dados em várias origens, incluindo Hadoop Distributed File System (HDFS), bucket do OCI e bancos de dados relacionais tradicionais, tudo em uma interface SQL unificada. Sua capacidade de lidar com dados em larga escala com baixa latência o torna uma ferramenta poderosa para engenheiros de dados e analistas.

A integração do Trino com o BDS Hue pode melhorar muito seus recursos de consulta de dados, fornecendo uma interface perfeita para consultar dados. Neste tutorial, vamos orientá-lo através das etapas para ativar o editor Trino em um ambiente de cluster de alta disponibilidade (HA) usando o Hue, supondo que nenhuma autenticação Kerberos esteja em vigor. Ao seguir essas tarefas, você poderá configurar seu ambiente Hue para se conectar com o Trino e aproveitar seus poderosos recursos de consulta de forma eficaz.

Objetivos

Saiba como configurar o editor Trino no Hue para um ambiente de cluster HA.
Entenda a configuração necessária para permitir uma conectividade perfeita entre o Hue e o Trino.
Verifique e solucione problemas da configuração para garantir uma consulta bem-sucedida.

Pré-requisitos

Um cluster do Oracle Big Data Service em execução no Oracle Cloud Infrastructure (OCI) com o Trino e o Hue ativados.
Acesso ao servidor Hue e permissões necessárias para modificar configurações.
O arquivo Java Archive (JAR) do driver JDBC (Java Connectivity) Trino foi baixado e pode ser acessado.

Observação: este tutorial pressupõe que você esteja trabalhando com um cluster HA que não seja do Kerberos. Se você estiver usando um ambiente Kerberizado, serão necessárias etapas de configuração adicionais relacionadas à autenticação do Kerberos.

Tarefa 1: Fazer Download e Instalar o Driver JDBC Trino

Faça download do arquivo JAR do driver JDBC do Trino do Maven e salve o arquivo JAR no nó UNO (onde o Hue está sendo executado) no ambiente BDS, mas para os fins deste tutorial, ele é colocado no diretório /tmp.
Configurar o Hue para integração do Trino.
1. Faça log-in no Apache Ambari e navegue até Hue, config e Advanced.
2. Clique em Pseudo-distributed.ini avançado e procure interpretadores.
Para editar a configuração, adicione a configuração a seguir na seção interpretadores.

Verifique se o URL JDBC corresponde ao Nome de Domínio Totalmente Qualificado (FQDN) do seu coordenador Trino e se o nome da classe do driver está correto

Tarefa 2: Atualizar Configuração do Python para Hue

Localizar e modificar a configuração do gateway Python.

No servidor Hue (UNO), acesse o arquivo /usr/odh/2.0.7/hue/build/env/lib/python2.7/site-packages/py4j-0.9-py2.7.egg/py4j/java_gateway.py.

Observação: Antes de editar, crie um backup desse arquivo.
Edite o arquivo Python.
1. Abra java_gateway.py e localize onde o classpath está definido.
2. Adicione as linhas a seguir para incluir o caminho do driver JDBC. Isso garante que o Hue possa localizar e usar o driver JDBC Trino.

Tarefa 3: Reiniciar o Serviço Hue

Retorne ao Apache Ambari e reinicie o serviço Hue para aplicar as novas configurações.
Verifique a ativação do editor no Hue.
1. Depois de reiniciar, abra a interface do servidor Hue e verifique se o editor Trino aparece no menu.
2. Quando forem solicitadas credenciais, informe Nome do Usuário como trino e Senha como trino.

Tarefa 4: Consultar Dados Usando o Editor Trino

Acesse o editor Trino e execute consultas sql.
1. Navegue até o editor Trino e escolha o banco de dados no qual deseja executar a consulta.
2. Agora você pode executar consultas SQL em sua instância do Trino no Hue.

Solução de problemas e dicas

Problemas do Driver: Certifique-se de que o arquivo JAR esteja corretamente colocado no diretório com permissão e que o caminho do arquivo na configuração do Python seja preciso.
Erros de Conexão: Verifique o URL JDBC e certifique-se de que ele esteja acessível no servidor Hue.
Verificação de Configuração: Verifique novamente todas as alterações de configuração no Apache Ambari e confirme se o serviço Hue foi reiniciado corretamente.

Próximas Etapas

Seguindo essas tarefas, você deve ter integrado com sucesso o editor Trino em seu ambiente BDS Hue. Essa integração aprimora seus recursos de consulta de dados, permitindo que você aproveite os recursos avançados de consulta do Trino diretamente do Hue. Se você encontrar algum problema, revise as dicas de solução de problemas ou procure assistência adicional na documentação ou nos fóruns da comunidade.

Agradecimentos

Autors - Pavan Upadhyay (Engenheiro de Nuvem Principal), Saket Bihari (Engenheiro de Nuvem Principal)

Mais Recursos de Aprendizagem

Explore outros laboratórios em docs.oracle.com/learn ou acesse mais conteúdo de aprendizado gratuito no canal Oracle Learning YouTube. Além disso, visite education.oracle.com/learning-explorer para se tornar um Oracle Learning Explorer.

Para obter a documentação do produto, visite o Oracle Help Center.

Título e Informações de Copyright

Enable Trino Editor in Oracle Big Data Service Hue for High Availability Clusters Without Kerberos

G13964-01

September 2024

Oracle e/ou suas empresas afiliadas.