Observação:
- Este tutorial requer acesso ao Oracle Cloud. Para se inscrever em uma conta gratuita, consulte Conceitos Básicos do Oracle Cloud Infrastructure Free Tier.
- Ele usa valores de exemplo para credenciais, tenancy e compartimentos do Oracle Cloud Infrastructure. Ao concluir seu laboratório, substitua esses valores por valores específicos do seu ambiente de nuvem.
Ativar o Editor de Trino no Oracle Big Data Service Hue para Clusters de Alta Disponibilidade sem Kerberos
Introdução
O Oracle Big Data Service (BDS) é um serviço baseado na nuvem que permite aos usuários criar e gerenciar clusters do Hadoop, clusters do Spark, Trino e outros serviços de big data. No mundo da análise de big data, o Trino se destaca como um mecanismo de consulta SQL distribuído de alto desempenho projetado para executar consultas analíticas interativas em grandes conjuntos de dados. O Trino permite a consulta de dados em várias origens, incluindo Hadoop Distributed File System (HDFS), bucket do OCI e bancos de dados relacionais tradicionais, tudo em uma interface SQL unificada. Sua capacidade de lidar com dados em larga escala com baixa latência o torna uma ferramenta poderosa para engenheiros de dados e analistas.
A integração do Trino com o BDS Hue pode melhorar muito seus recursos de consulta de dados, fornecendo uma interface perfeita para consultar dados. Neste tutorial, vamos orientá-lo através das etapas para ativar o editor Trino em um ambiente de cluster de alta disponibilidade (HA) usando o Hue, supondo que nenhuma autenticação Kerberos esteja em vigor. Ao seguir essas tarefas, você poderá configurar seu ambiente Hue para se conectar com o Trino e aproveitar seus poderosos recursos de consulta de forma eficaz.
Objetivos
-
Saiba como configurar o editor Trino no Hue para um ambiente de cluster HA.
-
Entenda a configuração necessária para permitir uma conectividade perfeita entre o Hue e o Trino.
-
Verifique e solucione problemas da configuração para garantir uma consulta bem-sucedida.
Pré-requisitos
-
Um cluster do Oracle Big Data Service em execução no Oracle Cloud Infrastructure (OCI) com o Trino e o Hue ativados.
-
Acesso ao servidor Hue e permissões necessárias para modificar configurações.
-
O arquivo Java Archive (JAR) do driver JDBC (Java Connectivity) Trino foi baixado e pode ser acessado.
Observação: este tutorial pressupõe que você esteja trabalhando com um cluster HA que não seja do Kerberos. Se você estiver usando um ambiente Kerberizado, serão necessárias etapas de configuração adicionais relacionadas à autenticação do Kerberos.
Tarefa 1: Fazer Download e Instalar o Driver JDBC Trino
-
Faça download do arquivo JAR do driver JDBC do Trino do Maven e salve o arquivo JAR no nó UNO (onde o Hue está sendo executado) no ambiente BDS, mas para os fins deste tutorial, ele é colocado no diretório
/tmp
. -
Configurar o Hue para integração do Trino.
-
Faça log-in no Apache Ambari e navegue até Hue, config e Advanced.
-
Clique em Pseudo-distributed.ini avançado e procure interpretadores.
-
-
Para editar a configuração, adicione a configuração a seguir na seção interpretadores.
Verifique se o URL JDBC corresponde ao Nome de Domínio Totalmente Qualificado (FQDN) do seu coordenador Trino e se o nome da classe do driver está correto
Tarefa 2: Atualizar Configuração do Python para Hue
-
Localizar e modificar a configuração do gateway Python.
No servidor Hue (UNO), acesse o arquivo
/usr/odh/2.0.7/hue/build/env/lib/python2.7/site-packages/py4j-0.9-py2.7.egg/py4j/java_gateway.py
.Observação: Antes de editar, crie um backup desse arquivo.
-
Edite o arquivo Python.
-
Abra
java_gateway.py
e localize onde o classpath está definido. -
Adicione as linhas a seguir para incluir o caminho do driver JDBC. Isso garante que o Hue possa localizar e usar o driver JDBC Trino.
-
Tarefa 3: Reiniciar o Serviço Hue
-
Retorne ao Apache Ambari e reinicie o serviço Hue para aplicar as novas configurações.
-
Verifique a ativação do editor no Hue.
-
Depois de reiniciar, abra a interface do servidor Hue e verifique se o editor Trino aparece no menu.
-
Quando forem solicitadas credenciais, informe Nome do Usuário como
trino
e Senha comotrino
.
-
Tarefa 4: Consultar Dados Usando o Editor Trino
-
Acesse o editor Trino e execute consultas sql.
-
Navegue até o editor Trino e escolha o banco de dados no qual deseja executar a consulta.
-
Agora você pode executar consultas SQL em sua instância do Trino no Hue.
-
Solução de problemas e dicas
-
Problemas do Driver: Certifique-se de que o arquivo JAR esteja corretamente colocado no diretório com permissão e que o caminho do arquivo na configuração do Python seja preciso.
-
Erros de Conexão: Verifique o URL JDBC e certifique-se de que ele esteja acessível no servidor Hue.
-
Verificação de Configuração: Verifique novamente todas as alterações de configuração no Apache Ambari e confirme se o serviço Hue foi reiniciado corretamente.
Próximas Etapas
Seguindo essas tarefas, você deve ter integrado com sucesso o editor Trino em seu ambiente BDS Hue. Essa integração aprimora seus recursos de consulta de dados, permitindo que você aproveite os recursos avançados de consulta do Trino diretamente do Hue. Se você encontrar algum problema, revise as dicas de solução de problemas ou procure assistência adicional na documentação ou nos fóruns da comunidade.
Links Relacionados
Agradecimentos
- Autors - Pavan Upadhyay (Engenheiro de Nuvem Principal), Saket Bihari (Engenheiro de Nuvem Principal)
Mais Recursos de Aprendizagem
Explore outros laboratórios em docs.oracle.com/learn ou acesse mais conteúdo de aprendizado gratuito no canal Oracle Learning YouTube. Além disso, visite education.oracle.com/learning-explorer para se tornar um Oracle Learning Explorer.
Para obter a documentação do produto, visite o Oracle Help Center.
Enable Trino Editor in Oracle Big Data Service Hue for High Availability Clusters Without Kerberos
G13964-01
September 2024