Migrar o Hadoop para o Oracle Usando o Migrador WANdisco LiveData
O LiveData Migrator é implantado em um nó de borda do cluster do Hadoop. A implantação é realizada em minutos sem impacto nas operações de produção atuais. Os usuários podem começar a usar o produto imediatamente usando a linha de comando, a API REST ou a interface do usuário (IU) para executar a migração.
Sobre a Migração de Dados do Hadoop
Veja a seguir as etapas típicas envolvidas em uma migração do Apache Hadoop para a Nuvem:
O diagrama a seguir ilustra a arquitetura de fluxo e os componentes.

Descrição da ilustração hadoop-lakehouse-migration.png
hadoop-lakehouse-migration-oracle.zip
- Descoberta: Identifique os conjuntos de dados e cargas de trabalho que devem ser migrados para a nuvem.
- Planejamento: Desenvolva um plano e cronograma para as fases em que a migração será executada.
- Migração de Dados: Execute a migração dos dados necessários do ambiente Hadoop local para a nuvem.
- Migração de Carga de Trabalho: Execute a migração de cargas de trabalho e/ou aplicativos do ambiente local para a nuvem.
- Novo Desenvolvimento de Análise: Comece a desenvolver novas análises, IA e aprendizado de máquina, aproveitando, assim, o novo ambiente de nuvem.
- Medida e Ação: Execute análises para medir KPIs, avaliar desempenho, fazer previsões e permitir que a empresa aja de forma apropriada.
Para tentar simplificar sua migração para a nuvem, muitas organizações optam por seguir uma estratégia de migração "lift and shift". Essa estratégia faz o pressuposto simplista de que a migração pode ser realizada sem fazer qualquer alteração nos dados ou nos aplicativos. A lógica é "apenas movê-los como eles estão para a nuvem". Essa suposição resulta em muitos projetos ou projetos com falha que excedem seu tempo e custos. Isso exige que os sistemas existentes sejam desativados para garantir que não ocorram alterações nos dados ou exige que as organizações passem tempo desenvolvendo soluções personalizadas para lidar com alterações de dados. Outras desvantagens para essa estratégia são, primeiro, que ela exige que as organizações executem uma transição importante de todos os aplicativos e dados ao mesmo tempo, e segundo, não tira proveito dos novos recursos de nuvem.
WANdisco promove uma abordagem de dados em primeiro lugar para migrações de data lake. Uma abordagem com base nos dados em primeiro lugar se concentra em fazer com que os dados sejam movidos rapidamente e não em tentar migrar todos os aplicativos existentes ao mesmo tempo. Esse foco torna os dados disponíveis para os cientistas de dados mais rapidamente, para que eles possam começar a trabalhar com os dados migrados desde o primeiro dia. Isso permite um tempo muito mais rápido para novos insights e inovações em IA. As organizações podem demonstrar um ROI mais rápido na migração para a nuvem, enquanto as cargas de trabalho de produção locais existentes podem continuar a ser executadas de forma não afetada. Essa abordagem também oferece flexibilidade para a migração de aplicativos e cargas de trabalho. Ela evita abordagens big-bang e fornece às organizações tempo para otimizar as cargas de trabalho para o novo ambiente de nuvem, assegurando a execução ideal e aproveitando novos recursos disponíveis para elas. As organizações podem fazer o máximo de testes paralelos necessário para garantir que não experimentarão custos ocultos, e uma abordagem de dados em primeiro lugar também lhes dará tempo para determinar se alguns dos aplicativos podem não precisar ser migrados, mas em vez disso substituídos pelo novo desenvolvimento que está ocorrendo.
Definir Origens e Destinos
Durante a implantação, o WANdisco LiveData Migrator descobre automaticamente o cluster do Apache Hadoop Distributed File System (HDFS) de origem para que você só precise definir o ambiente de destino.
Definir a Migração
As migrações transferem os dados existentes da origem para o destino definido. O WANdisco LiveData Migrator migra todas as alterações feitas nos dados de origem enquanto eles estão sendo migrados e garante que o destino esteja atualizado com essas alterações. Ele faz isso enquanto continua a executar a migração.
Em geral, os usuários criarão várias migrações para que possam selecionar conteúdo específico do sistema de arquivos de origem por caminho. Você também pode migrar para vários sistemas de arquivos independentes ao mesmo tempo definindo vários destinos de migração.
Para criar uma migração, forneça o nome de uma migração, selecione os sistemas de arquivos de origem e de destino e especifique o caminho no sistema de arquivos de origem a ser migrado. Opcionalmente, você pode aplicar exclusões para especificar regras para dados que devem ser excluídos de uma migração e podem aplicar outras definições de configuração opcionais.
O LiveData Migrator também suporta a migração de metadados do Hive de metastores de origem para destino. O LiveData Migrator se conecta a metastores por meio do uso de agentes de metadados locais ou remotos. Em seguida, as regras de metadados são usadas para definir os metadados a serem migrados da origem para o destino.
Ao definir as migrações, você pode especificar para iniciar automaticamente a migração e determinar se ela deve ser uma migração ao vivo, o que significa que ela aplicará continuamente quaisquer alterações contínuas da origem ao destino.