Implante GPUs NVIDIA para Modelagem Molecular e Descoberta de Drogas no Oracle Cloud

A plataforma Envoy de GridMarkets é executada no Oracle Cloud em data centers em todo o mundo para reduzir drasticamente o tempo necessário para simular a reação de uma molécula de drogas a diferentes proteínas.

Com o advento do design de medicamentos auxiliados por computador (CADD) como um método de modelagem de compostos medicinais há mais de quatro décadas, pesquisadores de medicamentos têm sido capazes de rastrear um número maior de moléculas e identificar os candidatos a medicamentos mais promissores mais rápidos e mais baratos do que poderiam em um laboratório. Combinando avanços em técnicas de aprendizado de máquina, poder computacional, paralelização e plataformas de simulação nativas da nuvem, como GridMarkets, pesquisadores de drogas têm sido capazes de reduzir o tempo necessário para simular a reação de uma molécula de drogas a diferentes proteínas de várias semanas ou meses a apenas horas.

Usando o aplicativo Envoy proprietário GridMarkets, que se integra a plataformas de modelagem molecular populares, como AMBER, GROMACS, NAMD e MOE, pesquisadores de drogas podem submeter milhares de ligantes, todos eles podem ser executados em paralelo dentro de um dia, dependendo do número de máquinas e seu poder de processamento.

Com base em 2011, Mark Ross e Hakim Karim, GridMarkets executam sua plataforma de simulação molecular em servidores de alto desempenho localizados na Oracle Cloud em data centers de todo o mundo. Com o Oracle Cloud Infrastructure, não há necessidade de enfileirar solicitações ou programar simulações. Em vez disso, os clientes do GridMarkets podem acessar um número (quase) ilimitado de máquinas sempre que precisarem, sem ter que pagar por capacidade não utilizada quando não precisarem.

Em segundos depois que os clientes selecionam o número de máquinas nas quais executar suas simulações, o GridMarkets configura o software e os recursos de computação, criptografa os dados e envia a solicitação. Quando o trabalho é concluído, os resultados são retornados automaticamente e as máquinas são desligadas, de modo que não há custos de lingering. Como o workflow de GridMarkets não vincula recursos locais, os pesquisadores de medicamentos não precisam se sentar e esperar pelo firewall de uma empresa por seus resultados. Em vez disso, eles podem executar suas simulações de um laptop em qualquer lugar do mundo. Usando métodos de confiança zero para segurança de defesa em profundidade, o GridMarkets protegeu sua plataforma no Oracle Cloud para proteger seu próprio ambiente, bem como a propriedade intelectual de seus clientes.

Arquitetura

GridMarkets é uma plataforma multinuvem, acessada por meio de um aplicativo proprietário chamado Envoy a partir do desktop de um usuário final.

O cliente Envoy usa uma API para solicitar acesso à região head-end hospedada no OCI (Oracle Cloud Infrastructure). O Oracle Cloud Infrastructure Load Balancing oferece alta disponibilidade (HA) para front-end, interface de usuário e microsserviços que rastreiam usuários, jobs, tarefas e faturamento. Esses microsserviços são hospedados em contêineres Docker. O Oracle MySQL Database Service fornece o armazenamento para dados coletados do front-end com redis e RabbitMQ para dados transacionais efêmeros a serem executados no serviço.

Depois que os usuários forem autenticados e estabelecerem uma conexão com a região head-end, eles poderão solicitar o número de máquinas e CPUs ou GPUs necessárias para executar suas simulações. A região head-end determina para onde enviar a solicitação. A solicitação pode ser enviada a qualquer provedor de serviços em nuvem ou a qualquer região dentro do OCI, dependendo da disponibilidade dos tipos de máquinas solicitados pelos clientes GridMarkets.

Após a conclusão da solicitação, o Envoy faz upload dos dados a serem modelados, simulados ou renderizados no bloco de construção do Oracle Cloud Infrastructure Object Storage. Em seguida, os dados são extraídos do armazenamento de objetos e armazenados no Oracle Cloud Infrastructure Block Volumes anexado a um arquivador NAS (bloco de construção de rascunho e preparação) para um acesso mais rápido ao armazenamento durante a execução do aplicativo. Com base na forma de computação solicitada, o servidor de gerenciamento inicia o aplicativo para começar a processar os dados usando o cluster HPC na região do OCI solicitada (bloco de construção de CPU ou GPU). Depois que a modelagem ou as simulações forem concluídas, o resultado será retornado ao armazenamento de objetos e automaticamente baixado para o usuário por meio do cliente Envoy.

Em segundo plano, o servidor de gerenciamento programa os jobs, aloca recursos, executa o gerenciamento de fila e arquivos e reporta informações de disponibilidade, uso e faturamento de volta para a região head-end.

O diagrama a seguir ilustra essa arquitetura de referência.



gridmarkets-oci-arch-oracle.zip

No roteiro para GridMarkets está o uso da GPU Tensor Core NVIDIA A10 em máquinas virtuais quando essa opção está disponível. Os Gridmarkets também estão explorando opções de integração de inteligência artificial (IA) e aprendizado de máquina (ML) para gerenciamento de recursos.

A arquitetura tem os seguintes componentes:

  • Locação

    Uma tenancy é uma partição segura e isolada que a Oracle configura no Oracle Cloud quando você se inscreve no Oracle Cloud Infrastructure. Você pode criar, organizar e administrar seus recursos no Oracle Cloud dentro da sua tenancy. Uma tenancy é sinônimo de empresa ou organização. Geralmente, uma empresa terá uma única tenancy e refletirá sua estrutura organizacional dentro dessa tenancy. Em geral, uma única tenancy é associada a uma única assinatura e, em geral, uma única assinatura só tem uma tenancy.

  • Região

    Uma região do Oracle Cloud Infrastructure é uma área geográfica localizada que contém um ou mais data centers, denominada domínios de disponibilidade. As regiões são independentes de outras regiões, e grandes distâncias podem separá-las (entre países ou mesmo continentes).

  • Domínio de disponibilidade

    Domínios de disponibilidade são data centers stand-alone e independentes dentro de uma região. Os recursos físicos de cada domínio de disponibilidade são isolados dos recursos de outros domínios de disponibilidade, o que oferece tolerância a falhas. Os domínios de disponibilidade não compartilham infraestrutura como energia ou refrigeração ou a rede interna do domínio de disponibilidade. Portanto, provavelmente uma falha em um domínio de disponibilidade não afetará os outros domínios de disponibilidade da região.

  • Rede virtual na nuvem (VCN) e sub-redes

    Uma VCN é uma rede personalizável definida por software que você configura em uma região do Oracle Cloud Infrastructure. Como as redes tradicionais de data center, as VCNs oferecem total controle sobre seu ambiente de rede. Uma VCN pode ter vários blocos CIDR não sobrepostos que você pode alterar após a criação da VCN. Você pode segmentar uma VCN em sub-redes, com escopo definido para uma região ou para um domínio de disponibilidade. Cada sub-rede consiste em um intervalo contíguo de endereços que não se sobrepõem a outras sub-redes da VCN. Você pode alterar o tamanho de uma sub-rede após a criação. Uma sub-rede pode ser pública ou privada.

  • Lista de segurança

    Para cada sub-rede, você pode criar regras de segurança que especifiquem a origem, o destino e o tipo de tráfego que deve ser permitido dentro e fora da sub-rede.

  • Tabela de roteamento

    As tabelas de roteamento virtual contêm regras para rotear o tráfego de sub-redes para destinos fora de uma VCN, geralmente por meio de gateways.

  • Gateway de internet

    O gateway de internet permite tráfego entre as sub-redes públicas em uma VCN e a internet pública.

  • Gateway de serviço

    O gateway de serviço fornece acesso de uma VCN a outros serviços, como o Oracle Cloud Infrastructure Object Storage. O tráfego da VCN para o serviço da Oracle percorre a malha de rede da Oracle e nunca atravessa a internet.

  • Balanceador de carga

    O serviço Oracle Cloud Infrastructure Load Balancing fornece distribuição automatizada de tráfego de um único ponto de entrada para vários servidores no back-end.

  • Cálculo

    O serviço Oracle Cloud Infrastructure Compute permite provisionar e gerenciar hosts de computação na nuvem. Você pode iniciar instâncias de computação com formas que atendam aos seus requisitos de recursos para CPU, memória, largura de banda da rede e armazenamento. Após criar uma instância de computação, você poderá acessá-la com segurança, reiniciá-la, anexá-la e desanexá-la e encerrá-la quando não precisar mais dela.

  • Bare metal

    Os servidores bare metal da Oracle fornecem isolamento, visibilidade e controle usando instâncias de computação dedicadas. Os servidores suportam aplicativos que exigem altas contagens de núcleos, grandes volumes de memória e alta largura de banda. Eles podem ampliar até 160 núcleos (o maior do setor), 2 TB de RAM e até 1 PB de armazenamento em blocos. Os clientes podem criar ambientes de nuvem nos servidores bare metal da Oracle com melhorias significativas no desempenho em relação a nuvens públicas e data centers locais.

  • Object Storage

    O armazenamento de objetos fornece acesso rápido a grandes quantidades de dados estruturados e não estruturados de qualquer tipo de conteúdo, incluindo backups de banco de dados, dados analíticos e conteúdo avançado, como imagens e vídeos. Você pode armazenar de forma segura e depois recuperar dados diretamente da internet ou de dentro da plataforma da nuvem. Você pode dimensionar o armazenamento de forma integrada sem sofrer qualquer degradação no desempenho ou na confiabilidade do serviço. Use armazenamento padrão para armazenamento "dinâmico" que você precisa acessar de forma rápida, imediata e frequente. Use o armazenamento de arquivos compactados para armazenamento "frio" que você retém por longos períodos de tempo e raramente acessa.

  • Volume em blocos

    Com volumes de armazenamento em blocos, você pode criar, anexar, conectar e mover volumes de armazenamento e alterar o desempenho do volume para atender aos seus requisitos de armazenamento, desempenho e aplicativo. Depois de anexar e conectar um volume a uma instância, você pode usar o volume como disco rígido comum. Você também pode desconectar um volume e anexá-lo a outra instância sem perder dados.

  • Oracle MySQL Database Service

    O Oracle MySQL Database Service é um serviço de banco de dados Oracle Cloud Infrastructure (OCI) totalmente gerenciado que permite aos desenvolvedores desenvolver e implantar rapidamente aplicativos seguros nativos da nuvem. Otimizado e disponível exclusivamente na OCI, o Oracle MySQL Database Service é 100% construído, gerenciado e suportado pelas equipes de engenharia OCI e MySQL.

    O Oracle MySQL Database Service tem um mecanismo de análise integrado de alto desempenho (HeatWave) para executar análises sofisticadas em tempo real diretamente em um banco de dados MySQL operacional.

  • Monitoramento

    O serviço Oracle Cloud Infrastructure Monitoring monitora de forma ativa e passiva seus recursos de nuvem usando métricas para monitorar recursos e alarmes para notificá-lo quando essas métricas atenderem a triggers especificados por alarme.

  • Log
    O registro em log é um serviço altamente escalável e totalmente gerenciado que fornece acesso aos seguintes tipos de logs de seus recursos na nuvem:
    • Logs de auditoria: Logs relacionados a eventos emitidos pelo serviço Audit.
    • Logs de serviço: Logs emitidos por serviços individuais, como os logs de fluxo de Gateway de API, Eventos, Funções, Balanceamento de Carga, Armazenamento de Objetos e VCN.
    • Logs personalizados: Logs que contêm informações de diagnóstico de aplicativos personalizados, outros provedores de nuvem ou um ambiente on-premises.
  • Eventos

    Os serviços do Oracle Cloud Infrastructure emitem eventos, que são mensagens estruturadas que descrevem as alterações nos recursos. Os eventos são emitidos para operações de criação, leitura, atualização ou exclusão (CRUD), alterações no estado do ciclo de vida do recurso e eventos do sistema que afetam os recursos da nuvem.

  • Entrega de E-mail

    O Oracle Cloud Infrastructure Email Delivery é um serviço de entrega de e-mail altamente escalável, barato e confiável para enviar e-mails de alto volume gerados por aplicativo para marketing, notificação e comunicações transacionais de missão crítica, como recibos, alertas de detecção de fraude, verificação de identidade multifator e redefinições de senha.

Obtenha Recursos Criados e Implantados

Deseja mostrar o que você criou no Oracle Cloud Infrastructure? É importante compartilhar suas lições aprendidas, melhores práticas e arquiteturas de referência com nossa comunidade global de arquitetos de nuvem? Vamos ajudá-lo a começar.

  1. Fazer download do modelo (PPTX)

    Ilustre sua própria arquitetura de referência arrastando e soltando os ícones no quadro de fios de amostra.

  2. Assistir ao tutorial de arquitetura

    Obtenha instruções passo a passo sobre como criar uma arquitetura de referência.

  3. Enviar seu diagrama

    Envie um e-mail com seu diagrama. Nossos arquitetos de nuvem verificarão seu diagrama e entrarão em contato com você para discutir sua arquitetura.

Confirmações

  • Autores: Robert Huie, Sasha Banks-Louie
  • Contribuidores: Brad Goodwin, Anup Ojah, Robert Lies

    Equipe Estendida da Oracle: James Michels

    GridMarkets Equipe: Hakim Karim