Saiba mais sobre o AI Generativo
A IA generativa cresceu exponencialmente nos últimos dois anos, mudando o cenário do trabalho criativo. Uma vez pensado como o domínio dos seres humanos, o conteúdo criativo agora está se tornando automatizado pela inteligência artificial (IA), usando grandes modelos de linguagem e imagem.
A IA generativa tem e continuará a ter um impacto em vários setores:
- Programação (texto para código)
- Publicidade, redes sociais, geração de imagens (texto para imagem e texto para texto)
- Edição de vídeo e geração de vídeo (texto para vídeo)
- 3D modeleling e cenas 3D (texto para modelos 3D)
- Jogos, música, áudio, ciência, etc.
Muitos desses modelos são de código-fonte aberto e podem ser executados em instâncias de computação, para as quais compartilhamos um script terraform que você pode usar na geração de texto e imagem. O script será instalado em cima de uma GPU, Difusão Estável (texto para imagem), Bloom (texto para texto ou texto para código) e DreamBooth.
- Difusão Estável é um modelo de última geração de texto a imagem que gera imagens de texto.
- A Bloom é um modelo de linguagem grande aberto e multilíngue com 176 bilhões de parâmetros. Ele foi treinado usando a plataforma NVIDIA AI, com geração de texto em 46 idiomas e 13 linguagens de programação.
- DreamBooth permite ajustar um modelo de difusão estável para gerar novos labels com base em uma pequena amostra de imagens. A ideia é que você possa usar 20-30 imagens, por exemplo, e treinar o modelo para que ele possa gerar algo novo.
Todas as instruções para criar a máquina GPU e usar os diferentes aplicativos estão no repositório GitHub.
Arquitetura
Esta arquitetura mostra modelos de IA generativos implantados em uma instância de GPU do OCI.
Uma máquina GPU é perfeita para a execução desses modelos, pois o script terraform instalará todos OS drivers e dependências do sistema operacional. Os três aplicativos são instalados como serviços; portanto, eles serão iniciados com a instância.
Observe que os aplicativos não são protegidos; portanto, você terá que criar um túnel SSH para acessá-los com segurança nos aplicativos web.
oci-generative-ai-engines-oracle.zip
Para usar os scripts, é necessário instalar:
- Interface de linha de comando (CLI) do OCI para autenticação de tenant.
- Chave SSH para gerar as chaves SSH para acesso à instância.
- Terraform para criar todos os recursos.
Essa arquitetura suporta os seguintes componentes:
- Rede virtual na nuvem (VCN) e sub-rede
Uma VCN é uma rede personalizável e definida por software que você configura em uma região do Oracle Cloud Infrastructure. Como as redes tradicionais de data center, as VCNs oferecem total controle sobre seu ambiente de rede. Uma VCN pode ter vários blocos CIDR não sobrepostos que você pode alterar após criar a VCN. Você pode segmentar uma VCN em sub-redes, que podem ter escopo em uma região ou em um domínio de disponibilidade. Cada sub-rede consiste em um intervalo ininterrupto de endereços que não se sobrepõem às outras sub-redes da VCN. Você pode alterar o tamanho de uma sub-rede após a criação. Uma sub-rede pode ser pública ou privada.
- Computação de GPU
O Oracle Cloud Infrastructure Compute fornece instâncias de máquina virtual, bare metal e baseadas em GPU NVIDIA para uma variedade de casos de uso, desde gráficos e vídeos convencionais até o treinamento de IA e cargas de trabalho HPC mais exigentes. A comunicação RDMA (Remote Direct Memory Access) entre instâncias suporta clusters GPU grandes com 1.600 GB/s de largura de banda para cargas de trabalho, como treinamento de modelo, computação de inferência, modelagem e simulação baseadas em física, renderização de imagem e aplicativos HPC massivamente paralelos.