En savoir plus sur l'IA générative
L'IA générative a connu une croissance exponentielle au cours des deux dernières années, modifiant le paysage du travail créatif. Une fois considéré comme le domaine des humains, le contenu créatif est en train de devenir automatisé par l'intelligence artificielle (IA), en utilisant de grands modèles de langage et d'image.
L'IA générative a et continuera d'avoir un impact dans divers secteurs :
- Programmation (texte pour coder)
- Publicité, réseaux sociaux, génération d'images (texte vers image et texte vers texte)
- Edition et génération de vidéos (texte à vidéo)
- Modélisation 3D et scènes 3D (texte vers modèles 3D)
- Jeux, musique, audio, science, etc.
La plupart de ces modèles sont open source et peuvent être exécutés sur des instances de calcul, pour lesquelles nous partageons un script terraform que vous pouvez utiliser pour la génération de texte et d'image. Le script s'installera sur un GPU, Stable Diffusion (texte vers image), Bloom (texte vers le texte ou texte vers le code) et DreamBooth.
- Stable Diffusion est un modèle de texte à image de pointe qui génère des images à partir de texte.
- Bloom est un modèle de langage large multilingue ouvert avec 176 milliards de paramètres. Il a été formé à l'aide de la plate-forme NVIDIA AI, avec la génération de texte en 46 langages et en 13 langages de programmation.
- DreamBooth vous permet d'affiner un modèle de diffusion stable pour générer de nouvelles étiquettes basées sur un petit échantillon d'images. L'idée est que vous pouvez utiliser 20 à 30 images, par exemple, et entraîner le modèle afin qu'il puisse générer quelque chose de nouveau.
Toutes les instructions de création de la machine GPU et d'utilisation des différentes applications se trouvent dans le référentiel GitHub.
Architecture
Cette architecture présente des modèles d'IA génériques déployés vers une instance de GPU OCI.
Une machine GPU est parfaite pour l'exécution de ces modèles car le script terraform va installer tous les pilotes et dépendances sur le système d'exploitation. Les trois applications étant installées en tant que services, elles démarrent avec l'instance.
Notez que les applications ne sont pas sécurisées. Vous devrez donc créer un tunnel SSH pour y accéder en toute sécurité à partir des applications Web.
oci-generative-ai-engines-oracle.zip
Pour utiliser les scripts, vous devez installer :
- Interface de ligne de commande OCI (CLI) pour l'authentification du locataire.
- SSH-keygen pour générer les clés SSH permettant d'accéder à l'instance.
- Terraform pour créer toutes les ressources.
Cette architecture prend en charge les composants suivants :
- Réseau cloud virtuel (VCN) et sous-réseau
Un VCN est un réseau personnalisable défini par logiciel que vous configurez dans une région Oracle Cloud Infrastructure. Comme les réseaux de centres de données traditionnels, les réseaux cloud virtuels vous donnent un contrôle total sur votre environnement réseau. Un VCN peut comporter plusieurs blocs CIDR qui ne se chevauchent pas et que vous pouvez modifier après avoir créé le VCN. Vous pouvez segmenter un VCN en sous-réseaux, qui peuvent être ciblés vers une région ou un domaine de disponibilité. Chaque sous-réseau se compose d'une plage contiguë d'adresses qui ne chevauchent pas les autres sous-réseaux du VCN. Vous pouvez modifier la taille d'un sous-réseau après sa création. Un sous-réseau peut être public ou privé.
- Calcul de GPU
Oracle Cloud Infrastructure Compute fournit des instances Bare Metal, de machine virtuelle et basées sur un GPU NVIDIA pour de nombreux cas d'utilisation, des graphiques et des vidéos grand public aux charges de travail HPC et de formation IA les plus exigeantes. La communication RDMA (Remote Direct Memory Access) entre les instances prend en charge les grands clusters de GPU avec 1 600 Go/s de bande passante pour les charges de travail telles que l'entraînement des modèles, le calcul d'inférence, la modélisation physique et la simulation, le rendu d'image et les applications HPC massivement parallèles.