Remarques :

Exécuter le modèle Elyza LLM sur l'instance OCI Compute A10.2 avec Oracle Resource Manager à l'aide d'un déploiement en un clic

Introduction

Oracle Cloud Infrastructure (OCI) Compute vous permet de créer différents types de formes pour tester les modèles d'unité de traitement graphique (GPU) pour l'intelligence artificielle (IA) déployés localement. Dans ce tutoriel, nous allons utiliser la forme A10.2 avec un VCN et des ressources de sous-réseau préexistants que vous pouvez sélectionner dans Oracle Resource Manager.

Le code Terraform inclut également la configuration de l'instance afin qu'elle exécute un ou plusieurs modèles Elyza vLLM (Virtual Large Language Model) locaux pour les tâches de traitement du langage naturel.

Objectifs

Prérequis

Tâche 1 : téléchargement du code Terraform pour un déploiement en un clic

Téléchargez le code ORM Terraform à partir d'ici : orm_stack_a10_2_gpu_elyza_models.zip, pour implémenter localement des modèles Elyza vLLM qui vous permettront de sélectionner un VCN existant et un sous-réseau afin de tester le déploiement local des modèles Elyza vLLM dans une forme d'instance A10.2.

Une fois le code Terraform ORM téléchargé en local, suivez les étapes ci-après : Création d'une pile à partir d'un dossier pour télécharger la pile et exécuter l'application du code Terraform.

Remarque : assurez-vous d'avoir créé un réseau cloud virtuel (VCN) OCI et un sous-réseau où la machine virtuelle sera déployée.

Tâche 2 : création d'un VCN sur OCI (facultatif s'il n'est pas déjà créé)

Pour créer un VCN dans Oracle Cloud Infrastructure, reportez-vous à : Vidéo pour découvrir comment créer un réseau cloud virtuel sur OCI.

ou

Pour créer un VCN, procédez comme suit :

  1. Connectez-vous à la console OCI, entrez Nom de locataire cloud, Nom utilisateur et Mot de passe.

  2. Cliquez sur le menu hamburger (≡) dans le coin supérieur gauche.

  3. Accédez à Fonctions de réseau, à Réseaux cloud virtuels et sélectionnez le compartiment approprié dans la section Portée de la liste.

  4. Sélectionnez Réseau cloud virtuel avec connectivité Internet, et cliquez sur Lancer l'assistant de réseau cloud virtuel.

  5. Sur la page Créer un VCN avec une connectivité Internet, entrez les informations suivantes et cliquez sur Suivant.

    • NOM du VCN : entrez OCI_HOL_VCN.
    • COMPARTMENT : sélectionnez le compartiment approprié.
    • Bloc CIDR VCN : entrez 10.0.0.0/16.
    • BLOCK de CIDR de sous-réseau PUBLIC : entrez 10.0.2.0/24.
    • Bloc CIDR de sous-réseau privé : entrez 10.0.1.0/24.
    • Résolution DNS : sélectionnez Utiliser des hôtes DNS dans ce VCN.

    Création d'une configuration VCN

    Description de l'illustration setupVCN3.png

  6. Sur la page Vérifier, vérifiez les paramètres et cliquez sur Créer.

    Vérifier la configuration CV

    Description de l'image setupVCN4.png

    Il vous faudra un moment pour créer le VCN et un écran de progression vous tiendra au courant du workflow.

    Workflow

    Description de l'illustration workflow.png

  7. Une fois le VCN créé, cliquez sur Visualiser le réseau cloud virtuel.

    Dans des situations réelles, vous allez créer plusieurs réseaux cloud virtuels en fonction de leur besoin d'accès (les ports à ouvrir) et des utilisateurs autorisés à y accéder.

Tâche 3 : voir les détails de configuration de cloud-init

Le script cloud-init installe toutes les dépendances nécessaires, démarre Docker, télécharge et démarre le ou les modèles vLLM Elyza. Vous pouvez trouver le code suivant dans le fichier cloudinit.sh téléchargé dans la tâche 1.

dnf install -y dnf-utils zip unzip
dnf config-manager --add-repo=https://download.docker.com/linux/centos/docker-ce.repo
dnf remove -y runc
dnf install -y docker-ce --nobest
systemctl enable docker.service
dnf install -y nvidia-container-toolkit
systemctl start docker.service
...

Cloud-init télécharge tous les fichiers nécessaires à l'exécution du modèle Elyza et n'a pas besoin de votre jeton API prédéfini dans Hugging Face. Le jeton d'API sera nécessaire pour le lancement du modèle Elyza à l'aide de Docker dans la tâche 6.

Tâche 4 : surveiller le système

Suivez l'achèvement de l'initialisation du cloud et l'utilisation des ressources GPU à l'aide des commandes suivantes (si nécessaire).

Tâche 5 : tester l'intégration du modèle

Interagissez avec le modèle de la manière suivante à l'aide des commandes ou des détails de Jupyter Notebook.

Tâche 6 : déployer le modèle à l'aide de Docker (si nécessaire)

Vous pouvez également déployer le modèle à l'aide de Docker pour les environnements encapsulés :

Vous pouvez interroger le modèle de l'une des manières suivantes :

Remerciements

Ressources de formation supplémentaires

Parcourez d'autres ateliers sur docs.oracle.com/learn ou accédez à davantage de contenus de formation gratuits sur le canal Oracle Learning YouTube. De plus, rendez-vous sur education.oracle.com/learning-explorer pour devenir un explorateur Oracle Learning.

Pour obtenir de la documentation sur le produit, visitez Oracle Help Center.