Implémentation d'Oracle Cloud Infrastructure Generative AI selon un grand modèle de langage Cohere

Oracle Cloud Infrastructure Generative AI (OCI Generative AI) est un service entièrement géré qui fournit un ensemble de grands modèles de langage de pointe et personnalisables couvrant une large gamme de cas d'emploi pour la génération de texte. Vous pouvez utiliser le terrain de jeu - une interface dans la console pour explorer les modèles pré-entraînés et personnalisés hébergés sans écrire une seule ligne de code ou créer et héberger vos propres modèles personnalisés affinés en fonction de vos propres données sur des clusters d'IA dédiés.

Le service OCI Generative AI inclut les modèles de base suivants :
  • Génération : Donnez des instructions pour générer du texte ou pour extraire des informations à partir de votre texte.
  • Synthèse : résumez un texte avec le format, la longueur et le ton indiqués.
  • Incorporation : convertissez du texte en ensembles vecteurs à utiliser dans des applications à des fins de recherche sémantique, de classification de texte ou de clustering de texte.

Architecture

Vous pouvez utiliser la zone de jeu OCI Generative AI pour essayer des modèles préentraînés, exécuter vos invites, ajuster les paramètres, mettre à jour vos invites et réexécuter les modèles jusqu'à ce que les résultats vous conviennent. Après cela, vous pouvez copier le code de la console dans vos applications.

Vous pouvez également créer une copie d'un modèle pré-entraîné, ajouter votre propre ensemble de données d'entraînement et laisser le service OCI Generative AI affiner le modèle. OCI Generative AI utilise de puissants clusters d'IA dédiés spécialement dimensionnés pour l'affinage. Ces clusters appartiennent uniquement à votre location. Une fois le modèle affiné, créez une adresse pour le modèle personnalisé et l'hôte qui le modélisent sur un cluster d'IA dédié conçu pour l'hébergement.

Avantages de la création d'une LLM sur OCI

Service d'IA générative : Oracle fournit des services d'IA générative native en collaboration avec Cohere, une plate-forme d'IA d'entreprise de pointe dotée d'une compréhension avancée des langages pour la création d'applications d'entreprise nouvelle génération. OCI Generative AI est un service entièrement géré disponible via une API pour intégrer de manière transparente ces modèles de langage polyvalents dans un large éventail de cas d'utilisation, notamment l'aide à la rédaction, la synthèse et la discussion.

Clusters d'IA dédiés : les clusters d'IA dédiés sont des ressources de calcul que vous pouvez utiliser pour affiner des modèles personnalisés ou pour héberger des adresses pour des modèles personnalisés. Les clusters sont dédiés à vos modèles et ne sont pas partagés avec les utilisateurs d'autres locations. Le modèle personnalisé OCI Generative AI vous permet d'affiner les modèles à l'aide de vos propres données.

Modèle personnalisé : OCI Generative AI vous permet d'affiner les modèles à l'aide de vos propres données.

Remarques :

La nouvelle fonctionnalité de recherche de similarité de vecteur d'IA est disponible dans Oracle Database 23ai.
Dans cette configuration d'architecture de référence, les services OCI suivants sont provisionnés :
  • OCI Object Storage pour le stockage de données.
  • Espace de travail Oracle Cloud Infrastructure Data Science pour la création de modèles.
  • OCI Generative AI avec des GPU pour le calcul.
  • Outil Oracle APEX Application Development pour l'interface utilisateur.

Le diagramme suivant illustre cette architecture de référence.



oci-generative-ai-llm-arch-oracle.zip

L'architecture comporte les composants suivants :

  • Région

    Une région Oracle Cloud Infrastructure est une zone géographique précise qui contient un ou plusieurs centres de données, appelés domaines de disponibilité. Les régions sont indépendantes les unes des autres et de grandes distances peuvent les séparer (dans des pays voire des continents).

  • Réseau cloud virtuel (VCN) et sous-réseaux

    Un VCN est un réseau personnalisable défini par logiciel que vous configurez dans une région Oracle Cloud Infrastructure. Comme les réseaux de centre de données traditionnels, les réseaux cloud virtuels vous donnent le contrôle de l'environnement réseau. Un réseau cloud virtuel peut comporter plusieurs blocs CIDR qui ne se chevauchent pas et que vous pouvez modifier après l'avoir créé. Vous pouvez segmenter un réseau cloud virtuel en plusieurs sous-réseaux ciblant une région ou un domaine de disponibilité. Chaque sous-réseau est composé d'une plage contiguë d'adresses qui ne chevauchent pas celles des autres sous-réseaux du réseau cloud virtuel. Vous pouvez modifier la taille d'un sous-réseau après sa création. Un sous-réseau peut être public ou privé.

  • Object Storage

    Le stockage d'objets permet d'accéder rapidement à de grandes quantités de données, structurées ou non, de tout type de contenu, y compris des sauvegardes de base de données, des données analytiques et du contenu riche tel que des images et des vidéos. Vous pouvez stocker les données, puis les extraire directement à partir d'Internet ou de la plate-forme cloud, et ce, en toute sécurité. Vous pouvez faire évoluer le stockage sans dégradation des performances ni de la fiabilité des services. Utilisez le stockage standard pour le stockage "à chaud" auquel vous devez accéder rapidement, immédiatement et fréquemment. Utilisez le stockage d'archives pour le stockage "à froid" que vous conservez pendant longtemps et auquel vous accédez rarement.

  • Data Science

    Oracle Cloud Infrastructure Data Science est une plate-forme sans serveur entièrement gérée que les équipes de science des données peuvent utiliser pour créer, former et gérer des modèles d'apprentissage automatique sur Oracle Cloud Infrastructure (OCI). Il peut facilement s'intégrer à d'autres services OCI tels qu'Oracle Autonomous Data Warehouse, Oracle Cloud Infrastructure Object Storage, etc. Vous pouvez créer et évaluer des modèles de machine learning de haute qualité qui augmentent la flexibilité de l'entreprise en mettant rapidement en œuvre des données fiables pour l'entreprise, et vous pouvez prendre en charge les objectifs commerciaux axés sur les données avec un déploiement plus facile des modèles de machine learning.

  • Oracle Database 23ai (recherche vectorielle AI)

    Oracle Database 23ai fournit la base de données convergée la plus complète et la plus simple pour les développeurs qui cherchent à créer de nouvelles applications de microservices, de graphes, de documents et relationnels.

    Oracle a ajouté des fonctionnalités de recherche sémantique utilisant des vecteurs d'IA à Oracle Database 23ai. La collection de fonctionnalités, appelée AI Vector Search, comprend un nouveau type de données vectorielles, des index vectoriels et des opérateurs SQL de recherche vectorielle qui permettent à Oracle Database de stocker le contenu sémantique de documents, d'images et d'autres données non structurées en tant que vecteurs, et de les utiliser pour exécuter des requêtes de similarité rapides. Pour plus d'informations, reportez-vous au lien Blog de la section En savoir plus.

En savoir plus

Consultez ces ressources supplémentaires pour en savoir plus sur les fonctionnalités de cette architecture de référence.

OCI Generative AI

Remerciements

Author: Pavan Kumar Manuguri