Mettre en oeuvre Oracle Cloud Infrastructure Generative AI en fonction du modèle de langue Cohere Large

Oracle Cloud Infrastructure Generative AI (OCI Generative AI) est un service entièrement géré qui fournit un jeu de grands modèles de langage (GML) de pointe, personnalisables, qui couvrent un large éventail de cas d'utilisation pour la génération de texte. Vous pouvez utiliser le terrain de jeu - une interface dans la console pour explorer les modèles préentraînés et personnalisés hébergés sans écrire une seule ligne de code ou créer et héberger vos propres modèles personnalisés réglés avec précision à l'aide de vos données dans des clusters d'IA dédiés.

Le service d'intelligence artificielle générative pour OCI comprend les modèles de base suivants :
  • Génération : Donnez des instructions pour générer du texte ou extraire des informations de votre texte.
  • Sommaire : résumez le texte avec le format, la longueur et le ton.
  • Intégration : Permet de convertir le texte en incrustations vectorielles à utiliser dans les applications pour les recherches sémantiques, la classification de texte ou le regroupement de texte.

Architecture

Vous pouvez utiliser l'aire de jeu de l'intelligence artificielle générative OCI pour essayer les modèles préentraînés, exécuter vos invites, ajuster les paramètres, mettre à jour vos invites et exécuter de nouveau les modèles jusqu'à ce que les résultats vous conviennent. Ensuite, vous pouvez copier le code de la console dans vos applications.

Vous pouvez également créer une copie d'un modèle préentraîné, ajouter votre propre jeu de données d'entraînement et laisser le service d'intelligence artificielle générative OCI régler avec précision le modèle. Le service d'IA générative pour OCI utilise des grappes dédiées à l'IA puissantes spécialement dimensionnées pour le réglage de précision. Ces grappes appartiennent uniquement à votre location. Une fois votre modèle réglé avec précision, nous créons un point d'extrémité pour le modèle personnalisé et hébergeons celui-ci dans une grappe dédiée à l'IA conçue pour l'hébergement.

Avantages de la création d'un LLM sur OCI

Service d'intelligence artificielle générative : Oracle fournit des services d'intelligence artificielle générative natifs en collaboration avec Cohere, une plate-forme d'intelligence artificielle d'entreprise de pointe équipée de la compréhension linguistique avancée pour créer la prochaine génération d'applications d'entreprise. L'IA générative OCI est un service entièrement géré disponible au moyen d'une API pour intégrer de façon transparente ces modèles de langage polyvalents dans un large éventail de cas d'utilisation, notamment l'aide à la rédaction, la récapitulation et le clavardage.

Grappes dédiées à l'IA : Les grappes dédiées à l'IA sont des ressources de calcul que vous pouvez utiliser pour régler avec précision des modèles personnalisés ou héberger des points d'extrémité pour des modèles personnalisés. Les grappes sont dédiées à vos modèles et ne sont pas partagées avec les utilisateurs d'autres locations. L'intelligence artificielle générative OCI du modèle personnalisé vous permet de préciser les modèles à l'aide de vos propres données.

Modèle personnalisé : L'intelligence artificielle générative OCI vous permet de préciser les modèles à l'aide de vos propres données.

Note :

Une nouvelle fonction de recherche de similarité de vecteurs IA est disponible dans Oracle Database 23ai.
Dans cette configuration d'architecture de référence, les services OCI suivants sont provisionnés :
  • OCI Object Storage pour le stockage de données.
  • Espace de travail Oracle Cloud Infrastructure Data Science pour la création de modèles.
  • IA générative OCI avec des GPU pour le calcul.
  • Outil Oracle APEX Application Development pour l'interface utilisateur.

Le diagramme suivant illustre cette architecture de référence.



oci-generative-ai-llm-arch-oracle.zip

L'architecture comprend les composants suivants :

  • Région

    Une région Oracle Cloud Infrastructure est une zone géographique localisée qui contient un ou plusieurs centres de données, appelés domaines de disponibilité. Les régions sont indépendantes les unes des autres, et de grandes distances peuvent les séparer (dans différents pays ou continents).

  • Réseau en nuage virtuel (VCN) et sous-réseau

    Un VCN est un réseau défini par logiciel personnalisable, configuré dans une région Oracle Cloud Infrastructure. À l'instar des réseaux de centre de données traditionnels, ces derniers vous permettent de contrôler votre environnement de réseau. Un VCN peut disposer de plusieurs blocs CIDR sans chevauchement que vous pouvez modifier après avoir créé le VCN. Vous pouvez segmenter un VCN en sous-réseaux, dont la portée peut concerner une région ou un domaine de disponibilité. Un sous-réseau est constitué d'un intervalle contigu d'adresses qui ne chevauchent pas les autres sous-réseaux dans le réseau en nuage virtuel. Vous pouvez modifier la taille d'un sous-réseau après sa création. Un sous-réseau peut être public ou privé.

  • Stockage d'objets

    Le service de stockage d'objets permet d'accéder rapidement à de grandes quantités de données non structurées de tous types, notamment des sauvegardes de base de données, des données analytiques et du contenu enrichi, comme des images et des vidéos. Vous pouvez stocker des données en toute sécurité, puis les extraire directement à partir d'Internet ou de la plate-forme en nuage. Vous pouvez adapter le stockage sans que la performance ou la fiabilité des services soit affectée. Utilisez le stockage standard pour le stockage "à chaud" auquel vous devez accéder rapidement, immédiatement et fréquemment. Utilisez le stockage d'archives pour le stockage "à froid" que vous stockez pendant de longues périodes et auquel vous accédez rarement.

  • Service de science des données

    Oracle Cloud Infrastructure Data Science est une plate-forme sans serveur entièrement gérée, que les équipes d'experts en science des données peuvent utiliser pour créer, entraîner et gérer des modèles d'apprentissage automatique sur Oracle Cloud Infrastructure (OCI). Il peut facilement s'intégrer à d'autres services OCI tels qu'Oracle Autonomous Data Warehouse, Oracle Cloud Infrastructure Object Storage et plus encore. Vous pouvez créer et évaluer des modèles d'apprentissage automatique de haute qualité qui augmentent la flexibilité des affaires en mettant rapidement à profit des données fiables de l'entreprise, et vous pouvez soutenir les objectifs commerciaux axés sur les données avec un déploiement plus facile des modèles d'apprentissage automatique.

  • Oracle Database 23ai (recherche de vecteurs d'intelligence artificielle)

    Oracle Database 23ai offre la base de données convergée la plus complète et la plus simple aux développeurs désireux de créer de nouveaux microservices, graphiques, documents et applications relationnelles.

    Oracle a ajouté des capacités de recherche sémantique à l'aide de vecteurs d'intelligence artificielle à Oracle Database 23ai. La collection de fonctions, appelée recherche de vecteurs d'intelligence artificielle, comprend un nouveau type de données vectorielles, des index vectoriels et des opérateurs SQL de recherche vectorielle qui permettent à Oracle Database de stocker le contenu sémantique de documents, d'images et d'autres données non structurées en tant que vecteurs, et de les utiliser pour exécuter des interrogations de similarité rapides. Pour plus d'informations, consultez le lien Blogue dans la section Explorer plus.

Informations complémentaires

Consultez ces ressources supplémentaires pour en savoir plus sur les fonctions de cette architecture de référence.

Intelligence artificielle générative OCI

Remerciements

Author: Pavan Kumar Manuguri