Présentation d'OCI Generative AI

OCI Generative AI est un service Oracle Cloud Infrastructure entièrement géré pour la création, le déploiement et l'exploitation d'applications d'IA générative à l'échelle de l'entreprise.

Utilisez OCI Generative AI pour travailler avec des modèles préentraînés et personnalisés, créer des agents de production et appliquer des contrôles de gouvernance d'entreprise sur les comportements d'accès, de mise en réseau et d'IA. Le service prend en charge les principales tâches d'IA générative telles que le chat, les intégrations, le rerank et les API compatibles OpenAI, tout en fournissant des fonctionnalités d'entreprise pour les outils, la mémoire, l'extraction et les applications agénétiques hébergées.

Cette documentation est organisée autour de trois domaines principaux :

  • Modèles d'IA d'entreprise
  • Agents d'IA d'entreprise
  • Gouvernance de l'IA d'entreprise

Modèles d'IA d'entreprise

Utilisez les modèles d'IA d'entreprise lorsque vous souhaitez accéder aux modèles pour des tâches d'inférence telles que la génération conversationnelle, la recherche sémantique, la recommandation, la classification, le clustering et le classement de pertinence.

OCI Generative AI prend en charge :

  • Discussion pour les expériences conversationnelles telles que la réponse aux questions et les assistants virtuels
  • Incorrespondances pour la recherche sémantique, la recommandation, la classification et le clustering
  • Rank pour trier les documents en fonction de la pertinence d'une requête
  • API compatibles OpenAI pour l'intégration aux outils et kits SDK existants

Vous pouvez utiliser les modèles OCI Generative AI de plusieurs manières. Vous pouvez appeler des modèles hébergés préentraînés via la console, l'API ou l'interface de ligne de commande. Vous pouvez également importer, affiner et héberger des modèles personnalisés sur des clusters d'IA dédiés. Cela vous permet de passer de l'expérimentation à la production avec des contrôles d'entreprise et de la flexibilité de déploiement.

Agents d'IA d'entreprise

Utilisez des agents d'IA d'entreprise lorsque vous voulez créer des applications agentiques de production qui combinent des modèles avec des outils, de la mémoire, une extraction et une orchestration.

OCI Generative AI fournit deux approches principales pour la création d'agents :

  • Créez des agents avec l'API OCI Responses
  • Déployer des applications agentiques hébergées dans OCI Generative AI

Vous pouvez également combiner ces approches dans une architecture hybride.

L'API OCI Responses est l'API principale pour les workflows agénétiques. Compatible avec OpenAI, il prend en charge l'interaction des modèles, l'orchestration, le raisonnement, l'état des conversations et l'utilisation des outils. Les outils pris en charge sont Recherche de fichier, Interpréteur de code, Appel de fonction et Appel MCP. Les agents peuvent également utiliser des ressources de prise en charge telles que les fichiers, les banques de vecteurs, les conteneurs, les conversations, les projets et les fonctions de mémoire telles que la mémoire à long terme et la compaction de mémoire à court terme.

OCI Generative AI prend également en charge la recherche SQL (NL2SQL) pour les workflows d'agent nécessitant un accès structuré aux données d'entreprise. NL2SQL convertit les demandes en langage naturel en SQL validé à l'aide de l'enrichissement sémantique et des métadonnées de données structurées.

Pour les équipes qui souhaitent un hébergement géré par OCI pour des exécutions personnalisées, OCI Generative AI fournit des applications et des déploiements pour les applications agentiques hébergées. Ce modèle prend en charge le déploiement basé sur des conteneurs, l'infrastructure gérée, le réseau, l'intégration du stockage et la configuration des identités.

Gouvernance de l'IA d'entreprise

Utilisez Enterprise AI Governance lorsque vous avez besoin de sécuriser et de contrôler la façon dont les ressources d'IA générative sont consultées, déployées et utilisées.

La gouvernance de l'IA d'entreprise dans OCI Generative AI combine des contrôles d'infrastructure, d'identité, de sécurité du réseau et d'exécution pour aider à maintenir les systèmes d'IA sécurisés, conformes et alignés sur la politique de l'entreprise.

Les principales fonctionnalités de gouvernance sont les suivantes :

  • Stratégies IAM pour contrôler qui peut accéder aux ressources OCI Generative AI, les utiliser et les gérer
  • Adresses privées pour conserver l'accès aux modèles dans une limite réseau sécurisée
  • Clés d'API pour accéder aux services OCI Generative AI
  • OAuth pour les tâches agentiques qui nécessitent l'intégration d'applications de domaine d'identité OCI IAM
  • Zero Trust Packet Routing (ZPR) pour l'application du réseau basée sur les identités
  • Guardrails pour l'application de contrôles de conformité et de sécurité d'exécution aux entrées et sorties de modèle

Ensemble, ces fonctionnalités assurent une gouvernance de bout en bout en matière de contrôle d'accès, de sécurité réseau, de configuration des applications hébergées et de comportement de l'IA.

Interaction entre ces domaines

Ces trois domaines fonctionnent ensemble dans le cadre d'une plate-forme :

  • Les modèles d'IA d'entreprise fournissent la base du modèle pour l'inférence et la génération
  • Agents d'IA d'entreprise ajout d'orchestration, d'outils, de mémoire, d'extraction et d'exécution hébergée
  • Enterprise AI Governance applique les contrôles de sécurité, d'accès et de conformité nécessaires à l'utilisation de l'entreprise

Cette combinaison vous permet de passer de l'accès au modèle au développement d'applications agentiques en passant par le déploiement en production avec gouvernance intégrée.