Généralités sur le service Generative AI
OCI Generative AI est un service Oracle Cloud Infrastructure entièrement géré pour la création, le déploiement et l'exploitation d'applications d'IA générative à l'échelle de l'entreprise.
Fonctionnalités principales
OCI Generative AI prend en charge les cas d'utilisation de base de l'IA générative suivants :
- Discussion pour les expériences conversationnelles telles que la réponse aux questions et les assistants virtuels
- Incorrespondances pour la recherche sémantique, la recommandation, la classification et le clustering
- Rank pour trier les documents en fonction de la pertinence d'une requête
- API compatibles OpenAI pour l'intégration aux outils et kits SDK existants
Options d'utilisation du modèle
Vous pouvez utiliser OCI Generative AI de l'une des manières suivantes :
- Utiliser des modèles hébergés préentraînés via le playground de test, l'API ou la CLI.
- Importez, affinez et hébergez des modèles personnalisés sur des clusters d'IA dédiés.
- Passer de l'expérimentation à la production avec des contrôles d'entreprise.
Fonctionnalités d'IA d'entreprise
OCI Generative AI inclut des fonctionnalités d'IA d'entreprise pour la création d'applications agentiques de production.
Ces fonctionnalités incluent :
- API OCI Réponses
- OpenAI API compatible avec les réponses pour l'interaction des modèles et les workflows agénétiques
- Prend en charge l'orchestration, le raisonnement, l'utilisation des outils, la mémoire et le routage multimodèle
- Outils
- Recherche de fichier
- Interpréteur de code
- Appel de fonction pour les outils locaux
- Appel MCP pour les serveurs MCP distants
- API Containers
- API des magasins de vecteurs
- API de fichiers
- Mémoire
- API de conversations
- Mémoire à long terme
- Compaction de contexte de mémoire à court terme
- Projets
- Organiser les charges de travail des agents par projet
- Isoler les conversations, les fichiers, les conteneurs et la mémoire
- Configurer les paramètres de conservation et de mémoire des données
- Applications
- Hébergement entièrement géré pour les applications agénétiques
- Prise en charge des applications créées avec des frameworks open source ou des serveurs MCP
- Contrôles de sécurité intégrés
- Prise en charge des adresses publiques et privées
- Magasins de vecteurs
- Stockage vectoriel géré
- Ingestion de fichiers
- Recherche sémantique
- Filtrage des métadonnées
- Prise en charge des cas d'utilisation RAG et NL2SQL
- NL2SQL
- Ingère les informations de schéma client
- Enrichit les données de schéma dans une banque de vecteurs sémantiques
- Accepte les requêtes en langage naturel et génère du code SQL
- S'exécute de manière contrôlée par les droits d'accès sans déplacer ni copier le contenu de la base de données
- Clés d'API d'IA d'entreprise
- Clés d'API propres à OCI pour les services d'IA d'entreprise
- Rotation automatique
Avantages de la plate-forme
- Créez plus rapidement des applications d'IA prêtes à l'emploi
- Réduire la complexité opérationnelle
- Appliquer les contrôles de sécurité et de gouvernance d'entreprise
- Utiliser une plate-forme unifiée pour l'IA générative, la récupération, la mémoire, les outils et l'hébergement géré
Rubriques connexes
- Pour les services qui font appel à l'IA générative, reportez-vous à Régions d'IA générative.
- Pour les régions avec l'IA générative, reportez-vous à Régions d'IA générative
- Pour les modèles disponibles par région, reportez-vous à Modèles d'IA générative par région.
- Pour les modèles et les régions pris en charge pour les tâches d'IA d'entreprise, reportez-vous à Modèles et régions d'IA générative pour l'API Agentic.
- Pour accéder à l'IA générative dans la console, reportez-vous à Accès à l'IA générative dans la console.