Généralités sur le service Generative AI

OCI Generative AI est un service Oracle Cloud Infrastructure entièrement géré pour la création, le déploiement et l'exploitation d'applications d'IA générative à l'échelle de l'entreprise.

Fonctionnalités principales

OCI Generative AI prend en charge les cas d'utilisation de base de l'IA générative suivants :

  • Discussion pour les expériences conversationnelles telles que la réponse aux questions et les assistants virtuels
  • Incorrespondances pour la recherche sémantique, la recommandation, la classification et le clustering
  • Rank pour trier les documents en fonction de la pertinence d'une requête
  • API compatibles OpenAI pour l'intégration aux outils et kits SDK existants

Options d'utilisation du modèle

Vous pouvez utiliser OCI Generative AI de l'une des manières suivantes :

  • Utiliser des modèles hébergés préentraînés via le playground de test, l'API ou la CLI.
  • Importez, affinez et hébergez des modèles personnalisés sur des clusters d'IA dédiés.
  • Passer de l'expérimentation à la production avec des contrôles d'entreprise.

Fonctionnalités d'IA d'entreprise

OCI Generative AI inclut des fonctionnalités d'IA d'entreprise pour la création d'applications agentiques de production.

Ces fonctionnalités incluent :

  • API OCI Réponses
    • OpenAI API compatible avec les réponses pour l'interaction des modèles et les workflows agénétiques
    • Prend en charge l'orchestration, le raisonnement, l'utilisation des outils, la mémoire et le routage multimodèle
  • Outils
    • Recherche de fichier
    • Interpréteur de code
    • Appel de fonction pour les outils locaux
    • Appel MCP pour les serveurs MCP distants
    • API Containers
    • API des magasins de vecteurs
    • API de fichiers
  • Mémoire
    • API de conversations
    • Mémoire à long terme
    • Compaction de contexte de mémoire à court terme
  • Projets
    • Organiser les charges de travail des agents par projet
    • Isoler les conversations, les fichiers, les conteneurs et la mémoire
    • Configurer les paramètres de conservation et de mémoire des données
  • Applications
    • Hébergement entièrement géré pour les applications agénétiques
    • Prise en charge des applications créées avec des frameworks open source ou des serveurs MCP
    • Contrôles de sécurité intégrés
    • Prise en charge des adresses publiques et privées
  • Magasins de vecteurs
    • Stockage vectoriel géré
    • Ingestion de fichiers
    • Recherche sémantique
    • Filtrage des métadonnées
    • Prise en charge des cas d'utilisation RAG et NL2SQL
  • NL2SQL
    • Ingère les informations de schéma client
    • Enrichit les données de schéma dans une banque de vecteurs sémantiques
    • Accepte les requêtes en langage naturel et génère du code SQL
    • S'exécute de manière contrôlée par les droits d'accès sans déplacer ni copier le contenu de la base de données
  • Clés d'API d'IA d'entreprise
    • Clés d'API propres à OCI pour les services d'IA d'entreprise
    • Rotation automatique

Avantages de la plate-forme

  • Créez plus rapidement des applications d'IA prêtes à l'emploi
  • Réduire la complexité opérationnelle
  • Appliquer les contrôles de sécurité et de gouvernance d'entreprise
  • Utiliser une plate-forme unifiée pour l'IA générative, la récupération, la mémoire, les outils et l'hébergement géré