Modèles d'IA d'entreprise dans OCI Generative AI

Utilisez les modèles d'IA d'entreprise dans OCI Generative AI pour accéder aux modèles hébergés préentraînés, importer des modèles personnalisés pris en charge et déployer des modèles pour les charges de travail d'inférence d'entreprise.

Cette section fournit des liens vers les modèles disponibles dans OCI Generative AI et vers les ressources utilisées pour déployer, gérer et redimensionner ces modèles dans OCI.

Ce que vous pouvez faire avec les modèles d'IA d'entreprise

Utilisez des modèles d'IA d'entreprise lorsque vous souhaitez :

  • Exécuter l'inférence avec des modèles hébergés préentraînés
  • Importer et héberger des modèles personnalisés pris en charge
  • Sélectionner des options de déploiement à la demande et dédiées
  • Déployez des modèles sur des clusters d'IA dédiés pour les charges de travail de production
  • Gérer les adresses et l'accès au réseau privé
  • Vérifier le modèle et la disponibilité régionale
  • Comprendre les considérations relatives à la tarification et aux performances

OCI Generative AI prend en charge les tâches de modèle de base telles que :

  • Discussion pour la génération conversationnelle
  • Incorrespondances pour la recherche sémantique, la recommandation, la classification et le clustering
  • Rang pour trier les documents en fonction de la pertinence d'une requête

Options d'utilisation du modèle

OCI Generative AI prend en charge plusieurs façons d'utiliser les modèles :

  • Modèles hébergés préentraînés pour l'inférence gérée via OCI
  • Modèles importés pour le déploiement de modèle personnalisé pris en charge
  • Mode à la demande pour l'accès géré partagé
  • Mode dédié pour un modèle isolé servant sur des clusters d'IA dédiés

Ces options vous permettent de passer de l'expérimentation à la production tout en sélectionnant le niveau de contrôle, l'isolation des performances et la gestion de l'infrastructure qui correspond à votre charge de travail.

Infrastructure et gestion des modèles

Les modèles d'IA d'entreprise dans OCI Generative AI sont pris en charge par des ressources de déploiement et de gestion telles que :

  • Clusters d'IA dédiés pour l'hébergement de modèles isolés
  • Adresses pour le service du trafic de modèle
  • Adresses privées pour un accès réseau sécurisé
  • Disponibilité du modèle régional pour la planification du déploiement
  • Guide des performances et des coûts pour les charges de travail de production

Rubriques de cette section

Utilisez les rubriques suivantes pour en savoir plus sur les modèles d'IA d'entreprise dans OCI Generative AI :