Modèles d'IA d'entreprise dans OCI Generative AI
Utilisez les modèles d'IA d'entreprise dans OCI Generative AI pour accéder aux modèles hébergés préentraînés, importer des modèles personnalisés pris en charge et déployer des modèles pour les charges de travail d'inférence d'entreprise.
Cette section fournit des liens vers les modèles disponibles dans OCI Generative AI et vers les ressources utilisées pour déployer, gérer et redimensionner ces modèles dans OCI.
Ce que vous pouvez faire avec les modèles d'IA d'entreprise
Utilisez des modèles d'IA d'entreprise lorsque vous souhaitez :
- Exécuter l'inférence avec des modèles hébergés préentraînés
- Importer et héberger des modèles personnalisés pris en charge
- Sélectionner des options de déploiement à la demande et dédiées
- Déployez des modèles sur des clusters d'IA dédiés pour les charges de travail de production
- Gérer les adresses et l'accès au réseau privé
- Vérifier le modèle et la disponibilité régionale
- Comprendre les considérations relatives à la tarification et aux performances
OCI Generative AI prend en charge les tâches de modèle de base telles que :
- Discussion pour la génération conversationnelle
- Incorrespondances pour la recherche sémantique, la recommandation, la classification et le clustering
- Rang pour trier les documents en fonction de la pertinence d'une requête
Options d'utilisation du modèle
OCI Generative AI prend en charge plusieurs façons d'utiliser les modèles :
- Modèles hébergés préentraînés pour l'inférence gérée via OCI
- Modèles importés pour le déploiement de modèle personnalisé pris en charge
- Mode à la demande pour l'accès géré partagé
- Mode dédié pour un modèle isolé servant sur des clusters d'IA dédiés
Ces options vous permettent de passer de l'expérimentation à la production tout en sélectionnant le niveau de contrôle, l'isolation des performances et la gestion de l'infrastructure qui correspond à votre charge de travail.
Infrastructure et gestion des modèles
Les modèles d'IA d'entreprise dans OCI Generative AI sont pris en charge par des ressources de déploiement et de gestion telles que :
- Clusters d'IA dédiés pour l'hébergement de modèles isolés
- Adresses pour le service du trafic de modèle
- Adresses privées pour un accès réseau sécurisé
- Disponibilité du modèle régional pour la planification du déploiement
- Guide des performances et des coûts pour les charges de travail de production
Rubriques de cette section
Utilisez les rubriques suivantes pour en savoir plus sur les modèles d'IA d'entreprise dans OCI Generative AI :
-
Modèles de base préentraînés offerts dans Generative AI
Découvrez les modèles hébergés préentraînés disponibles dans OCI Generative AI.
-
Modèles validés pour l'importation
Passez en revue les modèles personnalisés pris en charge que vous pouvez importer dans OCI Generative AI.
-
Modes à la demande et dédiés pour les modèles OCI Generative AI
Comprendre les options de déploiement pour l'exécution de modèles dans des environnements partagés ou dédiés.
-
Gestion des clusters d'IA dédiés
Découvrez comment créer et gérer des clusters d'IA dédiés pour l'hébergement de modèles.
-
Tests d'évaluation des performances des clusters d'IA dédiés
Consultez les conseils de référence pour les performances des clusters d'IA dédiés.
- Régions d'IA générative
Découvrez où OCI Generative AI est disponible.
- Modèles d'IA générative par région
Vérifiez la disponibilité des modèles par région OCI.
-
Gestion des adresses
Découvrez comment gérer les adresses pour l'accès aux modèles.
-
Gestion d'adresses privées
Découvrez comment configurer l'accès au réseau privé pour OCI Generative AI.
-
Calcul du coût dans Generative AI
Consultez les considérations relatives à la tarification de l'utilisation d'OCI Generative AI.