Création d'une adresse privée
Créez une adresse privée pour un modèle personnalisé ou préentraîné sur un cluster d'IA dédié hébergé dans OCI Generative AI.
Avant de créer une adresse privée, effectuez les prérequis pour les adresses privées et disposez des détails suivants :
- Nom du réseau cloud virtuel (VCN)
- Nom du sous-réseau privé dans le VCN
- (Facultatif, pour Zero Trust Packet Routing (ZPR)) : espace de noms/clé/valeur d'attribut de sécurité que vous prévoyez d'affecter à l'adresse, et stratégie ZPR qui autorise le trafic vers l'adresse.
Attention
Si vous affectez un attribut de sécurité ZPR à l'adresse privée, l'accès à l'adresse nécessite une règle d'autorisation de stratégie ZPR explicite. Sinon, le trafic peut être bloqué même si vos règles de routage, groupes de sécurité réseau et listes de sécurité le permettent.
Par défaut, une location a une limite maximale de 5 adresses privées. Pour plus d'adresses privées d'IA générative, demandez une augmentation de la limite, private-endpoint-count pour le service d'IA générative.
Sur la page de liste Adresses privées, sélectionnez Créer une adresse privée. Si vous avez besoin d'aide pour trouver la page de liste, reportez-vous à Liste des adresses privées.
Informations générales
VCN et sous-réseau
Sélectionnez les informations suivantes :
- Compartiment du réseau cloud virtuel
- VCN
- Compartiment de sous-réseau privé
- Sous-réseau privé
Groupes de sécurité DNS et réseau
Utiliser cette adresse pour les modèles à la demande
Par défaut, cette adresse privée est disponible pour les modèles hébergés sur des clusters d'IA dédiés. Si vous voulez que cette adresse soit également disponible pour les modèles à la demande proposés dans le service d'IA générative, procédez comme suit : - Sélectionnez Autoriser l'utilisation en mode à la demande.
- Voir le conseil à la fin de cette section sur la façon d'atteindre le modèle à la demande.
Important
Pour accéder à un modèle d'IA générative via cette adresse privée, reportez-vous à Ajout d'un modèle à une adresse privée.Création de l'adresse
- (Facultatif) Sélectionnez Ajouter une balise et affectez des balises à cette adresse privée. Reportez-vous à Balises de ressource.
- Sélectionnez Create (Créer).
Conseil
Pour utiliser cette adresse privée afin d'atteindre un modèle à la demande, créez une instance Compute dans le sous-réseau privé alloué à l'adresse privée, ajoutez le code à l'instance Compute, utilisez le nom de domaine qualifié complet de l'adresse privée et accédez au modèle à partir de cette instance Compute.Utilisez la commande generative-ai-private-endpoint create et les paramètres requis pour créer une adresse privée :
oci generative-ai generative-ai-private-endpoint create [OPTIONS] [OPTIONS]Pour obtenir la liste complète des paramètres et des valeurs des commandes de la CLI, reportez-vous à Référence des commandes de la CLI.
Remarque
Pour les modèles préentraînés, au lieu d'un OCID, vous pouvez utiliser le nom du modèle exactement comme indiqué dans le playground de test de la console. Vous pouvez également trouver ce nom de modèle OCI sur la page de détails du modèle dans Modèles de base préentraînés proposés dans l'IA générative.Exécutez l'opération CreateGenerativeAiPrivateEndpoint pour créer une adresse privée.