Création d'un point d'extrémité privé
Créez un point d'extrémité privé pour un modèle personnalisé ou préentraîné sur une grappe d'IA dédiée à l'hébergement dans l'IA générative OCI.
Avant de créer un point d'extrémité privé, effectuez les préalables pour les points d'extrémité privés et disposez des détails suivants :
- Nom du réseau en nuage virtuel (VCN)
- Nom du sous-réseau privé dans le VCN
Par défaut, une location a une limite maximale de 5 points d'extrémité privés. Pour plus de points d'extrémité privés du service d'intelligence artificielle générative, demandez une augmentation de la limite, private-endpoint-count pour le service d'intelligence artificielle générative.
Dans la page de liste Points d'extrémité privés, sélectionnez Créer un point d'extrémité privé. Si vous avez besoin d'aide pour trouver la page de liste, voir Liste des points d'extrémité privés.
Informations générales
VCN et sous-réseau
Sélectionnez les informations suivantes :
- Compartiment du réseau en nuage virtuel
- VCN
- Compartiment du sous-réseau privé
- Sous-réseau privé
DNS et groupes de sécurité de réseau
Utiliser ce point d'extrémité pour les modèles sur demande
Par défaut, ce point d'extrémité privé est disponible pour les modèles hébergés sur des grappes d'IA dédiées. Si vous voulez que ce point d'extrémité soit également disponible pour les modèles sur demande offerts dans le service d'intelligence artificielle générative, effectuez cette étape : - Sélectionnez Autoriser l'utilisation en mode sur demande.
- Voir le conseil à la fin de cette section sur la façon d'atteindre le modèle à la demande.
Important
Pour accéder à un modèle d'IA générative au moyen de ce point d'extrémité privé, voir Ajout d'un modèle à un point d'extrémité privé.Créer le point d'extrémité
- (Facultatif) Sélectionnez Ajouter un marqueur et affectez des marqueurs à ce point d'extrémité privé. Voir Marqueurs de ressource.
- Sélectionnez Créer.
Conseil
Pour utiliser ce point d'extrémité privé pour atteindre un modèle sur demande, créez une instance de calcul dans le sous-réseau privé affecté pour le point d'extrémité privé, ajoutez votre code à l'instance de calcul, utilisez le nom de domaine complet pour le point d'extrémité privé et accédez au modèle à partir de cette instance de calcul.Utilisez la commande generative-ai-private-endpoint create et les paramètres requis pour créer un point d'extrémité privé :
oci generative-ai generative-ai-private-endpoint create [OPTIONS] [OPTIONS]Pour la liste complète des paramètres et des valeurs pour les commandes de l'interface de ligne de commande, voir Informations de référence sur les commandes de l'interface de ligne de commande.
Note
Pour les modèles préentraînés, au lieu d'un OCID, vous pouvez utiliser le nom du modèle exactement comme indiqué dans le terrain de jeu de la console. Vous pouvez également trouver ce nom de modèle OCI dans la page de détails du modèle sous Modèles fondamentaux préentraînés offerts dans l'intelligence artificielle générative.Exécutez l'opération CreateGenerativeAiPrivateEndpoint pour créer un point d'extrémité privé.