Création d'un point d'extrémité privé

Créez un point d'extrémité privé pour un modèle personnalisé ou préentraîné sur une grappe d'IA dédiée à l'hébergement dans l'IA générative OCI.

Note

Avant de créer un point d'extrémité privé, effectuez les préalables pour les points d'extrémité privés et disposez des détails suivants :

  • Nom du réseau en nuage virtuel (VCN)
  • Nom du sous-réseau privé dans le VCN

Par défaut, une location a une limite maximale de 5 points d'extrémité privés. Pour plus de points d'extrémité privés du service d'intelligence artificielle générative, demandez une augmentation de la limite, private-endpoint-count pour le service d'intelligence artificielle générative.

  • Dans la page de liste Points d'extrémité privés, sélectionnez Créer un point d'extrémité privé. Si vous avez besoin d'aide pour trouver la page de liste, voir Liste des points d'extrémité privés.

    Informations générales

    1. Sélectionnez un compartiment dans lequel créer le point d'extrémité privé. Le compartiment par défaut est le même que la page de liste, mais vous pouvez sélectionner tout compartiment que vous êtes autorisé à utiliser.
      Nous vous recommandons de créer le point d'extrémité privé dans le même compartiment que le modèle qui utilisera ce point d'extrémité.
    2. (Facultatif) Entrez un nom pour le point d'extrémité. Commencez le nom par une lettre ou un trait de soulignement, suivi de lettres, de chiffres, de tirets ou de traits de soulignement. Il peut comporter entre 1 et 255 caractères. Si vous n'entrez pas de nom, le système génère un nom que vous pourrez modifier plus tard.
      Le nom généré a le format generativeaiprivateendpoint<timestamp>. Exemple : generativeaiprivateendpoint20250929212918
    3. (Facultatif) Entrez une description pour le point d'extrémité privé.

    VCN et sous-réseau

    Sélectionnez les informations suivantes :

    • Compartiment du réseau en nuage virtuel
    • VCN
    • Compartiment du sous-réseau privé
    • Sous-réseau privé

    DNS et groupes de sécurité de réseau

    1. Entrez un préfixe d'espace de noms de domaine (DNS) pour le nom de domaine complet.
      Une prévisualisation affiche le nom de domaine complet avec ce préfixe DNS. Un nom de domaine complet est un nom unique complet pour une ressource de réseau, qui est résolu en une adresse IP spécifique. Par exemple :
      <DNS-prefix>.pe.inference.generativeai.us-chicago-1.oci.oraclecloud.com
    2. (Facultatif) Sélectionnez s'il faut ajouter un ou plusieurs groupes de sécurité de réseau en sélectionnant Ajouter un groupe de sécurité de réseau pour chaque groupe à ajouter.
      En savoir plus sur les règles de sécurité.
    3. (Facultatif) Sélectionnez un groupe de sécurité de réseau dans la liste.
    4. (Facultatif) Ajoutez d'autres groupes de sécurité de réseau.
    5. (Facultatif) Sélectionnez Ajouter un marqueur et affectez des marqueurs à ce point d'extrémité privé. Voir Marqueurs de ressource.
    6. Sélectionnez Créer.

    Utiliser ce point d'extrémité pour les modèles sur demande

    Par défaut, ce point d'extrémité privé est disponible pour les modèles hébergés sur des grappes d'IA dédiées. Si vous voulez que ce point d'extrémité soit également disponible pour les modèles sur demande offerts dans le service d'intelligence artificielle générative, effectuez cette étape :
    1. Sélectionnez Autoriser l'utilisation en mode sur demande.
    2. Voir le conseil à la fin de cette section sur la façon d'atteindre le modèle à la demande.
    Important

    Pour accéder à un modèle d'IA générative au moyen de ce point d'extrémité privé, voir Ajout d'un modèle à un point d'extrémité privé.

    Créer le point d'extrémité

    1. (Facultatif) Sélectionnez Ajouter un marqueur et affectez des marqueurs à ce point d'extrémité privé. Voir Marqueurs de ressource.
    2. Sélectionnez Créer.
    Conseil

    Pour utiliser ce point d'extrémité privé pour atteindre un modèle sur demande, créez une instance de calcul dans le sous-réseau privé affecté pour le point d'extrémité privé, ajoutez votre code à l'instance de calcul, utilisez le nom de domaine complet pour le point d'extrémité privé et accédez au modèle à partir de cette instance de calcul.
  • Utilisez la commande generative-ai-private-endpoint create et les paramètres requis pour créer un point d'extrémité privé :

    oci generative-ai generative-ai-private-endpoint create [OPTIONS] 
    [OPTIONS]

    Pour la liste complète des paramètres et des valeurs pour les commandes de l'interface de ligne de commande, voir Informations de référence sur les commandes de l'interface de ligne de commande.

    Note

    Pour les modèles préentraînés, au lieu d'un OCID, vous pouvez utiliser le nom du modèle exactement comme indiqué dans le terrain de jeu de la console. Vous pouvez également trouver ce nom de modèle OCI dans la page de détails du modèle sous Modèles fondamentaux préentraînés offerts dans l'intelligence artificielle générative.
  • Exécutez l'opération CreateGenerativeAiPrivateEndpoint pour créer un point d'extrémité privé.