Création d'une adresse privée

Créez une adresse privée pour un modèle personnalisé ou préentraîné sur un cluster d'IA dédié hébergé dans OCI Generative AI.

Remarque

Avant de créer une adresse privée, effectuez les prérequis pour les adresses privées et disposez des détails suivants :

  • Nom du réseau cloud virtuel (VCN)
  • Nom du sous-réseau privé dans le VCN
  • (Facultatif, pour Zero Trust Packet Routing (ZPR)) : espace de noms/clé/valeur d'attribut de sécurité que vous prévoyez d'affecter à l'adresse, et stratégie ZPR qui autorise le trafic vers l'adresse.

Attention

Si vous affectez un attribut de sécurité ZPR à l'adresse privée, l'accès à l'adresse nécessite une règle d'autorisation de stratégie ZPR explicite. Sinon, le trafic peut être bloqué même si vos règles de routage, groupes de sécurité réseau et listes de sécurité le permettent.

Par défaut, une location a une limite maximale de 5 adresses privées. Pour plus d'adresses privées d'IA générative, demandez une augmentation de la limite, private-endpoint-count pour le service d'IA générative.

  • Sur la page de liste Adresses privées, sélectionnez Créer une adresse privée. Si vous avez besoin d'aide pour trouver la page de liste, reportez-vous à Liste des adresses privées.

    Informations générales

    1. Sélectionnez un compartiment dans laquelle créer l'adresse privée. Le compartiment par défaut est celui de la page de liste, mais vous pouvez sélectionner n'importe quel compartiment dans laquelle vous êtes autorisé à travailler.
      Nous vous recommandons de créer l'adresse privée dans le même compartiment que le modèle qui l'utilisera.
    2. (Facultatif) Entrez le nom de l'adresse. Commencez le nom par une lettre ou un tiret de soulignement, suivi de lettres, de chiffres, de traits d'union ou de trait de soulignement. La longueur peut être comprise entre 1 et 255 caractères. Si vous ne saisissez pas de nom, le système génère un nom que vous pourrez modifier ultérieurement.
      Le nom généré a le format generativeaiprivateendpoint<timestamp>. Exemple : generativeaiprivateendpoint20250929212918
    3. (Facultatif) Entrez la description de l'adresse privée.

    VCN et sous-réseau

    Sélectionnez les informations suivantes :

    • Compartiment du réseau cloud virtuel
    • VCN
    • Compartiment de sous-réseau privé
    • Sous-réseau privé

    Groupes de sécurité DNS et réseau

    1. Entrez un préfixe d'espace de noms de domaine (DNS) pour le nom de domaine qualifié complet.
      Un aperçu affiche le nom de domaine qualifié complet avec ce préfixe DNS. Un nom de domaine qualifié complet est un nom unique complet pour une ressource réseau, qui est résolu en une adresse IP spécifique. Par exemple :
      <DNS-prefix>.pe.inference.generativeai.us-chicago-1.oci.oraclecloud.com
    2. (Facultatif) Indiquez si vous voulez ajouter des groupes de sécurité réseau en sélectionnant Ajouter un groupe de sécurité réseau pour chaque groupe à ajouter.
      Découvrez les règles de sécurité.
    3. (Facultatif) Sélectionnez un groupe d'accès réseau dans la liste.
    4. (Facultatif) Ajoutez d'autres groupes de sécurité réseau.
    5. Dans le flux de création, développez Afficher les attributs de sécurité, puis développez l'option Balises qui indique les attributs de sécurité.
    6. Sélectionnez Ajouter un attribut de sécurité.
    7. Entrez les informations suivantes :
      • Espace de noms d'attribut de sécurité
      • Clé d'attribut de sécurité
      • Valeur d'attribut de sécurité
    8. Sélectionnez Ajouter un attribut de sécurité pour ajouter d'autres attributs (jusqu'à 3 au total).

      Si vous disposez des droits d'accès nécessaires pour créer une ressource, vous pouvez également disposer des droits d'accès nécessaires pour ajouter des attributs de sécurité à cette ressource. Pour ajouter un attribut de sécurité, vous devez disposer des droits d'accès nécessaires pour utiliser l'espace de noms de l'attribut de sécurité. Pour plus d'informations sur les attributs de sécurité et les espaces de noms d'attribut de sécurité, reportez-vous à Zero Trust Packet Routing. Si vous n'êtes pas sûr d'ajouter des attributs de sécurité, ignorez cette option ou demandez à un administrateur. Vous pouvez ajouter des attributs de sécurité ultérieurement.

      Remarque

      Pour éviter de bloquer involontairement l'accès, assurez-vous que les stratégies ZPR sont définies pour autoriser le flux de trafic prévu vers l'adresse avant d'utiliser l'adresse en production. Reportez-vous à Prérequis.

    9. (Facultatif) Sélectionnez Ajouter une balise et affectez des balises à cette adresse privée. Reportez-vous à Balises de ressource.
    10. Sélectionnez Create (Créer).

    Utiliser cette adresse pour les modèles à la demande

    Par défaut, cette adresse privée est disponible pour les modèles hébergés sur des clusters d'IA dédiés. Si vous voulez que cette adresse soit également disponible pour les modèles à la demande proposés dans le service d'IA générative, procédez comme suit :
    1. Sélectionnez Autoriser l'utilisation en mode à la demande.
    2. Voir le conseil à la fin de cette section sur la façon d'atteindre le modèle à la demande.
    Important

    Pour accéder à un modèle d'IA générative via cette adresse privée, reportez-vous à Ajout d'un modèle à une adresse privée.

    Création de l'adresse

    1. (Facultatif) Sélectionnez Ajouter une balise et affectez des balises à cette adresse privée. Reportez-vous à Balises de ressource.
    2. Sélectionnez Create (Créer).
    Conseil

    Pour utiliser cette adresse privée afin d'atteindre un modèle à la demande, créez une instance Compute dans le sous-réseau privé alloué à l'adresse privée, ajoutez le code à l'instance Compute, utilisez le nom de domaine qualifié complet de l'adresse privée et accédez au modèle à partir de cette instance Compute.
  • Utilisez la commande generative-ai-private-endpoint create et les paramètres requis pour créer une adresse privée :

    oci generative-ai generative-ai-private-endpoint create [OPTIONS] 
    [OPTIONS]

    Pour obtenir la liste complète des paramètres et des valeurs des commandes de la CLI, reportez-vous à Référence des commandes de la CLI.

    Remarque

    Pour les modèles préentraînés, au lieu d'un OCID, vous pouvez utiliser le nom du modèle exactement comme indiqué dans le playground de test de la console. Vous pouvez également trouver ce nom de modèle OCI sur la page de détails du modèle dans Modèles de base préentraînés proposés dans l'IA générative.
  • Exécutez l'opération CreateGenerativeAiPrivateEndpoint pour créer une adresse privée.