Gestion des points d'extrémité privés

Les points d'extrémité privés fournissent un accès privé sécurisé aux modèles d'IA générative OCI dans un réseau en nuage virtuel (VCN). Vous pouvez créer des points d'extrémité privés pour les modèles sur demande et pour les modèles préentraînés et personnalisés hébergés sur des grappes d'IA dédiées.

À propos de

Un point d'extrémité privé est une adresse IP privée dans un VCN qui fournit un accès privé à un service OCI. Pour l'IA générative, les points d'extrémité privés vous permettent d'accéder à de grands modèles de langage à partir d'un VCN. Le service crée le point d'extrémité privé dans un sous-réseau privé que vous sélectionnez et conserve sa disponibilité. Vous contrôlez l'accès à l'aide du routage, des listes de sécurité et des groupes de sécurité de réseau.

En savoir plus sur les points d'extrémité privés et les règles de sécurité.

Lorsque vous créez un point d'extrémité privé dans le service d'intelligence artificielle générative pour OCI, vous recevez un nom de domaine complet pour celui-ci, que vous sélectionniez ou non Autoriser l'utilisation en mode sur demande. Utilisez le point d'extrémité privé pour :

  • Attachez-le à un point d'extrémité sur une grappe dédiée à l'IA pour accéder à la grappe (et à ses modèles hébergés) au moyen du point d'extrémité privé.
  • Accédez aux modèles sur demande si vous activez l'option Autoriser l'utilisation en mode sur demande.

Régions

Les points d'extrémité privés sont pris en charge pour tous les modèles répertoriés dans la page Modèles d'IA générative par région dans les régions commerciales (OC1), gouvernementales (OC4) et souveraines (OC19) où les modèles sont disponibles.

Accéder à

Pour accéder à un modèle au moyen d'un point d'extrémité privé, exécutez un client à partir d'un réseau ayant une connectivité privée au sous-réseau de point d'extrémité et appelez le modèle à l'aide du nom de domaine complet du point d'extrémité privé.

Les chemins d'accès courants sont les suivants :

  • Même VCN : provenant de n'importe quel sous-réseau du VCN (sous réserve du routage, du groupe de sécurité de réseau et des listes de sécurité).
  • Réseaux en nuage virtuels appairés : Par l'intermédiaire d'une passerelle d'appairage local (LPG) ou d'une connectivité de passerelle de routage dynamique (basée sur une passerelle DRG) (en étoile).
  • Réseaux sur place/autres réseaux privés : par l'intermédiaire de la sécurité du protocole Internet (IPSec) RPV ou FastConnect vers une passerelle DRG.
  • Administration : Utilisez l'hôte bastion OCI pour atteindre un hôte privé dans le VCN, puis appelez le point d'extrémité à partir de là.
Note

Assurez-vous que le nom de domaine complet du point d'extrémité privé se résout en adresse IP privée.

Limites

Par défaut, une location peut avoir jusqu'à 5 points d'extrémité privés. Pour plus de détails, demandez une augmentation de limite de service pour private-endpoint-count dans le service d'intelligence artificielle générative.