プライベート・エンドポイントへのモデルの追加

カスタム・モデルまたは事前トレーニング済モデルを含むエンドポイントをOCI生成AIのプライベート・エンドポイントにアタッチする方法について学習します。

1つ以上のエンドポイントをプライベート・エンドポイントにアタッチできます。

  • エンドポイントの作成

    1. 「プライベート・エンドポイント」リスト・ページで、操作するプライベート・エンドポイントを選択します。プライベート・エンドポイントのリスト・ページの検索に関するヘルプが必要な場合は、プライベート・エンドポイントのリストを参照してください。
    2. 「エンドポイント」を選択し、「エンドポイントの作成」を選択します。

    エンドポイント情報

    1. エンドポイントを作成するコンパートメントを選択します。デフォルト・コンパートメントはリスト・ページと同じですが、作業する権限がある任意のコンパートメントを選択できます。
      ヒント

      エンドポイントは、モデルと同じコンパートメントに作成することをお薦めします。
    2. (オプション)エンドポイントの名前を入力します。名前は文字またはアンダースコアで開始し、その後に文字、数字、ハイフンまたはアンダースコアが続きます。長さは1 - 255文字です。名前を入力しないと、後で変更できる名前が生成されます。
      生成された名前の形式はgenerativeaiendpoint<timestamp>です。例: generativeaiendpoint20250531235319
    3. (オプション)モデルの説明を入力します。

    ホスティング構成

    1. エンドポイントを追加するモデルをホストするコンパートメントを選択します。
    2. エンドポイントを追加するモデルを選択します。このモデルは、カスタム・モデル、または作業中のリージョンで使用可能なすぐに使用できる事前トレーニング済基礎モデルです。
    3. 選択したモデルに複数のバージョンがある場合は、モデル・バージョンを選択します。
      すぐに使用できる事前トレーニング済基礎モデルの場合、モデルを選択すると、このフィールドに値が移入されます。
    4. 次のいずれかのアクションを実行して、ホスティング専用AIクラスタを選択します:
      • リストから専用AIクラスタを選択します。数分前にクラスタを作成した場合は、そのクラスタがアクティブになるまで待ちます。このクラスタに関連付けられているベース・モデルが、エンドポイントを追加するモデルのベース・モデルと一致していることを確認します。
      • 「新しい専用AIクラスタの作成」を選択し、次のステップを実行します:
        1. (オプション)名前と説明を入力します。
        2. ホストするモデルのベース・モデルに一致するベース・モデルを選択します。
        3. エンドポイントに1つのモデル・レプリカを追加します。クラスタを作成する場合、エンドポイントに少なくとも1つのユニットが必要です。既存のクラスタの場合は、その同じユニットを使用して新しいエンドポイントをホストできます。各インスタンスは、すべてのアクティブ・エンドポイントをホストします。クラスタのインスタンス数を増やすと、クラスタでホストされているすべてのアクティブ・エンドポイントでサポートされているRPMの数が増えます。
        4. ホスティング専用AIクラスタのコミットメント・ユニット時間を読み、チェック・ボックスを選択してコミットメントに同意します。
        5. (オプション)「タグの追加」を選択し、この専用AIクラスタにタグを割り当てます。リソース・タグを参照してください。
        6. 「作成」を選択し、クラスタがアクティブになるまで待機します。
        7. 「専用AIクラスタ」リストから、作成した専用AIクラスタを選択してください。

    ネットワーキング・リソース

    プライベート・エンドポイントが事前選択されています。

    ガードレール

    1. 次のガードレールを有効にするかどうかを選択します。
      • コンテンツ・モデレーション
        • オフ: コンテンツのモデレーションを適用せず、明示的なコンテンツを出力します。
        • ブロック: コンテンツのモデレーションを識別して適用するのに役立ちます。
        • 通知: コンテンツ・モデレーションを適用しませんが、モデレーションが必要なコンテンツをモデルが検出した場合にユーザーに通知することを目的としています。
    2. (オプション)「タグの追加」を選択し、このエンドポイントにタグを割り当てます。リソース・タグを参照してください。
    3. 「作成」を選択します。
      エンドポイントの状態を追跡できるエンドポイントの詳細ページが表示されます。
  • エンドポイントを作成するには、endpoint createコマンドおよび必須パラメータを使用します:

    oci generative-ai endpoint create 
    --model-id <model-OCID>
    --compartment-id <compartment-OCID> 
    --dedicated-ai-cluster-id <hosting-dedicated-AI-cluster-OCID> 
    [OPTIONS]

    CLIコマンドのパラメータおよび値の完全なリストは、CLIコマンド・リファレンスを参照してください。

    ノート

    事前トレーニング済モデルの場合、OCIDのかわりに、コンソールのプレイグラウンドにリストされているとおりにモデル名を使用できます。このOCIモデル名は、モデルの詳細ページの生成AIで提供される事前トレーニング済基礎モデルでも確認できます。
  • CreateEndpoint操作を実行してエンドポイントを作成します。

    ノート

    事前トレーニング済モデルの場合、OCIDのかわりに、コンソールのプレイグラウンドにリストされているとおりにモデル名を使用できます。このOCIモデル名は、モデルの詳細ページの生成AIで提供される事前トレーニング済基礎モデルでも確認できます。