生成AIでのエンドポイントの作成

OCI生成AIのホスティング専用AIクラスタに、カスタム・モデルまたは事前トレーニング済モデルのエンドポイントを作成します。

クラスタでホストされているモデルのエンドポイントの作成に関するルールは、「ホスティング・クラスタへのエンドポイントの追加」を参照してください。

コンソールのナビゲーション・バーで、生成AIを含むリージョン(米国中西部(シカゴ)や英国南部(ロンドン)など)を選択します。リージョンで提供されるモデルを参照してください。
ナビゲーション・メニューを開き、「アナリティクスとAI」を選択します。「AIサービス」で、「生成AI」を選択します。
エンドポイントを追加するカスタム・モデルを含むコンパートメントを選択します。
次のいずれかのアクションを行います:
- モデル名およびバージョンが事前移入されたカスタム・モデルのエンドポイントを作成するには:
  1. 「カスタム・モデル」を選択します。
  2. エンドポイントを追加するカスタム・モデルの名前を選択します。
  3. カスタム・モデルの基礎ベース・モデルを検索します。ベース・モデルは、次のステップでモデルをクラスタと照合するときに選択します。
  4. 「リソース」で、「エンドポイント」を選択します。
  5. 「エンドポイントの作成」を選択します。
- すぐに使用できる事前トレーニング済基礎モデルまたはカスタム・モデルのエンドポイントを作成するには:
  1. 「エンドポイント」を選択します。
  2. 「エンドポイントの作成」を選択します
(オプション)エンドポイントの名前を入力します。名前は、文字またはアンダースコアで開始し、その後に文字、数字、ハイフンまたはアンダースコアを続けます。長さは1から255文字です。名前を入力しない場合、後で変更できる名前が生成されます。

生成された名前の形式はgenerativeaiendpoint<timestamp>です。

generativeaiendpoint20240531235319
選択されていない場合は、エンドポイントを追加するモデル名およびバージョンを選択します。
ヒント
- モデルが現在のコンパートメントとは異なるコンパートメントにある場合は、「コンパートメントの変更」を選択し、モデルをホストするコンパートメントを選択します。エンドポイントは、モデルと同じコンパートメントに作成することをお薦めします。
- 探しているカスタム・モデルがリストに表示されていない場合は、「取消」を選択します。次に、「生成AI」で、「カスタム・モデル」を選択し、カスタム・モデルが「アクティブ」状態であることを確認します。
次のいずれかのアクションを実行して、ホスティング専用AIクラスタを選択します:
- すでにクラスタがある場合は、ドロップダウン・リストから「専用AIクラスタ」を選択します。クラスタを作成したら、そのクラスタがアクティブになるまで待ちます。このクラスタに関連付けられているベース・モデルが、カスタム・モデルのベース・モデルと一致していることを確認します。
- クラスタを作成するには、「専用AIクラスタ」ドロップダウン・リストで「新しい専用AIクラスタの作成」を選択し、次のステップを実行します:
  1. (オプション)名前と説明を入力します。
  2. ホストするモデルのベース・モデルと一致するベース・モデルを選択します。
  3. 1つのモデル・レプリカをエンドポイントに追加します。クラスタを作成する場合、エンドポイントに少なくとも1つのユニットが必要です。既存のクラスタでは、その同じユニットを使用して新しいエンドポイントをホストできます。各インスタンスは、すべてのアクティブなエンドポイントをホストします。クラスタのインスタンス数を増やすと、クラスタでホストされているすべてのアクティブ・エンドポイントでサポートされているRPMの数が増加します。
  4. ホスティング専用AIクラスタのコミットメント・ユニット時間を読み、コミットメントに同意するチェック・ボックスを選択します。
  5. 「作成」を選択し、クラスタがアクティブになるまで待機します。
  6. 「専用AIクラスタ」ドロップダウン・リストから、作成した専用AIクラスタを選択します。
次のガードレールを有効にするかどうかを選択します。
- コンテンツ・モデレーション
  - オフ: コンテンツ・モデレーションを適用せず、明示的なコンテンツを出力します。
  - ブロック: コンテンツ・モデレーションの識別および適用に役立ちます。
  - 通知: コンテンツ・モデレーションは適用しませんが、モデレーションが必要なコンテンツがモデルによって検出された場合にユーザーに通知することを目的としています。
- プロンプト・インジェクション(PI)保護
  - オフ: PI保護を適用せず、無制限入力を許可します。
  - ブロック: プロンプト・インジェクションを識別して保護するのに役立ちます。
  - 通知: PI保護を適用しないでください。ただし、PI保護が必要なコンテンツがモデルで検出された場合にユーザーに通知することを目的としています。
- 個人識別可能情報(PII)保護
  - オフ: PII保護を適用しないでください。かわりに、データ・エクスポージャ制限なしでコンテンツを出力します。
  - ブロック: 個人データの応答からの削除など、PIIの識別と保護に役立ちます。
  - 通知: PII保護を適用しないでください。ただし、モデルでPII保護が必要なコンテンツが検出された場合にユーザーに通知します。
(オプション)「拡張オプションの表示」を選択し、エンドポイントにタグを割り当てます。
「エンドポイントの作成」を選択します。
エンドポイントの状態を追跡できるエンドポイントの詳細ページが表示されます。
エンドポイントがアクティブになったら、「プレイグラウンドで表示」を選択して、このエンドポイントからモデルの使用を開始します。

Oracle Cloud Infrastructureドキュメント

生成AIでのエンドポイントの作成