モデルのホスティングのための専用AIクラスタを作成する

OCI生成AIに専用のAIクラスタ・リソースを作成し、事前トレーニング済ベース・モデルおよびカスタム・モデルのエンドポイントをホストします。

重要

  • オンデマンドで使用不可:テキスト生成および集計API (プレイグラウンドを含む)を使用するオンデマンド・サービング・モードでサポートされているすべてのOCI生成AI基礎事前トレーニング済モデルが廃止されました。かわりにチャット・モデルを使用することをお薦めします。
  • クラスタでホスト可能:専用AIクラスタ(専用サービング・モード)でサマリーまたは生成モデル(cohere.commandなど)をホストする場合、そのモデルが廃止されるまで引き続き使用できます。これらのモデルは、専用AIクラスタでホストされている場合、米国中西部(シカゴ)でのみ使用できます。除・売却日および定義は、モデルの除・売却を参照してください。
    1. 「専用AIクラスタ」リスト・ページで、「専用AIクラスタの作成」を選択します。リスト・ページの検索に関するヘルプが必要な場合は、専用AIクラスタのリストを参照してください。
    2. 専用AIクラスタを作成するコンパートメントを選択します。デフォルト・コンパートメントはリスト・ページと同じです。ただし、作業する権限がある任意のコンパートメントを選択できます。
    3. (オプション)クラスタの名前と説明を入力します。名前を入力しないと、後で変更できる名前が生成されます。

      生成された名前の形式はgenerativeaidedicatedaicluster<timestamp>です。例: generativeaidedicatedaicluster20250922181431

    4. 「クラスタ・タイプ」で、「ホスティング」を選択します。
    5. 「ベース・モデル」で、このクラスタでホストするモデルの基本ベース・モデルを選択します。モデル・リストには、オンデマンド・モードではまだ廃止されていないベース・モデルのみが含まれます。
      専用のクラスタ・ユニット・サイズおよびクラスタでホストされているモデルのエンドポイントに関するルールについては、「生成AIの事前トレーニング済基本モデル」ページにリストされているベース・モデルを選択します。
    6. (オプション)「モデル・レプリカ」フィールドでインスタンスの数を増やします。
      重要

      推論のモデルをホストするクラスタを作成すると、デフォルトで、選択したベース・モデルに対して1つのユニットが作成されます。スループットを向上させるには、「モデル・レプリカ」フィールドのインスタンス数を今すぐ増やすか、後でクラスタを編集するときに増やすことができます。たとえば、このクラスタで2つのモデル・レプリカを作成するには、2つのユニットが必要です。
    7. ホスティング・クラスタのコミットメント・ユニット時間を読み取り、コミットメントに同意するチェックボックスを選択します。
    8. (オプション)「タグの追加」を選択し、このクラスタにタグを割り当てます。
    9. 「作成」を選択します。
    ノート

    クラスタの作成には数分かかります。クラスタがアクティブ状態になったら、そのモデルのエンドポイントを作成するときに、そのクラスタを選択してモデルをホストできます。
  • 専用AIクラスタを作成するには、dedicated-AI-cluster createコマンドと必要なパラメータを使用します:

    oci generative-ai dedicated-ai-cluster create 
    --compartment-id <compartment-OCID>
    --type HOSTING
    --unit-count [integer]
    --unit-shape [text]
    [OPTIONS]

    CLIコマンドのパラメータおよび値の完全なリストは、CLIコマンド・リファレンスを参照してください。

  • CreateDedicatedAiCluster操作を実行して、専用クラスタを作成します。