デプロイメントの作成

OCI生成AIサービスでデプロイメントを作成し、アプリケーションのクライアント・リクエストを処理できるエージェント・コンテナをデプロイします。

デプロイメントを作成するときに、コンテナ・イメージおよびイメージ・タグを選択します。作成中にデプロイメントをアクティブ化して、アプリケーションの実行バージョンにすることもできます。

このタスクでは、Oracle Cloudコンソールを使用してデプロイメントを作成する方法について説明します。

リソース使用量およびスケーリング

デプロイメントの使用は、アクティブなデプロイメントを実行するリソースによって異なります。実行中の各レプリカではコンピュート・リソースが使用され、アプリケーションで有効になっている管理対象OCIサービスによって他の用途が作成される場合があります。

アプリケーション設定は、デプロイメントのスケーリング方法を制御します。これらの設定には、レプリカの最小数、レプリカの最大数、および自動スケーリングのメトリックが含まれます。スケーリングを参照してください。

デプロイメントは1つ以上のレプリカとして実行されます。実行中の各レプリカでは、アプリケーションにサービス定義のコンピュート割当てが使用されます。自動スケーリングでレプリカが追加されると、実行中のレプリカの数に基づいてコンピュートの使用量が増加します。

たとえば、アクティブなデプロイメントが1つのレプリカから3つのレプリカにスケーリングされる場合、それらのレプリカが実行されている間は3つのComputeレプリカが使用されます。

ヒント

コンピュートの使用量を見積もるには、次の式を使用します。

average running replicas x runtime hours x Compute allocation per replica

実行中のレプリカの平均数は、アプリケーションの最小レプリカ、最大レプリカ、トラフィック・ボリュームおよび自動スケーリング設定によって異なります。

スケールアウトを制限するには、より小さい最大レプリカ数を設定します。自動スケーリングを無効にするには、最小レプリカと最大レプリカを同じ値に設定します。

マネージド・ストレージ、キャッシュ、データベース、ロギング、ネットワーキング、およびその他の有効なOCIサービスは、別々の使用法を生成する可能性があります。デプロイメント・コンピュートとは別に、これらのリソースの使用量を見積もります。

月次見積はコミットメントではありません。実際の使用量は、実行されているレプリカの数と実行時間によって異なります。

ステップ

  1. 「アプリケーション」リスト・ページで、デプロイメントを作成するアプリケーションを選択します。リスト・ページの検索に関するヘルプが必要な場合は、アプリケーションのリストを参照してください。
  2. アプリケーションの詳細ページで、「デプロイメント」タブを選択します。
  3. 「デプロイメントの作成」を選択します。
  4. 次のコンテナ・イメージ情報を選択します。
    • リポジトリのコンパートメント
    • レポジトリ
    • バージョン・タグ
  5. (オプション)このデプロイメントをアプリケーションの実行中バージョンにするには、「デプロイおよびアクティブ化」を有効にします。

    一度にアクティブにできるデプロイメントは1つのみです。デプロイメントをアクティブ化すると、以前のアクティブなデプロイメントは非アクティブになります。

  6. 「デプロイメントの作成」を選択します。
    ノート

    デプロイメントを使用する前に、ステータスが「アクティブ」で、コンテナが起動し、リクエストを処理する準備が整うまで待ちます。

ヒント

デプロイメントを作成した後は、その詳細を表示し、アクティブ化、OCIDのコピー、削除などのその他のタスクを実行できます。コンソールの「アクション」メニュー(3つのドット)を使用して、これらのタスクにアクセスします。詳細は、デプロイメントのリストを参照してください。