デプロイメントの作成
OCI生成AIサービスでデプロイメントを作成し、アプリケーションのクライアント・リクエストを処理できるエージェント・コンテナをデプロイします。
デプロイメントを作成するときに、コンテナ・イメージおよびイメージ・タグを選択します。作成中にデプロイメントをアクティブ化して、アプリケーションの実行バージョンにすることもできます。
このタスクでは、Oracle Cloudコンソールを使用してデプロイメントを作成する方法について説明します。
リソース使用量およびスケーリング
デプロイメントの使用は、アクティブなデプロイメントを実行するリソースによって異なります。実行中の各レプリカではコンピュート・リソースが使用され、アプリケーションで有効になっている管理対象OCIサービスによって他の用途が作成される場合があります。
アプリケーション設定は、デプロイメントのスケーリング方法を制御します。これらの設定には、レプリカの最小数、レプリカの最大数、および自動スケーリングのメトリックが含まれます。スケーリングを参照してください。
デプロイメントは1つ以上のレプリカとして実行されます。実行中の各レプリカでは、アプリケーションにサービス定義のコンピュート割当てが使用されます。自動スケーリングでレプリカが追加されると、実行中のレプリカの数に基づいてコンピュートの使用量が増加します。
たとえば、アクティブなデプロイメントが1つのレプリカから3つのレプリカにスケーリングされる場合、それらのレプリカが実行されている間は3つのComputeレプリカが使用されます。
コンピュートの使用量を見積もるには、次の式を使用します。
average running replicas x runtime hours x Compute allocation per replica
実行中のレプリカの平均数は、アプリケーションの最小レプリカ、最大レプリカ、トラフィック・ボリュームおよび自動スケーリング設定によって異なります。
スケールアウトを制限するには、より小さい最大レプリカ数を設定します。自動スケーリングを無効にするには、最小レプリカと最大レプリカを同じ値に設定します。
マネージド・ストレージ、キャッシュ、データベース、ロギング、ネットワーキング、およびその他の有効なOCIサービスは、別々の使用法を生成する可能性があります。デプロイメント・コンピュートとは別に、これらのリソースの使用量を見積もります。
月次見積はコミットメントではありません。実際の使用量は、実行されているレプリカの数と実行時間によって異なります。
ステップ
デプロイメントを作成した後は、その詳細を表示し、アクティブ化、OCIDのコピー、削除などのその他のタスクを実行できます。コンソールのを使用して、これらのタスクにアクセスします。詳細は、デプロイメントのリストを参照してください。