OCI Generative AIでのエージェントのデプロイの概要

コンテナ化されたエージェント・ワークロードの管理対象ランタイムを提供するOCI生成AIアプリケーションを使用して、エージェントをデプロイできます。

エージェントをデプロイするには、エージェントをコンテナ・イメージとしてパッケージ化し、それをOracle Cloud Infrastructure Registry (OCIR)にアップロードして、OCIコンソール、APIまたはCLIを使用してデプロイします。

デプロイメント時に、次を構成します。

  • スケーリング
  • ストレージ
  • ネットワーク
  • 認証

デプロイメント後、サービスは、クライアントまたは他のエージェントがエージェントの起動に使用できるエンドポイント(HTTP URLなど)をプロビジョニングします。

機能

エージェントをローカルに開発した後(たとえば、LangGraphまたは類似のフレームワークを使用して)、ランタイム構成を定義する生成AIアプリケーションを作成します。

次に、コンテナ・イメージを選択してデプロイメントを作成します。アクティブなデプロイメントは、アプリケーション・エンドポイントを介してリクエストを処理します。デプロイメントがプロビジョニングされると、エンドポイントはエージェントの起動に使用できるようになります。

ウォークスルー

生成AIアプリケーションを使用して、エージェントを管理対象のコンテナ化されたアプリケーションとしてOCI生成AIにデプロイします。

生成AIアプリケーションでは、コンテナ・イメージを構築し、それをOracle Cloud Infrastructure Registry (OCIR)にアップロードし、OCIコンソール、APIまたはCLIを使用してそのイメージを生成AIアプリケーションとしてデプロイします。

エージェントをデプロイするときに、次のようなアプリケーションの実行方法およびクライアントによるアクセス方法を構成できます。

  • スケーリング
  • ストレージ
  • ネットワーク
  • 認証

デプロイメントのプロビジョニング後、OCI生成AIは、クライアントがデプロイされたエージェントの起動に使用できるエンドポイント(HTTP URLなど)を提供します。

エージェントのデプロイは、OCI管理のデプロイメント構成およびエンドポイント・プロビジョニングを使用して、コンテナ化されたエージェント・アプリケーションの管理対象ランタイムが必要な場合に役立ちます。

詳細は、生成AIアプリケーションおよびコンテナ化されたエージェント・アプリケーションのデプロイに関するトピックを参照してください。