LLM管理

大規模言語モデル(LLM)は、テキスト生成、要約、質問への回答、MCPサーバー・ツールのサポートなどのタスクに使用されます。

エージェント・ファクトリは、複数のプロバイダから多様なLLMを選択できます。LLM管理画面を使用して、生成モデルと埋込みモデルの両方をアプリケーション内で設定および管理します。

生成モデル

OCI生成AI

エージェント・ファクトリは、OCI生成AIサービスを介して使用可能なすべての生成モデルを受け入れます。ただし、最良の結果を得るには、Oracleでは、次の事前トレーニング済モデルをエージェント・ファクトリと組み合せて使用することをお薦めします:

ノート: Google Vertex AIモデル(たとえば、google.gemini-2.5-pro)の使用は、ツールの使用をサポートしていないため、お薦めしません。

OCI生成AIサービスの設定

フィンガープリント・ベースの認証を使用してOCI生成AIサービスからxai.grok-4-fast-reasoning事前トレーニング済モデルを構成するステップを次に示します。

前提条件: OCI生成AIサービスを設定します。生成AIのスタート・ガイドを参照してください。

ステップ1: 左側のナビゲーション・メニューのLLM管理をクリックします。

LLM管理のクリック

ステップ2: 右上隅にある「構成の追加」ボタンをクリックします。

「構成の追加」の選択

ステップ3: フォームが開き、「モデル・タイプ」生成モデルを選択します。

生成モデルの選択

ステップ4: LLM構成に「構成名」で任意の名前を付けます。空白は許可されないため、空白を使用しないでください。

構成名

ステップ5: LLMプロバイダのリストからOCI GenAIを選択します。

LLMプロバイダ

ステップ6: **Mode_で、フィンガープリントを使用をクリックします。

フィンガープリントを使用

ステップ7: 「モデルID」xai.grok-4-fast-reasoningと入力します

「モデルID」の入力

ステップ8: 「エンドポイント」、「コンパートメントID」「ユーザー」「テナンシ」「フィンガープリント」および「リージョン」フィールドに、OCI生成AIサービスの独自の資格証明を入力します。

OCI資格証明の入力

ステップ9: 秘密APIキー・ファイルを「キー・ファイル」にアップロードします。テナンシ所有者から、またはユーザーとともにテナンシにログインすることで、リクエストできます。OCIのAPI認証の設定を参照してください。

ステップ10: 「テスト接続」をクリックして、資格証明が正しいことを確認します。

テスト接続

ステップ11: 成功メッセージ「接続に成功しました」が画面に表示され、「構成の保存」ボタンが有効になり、それをクリックしてプロセスを確定します。

構成の保存

Ollama

エージェント・ファクトリはOllamaをサポートしているため、マシンでローカルに実行されているLLMにアクセスできます。

マシンでのOllamaの設定(Linux OCI VM)

ステップ1: システムでターミナル・ウィンドウを開き、root権限を持つ新しいbashシェルを起動します。

sudo bash

ステップ2(オプション): プロキシの背後で作業している場合は、適切なプロキシを設定してください。

ステップ3: 公式サイトの指示に従って、ollamaをダウンロードしてインストールします。

ステップ4: llama3.2モデルをローカル・マシンにプルします。

ollama pull llama3.2

ステップ5: エージェント・ファクトリのコンテナがアクセスできるように、ollamaサービスを編集します。

systemctl edit ollama

ステップ6: エディタが開いたら、次の2行を貼り付け、[Ctrl]+[O]、[Enter]、[Ctrl]+[X]を使用して閉じます

[Service]

Environment="OLLAMA_HOST=0.0.0.0:11434"

ステップ7: systemdをリフレッシュし、Ollamaを再起動して変更内容を表示します。

systemctl daemon-reexec
systemctl daemon-reload
systemctl restart ollama

ステップ8 (オプション): 別の端末で、次のコマンドを実行して、ollamaサービスが実行されていることを確認します:

ollama run llama3.2

エージェント・ファクトリへのOllamaモデルの追加

前述の項で設定したOllamaからローカルにホストされたLlama 3.2モデルを構成するステップを次に示します。

ステップ1: 左側のナビゲーション・メニューのLLM管理をクリックします。

LLM管理のクリック

ステップ2: 右上隅にある「構成の追加」ボタンをクリックします。

「構成の追加」の選択

ステップ3: フォームが開き、「モデル・タイプ」生成モデルを選択します。

生成モデルの選択

ステップ4: LLM構成に「構成名」で任意の名前を付けます。空白は許可されないため、空白を使用しないでください。

構成に名前を付与

ステップ5: LLMプロバイダのリストからOllamaを選択します。

プロバイダとしてOllamaを選択

ステップ6: 「モデルID」llama3.2と入力します。

「モデルID」の入力

ステップ7: 「URL」としてhttp://host.containers.internalを入力します。

「URL」の入力

ステップ8: 11434「ポート」として入力します。

「URL」の入力

ステップ9: 「テスト接続」をクリックして、資格証明が正しいことを確認します。

テスト接続

ステップ10: 成功メッセージ「接続に成功しました」が画面に表示され、「構成の保存」ボタンが有効になり、それをクリックしてプロセスを確定します。

構成の保存

OpenAI

現在サポートされているモデルは次のとおりです:

エージェント・ファクトリへのOpenAIモデルの追加

ステップ1: 左側のナビゲーション・メニューのLLM管理をクリックします。

LLM管理のクリック

ステップ2: 右上隅にある「構成の追加」ボタンをクリックします。

「構成の追加」の選択

ステップ3: フォームが開き、「モデル・タイプ」生成モデルを選択します。

生成モデルの選択

ステップ4: LLM構成に「構成名」で任意の名前を付けます。空白は許可されないため、空白を使用しないでください。

構成名の追加

ステップ5: LLMプロバイダのリストからOpenAIを選択します。

OpenAIの選択

ステップ6: 「モデルID」gpt-4oを選択します

「モデルID」の選択

ステップ7: APIキーを入力します

APIキーの入力

ステップ8: 「テスト接続」をクリックして、資格証明が正しいことを確認します。

接続のテスト

ステップ9: 成功メッセージ「接続に成功しました」が画面に表示され、「構成の保存」ボタンが有効になり、それをクリックしてプロセスを確定します。

構成の保存

vLLM

セルフホストのモデル・エンドポイントに接続できます。

vLLMを構成するために必要なフィールドは次のとおりです:

  1. モデルID: vLLMサーバーが提供しているモデル識別子/パス(多くの場合、ファイルシステム・パスまたはレジストリ・スタイル名)。
  2. URL: ホスト/DNSクライアントはサーバーへのアクセスに使用します。
  3. ポート: HTTPサービスが公開されるポート。

埋込みモデル

エージェント・ファクトリは、次の埋込みモデルをサポートしています。これらのモデルを使用して、テキストを数値ベクトルに変換し、セマンティック検索および検索拡張生成(RAG)を有効にします。エージェント・ファクトリには、パフォーマンスの高い複数の埋込みモデルの即時利用可能なサポートが含まれています。また、OCI生成AIサービスでホストされている、またはOllamaまたはvLLMエンドポイントを介して提供される、優先モデルを導入することもできます。

ローカル・モデル

次の事前トレーニング済センテンス・トランスフォーマ・モデルは、アプリケーションにバンドルされ、ローカルで実行されます。

ローカル埋込みモデルの構成

エージェント・ファクトリで即時利用可能なローカル埋込みモデルmultilingual-e5-baseを構成するステップを次に示します。

ノート: ローカル埋込みモデルを使用する場合は、アプリケーションを実行しているマシンがGPUにアクセスできることを確認してください。そうしないと、ナレッジ・エージェントの取込みなどの埋込み関連プロセスにかなりの時間がかかる可能性があります。

ステップ1: 左側のナビゲーション・メニューのLLM管理をクリックします。

LLM管理のクリック

ステップ2: 右上隅にある「構成の追加」ボタンをクリックします。

「構成の追加」の選択

ステップ3: フォームが開き、「モデル・タイプ」「埋込みモデル」を選択します。

「埋込みモデル」の選択

ステップ4: 構成に名前を付けます。空白は許可されないため、空白を使用しないでください。

構成に名前を付与

ステップ5: 埋込みプロバイダに、「ローカル」を選択します。

「ローカル」の選択

ステップ6: 「モデルID」をクリックし、リストからmultilingual-e5-baseを選択します。

モデルIDの選択

ステップ7: 「テスト接続」をクリックして接続を確認します。

モデルIDの選択

ステップ8: 新しい構成を保存します。

モデルIDの選択

OCI生成AI

OCI生成AIからの次のCohere埋込みモデルがサポートされています:

OCI生成AI埋込みモデルの構成

フィンガープリント・ベースの認証を使用してOCI生成AIサービスを介して使用可能なローカル埋込みモデルcohere.embed-v4.0を構成するステップを次に示します。

ステップ1: 左側のナビゲーション・メニューのLLM管理をクリックします。

LLM管理のクリック

ステップ2: 右上隅にある「構成の追加」ボタンをクリックします。

「構成の追加」の選択

ステップ3: フォームが開き、「モデル・タイプ」で「埋込みモデル」を選択します。

「埋込みモデル」の選択

ステップ4: 構成に名前を付けます。空白は許可されないため、空白を使用しないでください。

「埋込みモデル」の選択

ステップ5: 埋込みプロバイダとしてOCI GenAIを選択します。

「埋込みモデル」の選択

ステップ6: 「モード」でフィンガープリントを使用を選択します

「埋込みモデル」の選択

ステップ7: 「モデルID」cohere.embed-v4.0と入力します。

「モデルID」の入力

ステップ8: 「エンドポイント」「コンパートメントID」「ユーザー」「テナンシ」「フィンガープリント」および「リージョン」フィールドに、OCIからの資格証明を入力します。

「モデルID」の入力

ステップ9: 秘密APIキー・ファイルを「キー・ファイル」にアップロードします。

ステップ10: 「テスト接続」をクリックして、資格証明が正しいことを確認します。

テスト接続

ステップ11: 成功メッセージ「接続に成功しました」が画面に表示され、「構成の保存」ボタンが有効になり、それをクリックしてプロセスを確定します。

構成の保存

vLLM/Ollama

セルフホストのモデル・エンドポイントに接続できます。

vLLMを構成するために必要なフィールドは次のとおりです:

  1. モデルID: vLLMサーバーが提供しているモデル識別子/パス(多くの場合、ファイルシステム・パスまたはレジストリ・スタイル名)。
  2. URL: ホスト/DNSクライアントはサーバーへのアクセスに使用します。
  3. ポート: HTTPサービスが公開されるポート。