LLM管理

大規模言語モデル(LLM)は、テキスト生成、要約、質問への回答、MCPサーバー・ツールのサポートなどのタスクに使用されます。

エージェント・ファクトリは、複数のプロバイダから多様なLLMを選択できます。LLM管理画面を使用して、生成モデルと埋込みモデルの両方をアプリケーション内で設定および管理します。

生成モデル

OCI生成AI

エージェント・ファクトリは、OCI生成AIサービスを介して使用可能なすべての生成モデルを受け入れます。ただし、最良の結果を得るには、Oracleでは、次の事前トレーニング済モデルをエージェント・ファクトリと組み合せて使用することをお薦めします:

xai.grok-4
xai.grok-4-fast-reasoning
xai.grok-4-fast-non-reasoning
llama3.3

ノート: Google Vertex AIモデル(たとえば、google.gemini-2.5-pro)の使用は、ツールの使用をサポートしていないため、お薦めしません。

OCI生成AIサービスの設定

フィンガープリント・ベースの認証を使用してOCI生成AIサービスからxai.grok-4-fast-reasoning事前トレーニング済モデルを構成するステップを次に示します。

前提条件: OCI生成AIサービスを設定します。生成AIのスタート・ガイドを参照してください。

ステップ1: 左側のナビゲーション・メニューのLLM管理をクリックします。

LLM管理のクリック

ステップ2: 右上隅にある「構成の追加」ボタンをクリックします。

「構成の追加」の選択

ステップ3: フォームが開き、「モデル・タイプ」で生成モデルを選択します。

生成モデルの選択

ステップ4: LLM構成に「構成名」で任意の名前を付けます。空白は許可されないため、空白を使用しないでください。

構成名

ステップ5: LLMプロバイダのリストからOCI GenAIを選択します。

LLMプロバイダ

ステップ6: **Mode_で、フィンガープリントを使用をクリックします。

フィンガープリントを使用

ステップ7: 「モデルID」にxai.grok-4-fast-reasoningと入力します

「モデルID」の入力

ステップ8: 「エンドポイント」、「コンパートメントID」、「ユーザー」、「テナンシ」、「フィンガープリント」および「リージョン」フィールドに、OCI生成AIサービスの独自の資格証明を入力します。

OCI資格証明の入力

ステップ9: 秘密APIキー・ファイルを「キー・ファイル」にアップロードします。テナンシ所有者から、またはユーザーとともにテナンシにログインすることで、リクエストできます。OCIのAPI認証の設定を参照してください。

ステップ10: 「テスト接続」をクリックして、資格証明が正しいことを確認します。

テスト接続

ステップ11: 成功メッセージ「接続に成功しました」が画面に表示され、「構成の保存」ボタンが有効になり、それをクリックしてプロセスを確定します。

構成の保存

Ollama

エージェント・ファクトリはOllamaをサポートしているため、マシンでローカルに実行されているLLMにアクセスできます。

マシンでのOllamaの設定(Linux OCI VM)

ステップ1: システムでターミナル・ウィンドウを開き、root権限を持つ新しいbashシェルを起動します。

sudo bash

ステップ2(オプション): プロキシの背後で作業している場合は、適切なプロキシを設定してください。

ステップ3: 公式サイトの指示に従って、ollamaをダウンロードしてインストールします。

ステップ4: llama3.2モデルをローカル・マシンにプルします。

ollama pull llama3.2

ステップ5: エージェント・ファクトリのコンテナがアクセスできるように、ollamaサービスを編集します。

systemctl edit ollama

ステップ6: エディタが開いたら、次の2行を貼り付け、[Ctrl]+[O]、[Enter]、[Ctrl]+[X]を使用して閉じます

[Service]

Environment="OLLAMA_HOST=0.0.0.0:11434"

ステップ7: systemdをリフレッシュし、Ollamaを再起動して変更内容を表示します。

systemctl daemon-reexec

systemctl daemon-reload

systemctl restart ollama

ステップ8 (オプション): 別の端末で、次のコマンドを実行して、ollamaサービスが実行されていることを確認します:

ollama run llama3.2

エージェント・ファクトリへのOllamaモデルの追加

前述の項で設定したOllamaからローカルにホストされたLlama 3.2モデルを構成するステップを次に示します。

ステップ1: 左側のナビゲーション・メニューのLLM管理をクリックします。

LLM管理のクリック

ステップ2: 右上隅にある「構成の追加」ボタンをクリックします。

「構成の追加」の選択

ステップ3: フォームが開き、「モデル・タイプ」で生成モデルを選択します。

生成モデルの選択

ステップ4: LLM構成に「構成名」で任意の名前を付けます。空白は許可されないため、空白を使用しないでください。

構成に名前を付与

ステップ5: LLMプロバイダのリストからOllamaを選択します。

プロバイダとしてOllamaを選択

ステップ6: 「モデルID」にllama3.2と入力します。

「モデルID」の入力

ステップ7: 「URL」としてhttp://host.containers.internalを入力します。

「URL」の入力

ステップ8: 11434を「ポート」として入力します。

「URL」の入力

ステップ9: 「テスト接続」をクリックして、資格証明が正しいことを確認します。

テスト接続

ステップ10: 成功メッセージ「接続に成功しました」が画面に表示され、「構成の保存」ボタンが有効になり、それをクリックしてプロセスを確定します。

構成の保存

OpenAI

現在サポートされているモデルは次のとおりです:

gpt-4o
gpt-4o-mini

エージェント・ファクトリへのOpenAIモデルの追加

ステップ1: 左側のナビゲーション・メニューのLLM管理をクリックします。

LLM管理のクリック

ステップ2: 右上隅にある「構成の追加」ボタンをクリックします。

「構成の追加」の選択

ステップ3: フォームが開き、「モデル・タイプ」で生成モデルを選択します。

生成モデルの選択

ステップ4: LLM構成に「構成名」で任意の名前を付けます。空白は許可されないため、空白を使用しないでください。

構成名の追加

ステップ5: LLMプロバイダのリストからOpenAIを選択します。

OpenAIの選択

ステップ6: 「モデルID」にgpt-4oを選択します

「モデルID」の選択

ステップ7: APIキーを入力します

APIキーの入力

ステップ8: 「テスト接続」をクリックして、資格証明が正しいことを確認します。

接続のテスト

ステップ9: 成功メッセージ「接続に成功しました」が画面に表示され、「構成の保存」ボタンが有効になり、それをクリックしてプロセスを確定します。

構成の保存

vLLM

セルフホストのモデル・エンドポイントに接続できます。

vLLMを構成するために必要なフィールドは次のとおりです:

モデルID: vLLMサーバーが提供しているモデル識別子/パス(多くの場合、ファイルシステム・パスまたはレジストリ・スタイル名)。
URL: ホスト/DNSクライアントはサーバーへのアクセスに使用します。
ポート: HTTPサービスが公開されるポート。

埋込みモデル

エージェント・ファクトリは、次の埋込みモデルをサポートしています。これらのモデルを使用して、テキストを数値ベクトルに変換し、セマンティック検索および検索拡張生成(RAG)を有効にします。エージェント・ファクトリには、パフォーマンスの高い複数の埋込みモデルの即時利用可能なサポートが含まれています。また、OCI生成AIサービスでホストされている、またはOllamaまたはvLLMエンドポイントを介して提供される、優先モデルを導入することもできます。