生成AIエージェントの概念
OCI生成AIエージェント・サービスに関連する概念および条件を次に示します。
生成AIモデル
大量のデータでトレーニングされた大規模言語モデル(LLM)で、これまでにトレーニングされていない入力を取得し、新しいコンテンツを生成します。生成AIエージェント・サービスは、リクエストの処理およびレスポンスの生成中にLLMを使用します。
エージェント
人間のようなテキストを理解して生成し、自然言語処理相互作用を可能にするLLMベースの自律システム。生成AIエージェントは、取得拡張生成(RAG)エージェントをサポートしています。RAGエージェントは、データ・ソースに接続し、データを取得し、データ・ソースから情報を使用してレスポンスをモデル化して、より関連性の高いレスポンスを生成します。他のAIエージェントの例としては、会話インタフェースでカスタマ・サポートの問い合わせに対応するエージェントや、顧客の代わりにアイテムを自動的に購入できるエージェントなど、APIを動的に呼び出すことができるエージェントがあります。
RAGエージェントを使用する場合、モデルは高い応答性とアース性を使用して実行する必要があります。
- 回答可能性
-
モデルは、ユーザー問合せに関連するレスポンスを生成できます。
- 接地
- モデルの生成されたレスポンスは、データ・ソースに対して追跡できます。
ナレッジ・ベース、データ・ソースおよびデータ・ストア
エージェントがデータにアクセスする方法。エージェントは、データ・ソースに接続してデータを取り込むことができるベクトルベースのストレージであるナレッジ・ベースに接続します。データ・ソースは、エージェントがレスポンスの生成に使用するデータ・ストアへの接続情報を提供します。たとえば、数百のデータファイルを含むバケットを含むオブジェクト・ストレージ・データ・ストアの場合、データ・ソースはデータ・ストアに接続し、ファイルを取り込むことができます。
データ・ストアに応じて、ナレッジ・ベースはサービス管理または顧客管理になります。
- サービス管理のナレッジ・ベース
- ユーザーはデータ・ソースを指定し、生成AIエージェントはそのデータ・ソースからエージェントが使用するナレッジ・ベースにデータを取り込みます。
- 顧客管理ナレッジ・ベース
- ユーザーはデータの索引付けを管理し、エージェントが使用する生成AIエージェントに索引を提供します。
データ取込み
データ・ソース・ドキュメントからデータを抽出し、分析に適した構造化形式に変換してナレッジ・ベースに格納するプロセス。
チャット
質問をし、モデルにテキストやコードなどの回答を生成させ、モデルが会話のコンテキストを保持している間に会話を続行することで、Large Language Model (LLM)との会話を持つこと。LLMがRetrieval-Augmented Generation (RAG)エージェントで有効になっている場合は、エージェントがアクセスできるデータに関する質問をしたり、モデルがナレッジ・ベースを参照して出力を生成したりできます。
セッション
APIを介してユーザーがエージェントとやり取りするために開始した対話型の会話を表します。これには、ユーザーが問合せまたはプロンプトを送信する一連の交換が含まれ、エージェントはユーザーの入力に基づいて関連情報、アクションまたはヘルプで応答します。セッションは対話中に存続し、コンテキストと継続性を維持して、会話全体で一貫性のある意味のある応答を提供します。
エージェント・エンドポイント
エージェントが他のシステムまたはサービスと対話するために使用する、ネットワークまたはシステム内の特定のアクセスポイント。エンドポイントは、エージェントが機能を実行するために必要に応じて情報を取得または送信するために、エージェントと外部システム間の通信およびデータ交換を主に有効にするために使用されます。
トレース
チャットの会話のトラッキング。
OCI生成AIエージェントでは、トレース機能によって、チャット会話中に元のプロンプトと生成されたレスポンスの両方を含む会話履歴が追跡および表示されます。この機能は、エージェントのエンドポイントを作成するときに有効にできます。
引用
エージェントの応答の情報源。
OCI生成AIエージェントでは、RAGエージェントは、タイトル、外部パス、ドキュメントID、情報ソースのページ番号など、すべてのレスポンスの引用を出力します。エージェントのエンドポイントを作成するときに、そのエージェントの引用を有効にできます。
OCI生成AIエージェントでは、既存の関連情報に加えて、引用機能によってドキュメントのタイトルとページが返され、より多くのコンテキストが提供されます。引用管理では、オブジェクトにメタデータを追加して、カスタムURLへのオブジェクト・ストレージ引用リンクをオーバーライドできます。「引用へのカスタムURLの割当て」を参照してください。
コンテンツ・モデレーション
特定の有毒、暴力的、虐待的、憎悪的、脅迫的、侮辱的、嫌がらせのフレーズを、大規模言語モデル(LLM)で生成された応答またはユーザー・プロンプトから検出または除外するために設計された機能。OCI生成AIエージェントでは、この機能は、次の4種類の害の分類に関連付けられています。
- 憎悪と嫌がらせ。たとえば、アイデンティティ攻撃、侮辱、暴力の脅威、性的攻撃などです。
- 自傷害: 自己傷害や摂食障害の促進など。
- イデオロギー的な有害性。たとえば、過激主義、テロリズム、組織犯罪などです。
- 調査。たとえば、詐欺や性的虐待などです。
コンテンツ・モデレーションの有効化
コンテンツ・モデレーションをアクティブ化するには、次を実行する必要があります。
- エージェントのエンドポイントを作成するときに有効にします。
- モデレーションを適用するかどうかを指定します。
- ユーザー・プロンプト(入力)
- 生成されたレスポンス(出力)
- 入力と出力の両方
生成AIエージェントでのエンドポイントの作成について学習します。
コンテンツ・モデレーションの仕組み
入力に適用すると、エージェントは入力内の有害なコンテンツを検出しても回答を検索しません。出力に適用すると、エージェントはアンサーを検索しますが、ソースに有害なコンテンツが見つかった場合は表示されません。