生成AIエージェントでのナレッジ・ベースの作成
生成AIエージェント・サービスにナレッジ・ベースを作成します。
- 「ナレッジ・ベース」リスト・ページで、「ナレッジ・ベースの作成」を選択します。リスト・ページの検索に関するヘルプが必要な場合は、ナレッジ・ベースのリストを参照してください。
-
次の情報を入力します。
- 名前: 文字またはアンダースコアで始まり、文字、数字、ハイフンまたはアンダースコアが続く名前。長さは1から255文字です。
- コンパートメント: ナレッジ・ベースを格納するコンパートメント
- 説明: 説明(オプション
-
「データ・ストア・タイプ」で、次のいずれかのオプションを選択します:
- Object storage. See RAG Tool Object Storage Guidelines.
- OCI OpenSearch:
それぞれ512未満のトークンを持つファイルにドキュメントをチャンク化する必要があり、続行する前に、OpenSearchでこれらのドキュメントを収集して索引付けする必要があります。「RAG Tool OCI Search with OpenSearch Guidelines」を参照してください。
- データベースAIベクトル検索:
-
Oracle Database 23aiのデータの場合。必要な設定については、RAGツールのOracle Databaseガイドラインを参照してください。
-
HeatWave MySQLのデータの場合。必要な設定については、RAG Tool Heatwave MySQL Guidelinesを参照してください。
-
-
「オブジェクト・ストレージ」を選択した場合は、次のアクションを実行します:
- 「データ・ソース」で、「データ・ソースの指定」を選択し、データ・ソースの名前と説明(オプション)を入力します。
-
ナレッジ・ベースのデータを含むバケットを選択します。バケットが別のコンパートメントにある場合は、コンパートメントを変更します。
バケット内のファイルが生成AIエージェントの要件を満たしていることを確認するには、RAGツールのオブジェクト・ストレージのガイドラインを参照してください。
-
バケットの内容がリストされたら、次のいずれかのアクションを実行して、使用するファイルを選択します:
- バケット内のすべてのアイテムを含めるには、「バケット内のすべてのアイテムを選択」をクリックします。
- 含めるファイルとフォルダを選択します。
- 「オブジェクト接頭辞を手動で追加」を展開して、含めるファイルおよびフォルダの接頭辞を入力します。
- (オプション)「上のデータ・ソースの取込みジョブを自動的に開始します」を選択します。
このオプションを選択しない場合は、後でエージェントが使用できるようにデータを取り込む必要があります。
-
データ・ソース・タイプに「OCI OpenSearch」を選択した場合は、次の情報を入力します。ガイドラインは、RAG Tool OCI Search with OpenSearch Guidelinesを参照してください。
-
OpenSearchクラスタで、ナレッジ・ベースのデータを含むクラスタを選択します。クラスタが別のコンパートメントにある場合は、コンパートメントを変更します。
OpenSearchクラスタについて学習するには、OpenSearchクラスタの詳細ページを参照してください。
- OpenSearch索引に、OpenSearch索引の詳細を入力します。「RAG Tool OCI Search with OpenSearch Guidelines」を参照してください。
-
「シークレット詳細」で、次のオプションのいずれかを選択します:
- 基本認証シークレット: このオプションでは、OpenSearchを使用してOCI検索のVaultシークレットを選択します。
- IDCSシークレット: このオプションでは、エージェントに使用するIDCS機密アプリケーションに次の情報を入力します:
- アイデンティティ・ドメイン: クラスタへのアクセスに使用するアイデンティティ・ドメインを選択します。アイデンティティ・ドメインが別のコンパートメントにある場合は、コンパートメントを変更します。
- クライアントID: OpenSearchクラスタのIDCSクライアント・アプリケーションのIDを入力します。
- クライアント・シークレット・ボールト: クライアント・シークレットを含むボールトを選択します。シークレットが別のコンパートメントにある場合は、コンパートメントを変更します。
- スコープURL: アイデンティティ・ドメインのリソース・サーバー・アプリケーションのAPIエンドポイントであり、エージェント・スコープを含むURLを入力します。たとえば、
genaiagent
スコープの場合、URLはhttps://*.agent.aiservice.us-chicago-1.oci.oraclecloud.com/genaiagent
です。
-
OpenSearchクラスタで、ナレッジ・ベースのデータを含むクラスタを選択します。クラスタが別のコンパートメントにある場合は、コンパートメントを変更します。
-
データ・ソース・タイプに「Oracle AI Vector Search」を選択した場合は、データベース・ツール接続を選択し、「接続のテスト」を選択して、データベースへの正常な接続を確認します。成功すると、データベース名とバージョンが表示されます。次に、データベース・ツール接続のベクトル検索関数またはプロシージャを入力します。
- (オプション)「タグ付けオプションの表示」を選択し、このリソースに1つ以上のタグを追加します。リソースを作成する権限を持つ場合、そのリソースにフリーフォーム・タグを適用する権限もあります。定義済タグを適用するには、タグ・ネームスペースを使用する権限を持つ必要があります。タグ付けの詳細は、リソース・タグを参照してください。タグを適用するかどうかがわからない場合は、このオプションをスキップするか、管理者に問い合せてください。タグは後で適用できます。
-
「作成」を選択します。
ナレッジ・ベースの作成には時間がかかります。ナレッジ・ベースの作成後、オブジェクト・ストレージ・データ・ソースのデータを収集していない場合は、生成AIエージェントへのデータ・ソース・データの取込みのステップに従います。
ノート
オブジェクト・ストレージ・データ・ソースのデータ取込みジョブを実行した後、ステータスおよびステータス・ログをレビューして、更新されたすべてのファイルが正常に取り込まれたことを確認します。
取込みジョブ・ステータスの意味および失敗の問題が発生した場合に実行するアクションについては、データ・ソース・データの取込み、ステップ6を参照してください。
取込みジョブが失敗した場合(たとえば、ファイルが大きすぎたため)は、問題に対処してジョブを再起動します。
以前に実行した取込みジョブを再起動すると、パイプラインは、以前に正常に取り込まれたファイルを検出してスキップします。パイプラインは、以前に失敗し、その後更新されたファイルのみを収集します。たとえば、取り込むファイルが20個あり、最初のジョブ実行で失敗したファイルが2個あります。ジョブを再起動すると、パイプラインは18個のファイルがすでに正常に取り込まれたことを認識し、無視します。以前に失敗し、その後更新された2つのファイルのみが収集されます。