ナレッジ・ベース

ナレッジ・ベースでは、Oracle Database 26ai Vector Search機能を活用して、AI Data Platform Workbenchに格納されているドキュメントからのベクトル埋込みを格納します。

Oracle Database 26aiのベクトル検索機能により、ナレッジ・ベースはAIエージェントがセマンティック検索を実行し、意味的に関連するドキュメントを取得できるようにします。AIデータ・プラットフォーム・ワークベンチでは、ナレッジ・ベースはナレッジ・ベース・タイプのカタログのスキーマに作成されます。

AIデータ・プラットフォーム・ワークベンチの「マスター・カタログ」ページが開き、カタログが選択され、「ナレッジ・ベース」が強調表示されます

AIデータ・プラットフォーム・ワークベンチでは、ナレッジ・ベースは、ナレッジ・ベース・タイプを使用して標準カタログのスキーマに作成されます。管理対象ボリュームまたは外部ボリュームに格納されたPDF、DOCXおよびTXTファイルの取込みは、ナレッジ・ベースでサポートされています。デフォルトでは、ベクトルは、AI Data Platformのインスタンスの作成時にテナンシにプロビジョニングされるOracle Database 26ai Vector Searchインスタンスに格納されます。

AIデータ・プラットフォーム・ワークベンチは、次の2つの埋込みモデルをサポートしています。

ALL_MINILM_L12_V2: 文と段落を384次元の密ベクトル空間にマップする文変換モデル。クラスタリングやセマンティック検索などのタスクに使用されます。
MULTILINGUAL_E5_SMALL: 複数言語のテキストのベクトル埋込みを生成します。コンパクトな設計により、さまざまな言語にまたがる効果的なパフォーマンスを実現し、多様なデータセットや多言語シナリオに適しています。

ノート:

AIデータ・プラットフォーム・ワークベンチのナレッジ・ベース・オブジェクト自体は直接問合せできません。ナレッジ・ベースを問い合せるには、エージェント・フローでエージェントにアタッチされたRAGツールを作成し、関連するナレッジ・ベースを選択します。RAGツールの詳細は、RAG Toolを参照してください。AIエージェントの詳細は、AIエージェントを参照してください。

データ・ソースの取込み

AIデータ・プラットフォーム・ワークベンチでナレッジ・ベースを作成した後、そのナレッジ・ベースに移動し、データを取り込むデータ・ソースを指定する必要があります。ボリューム全体またはボリューム内のフォルダを取込みのソースとして選択できますが、個々のファイルを選択することはできません。

ナレッジ・ベースの「データ・ソース」タブでデータ・ソースを確認し、そのデータ・ソースの名前をクリックしてそのデータ・ソースに関する情報を表示できます。「パラメータ」タブには、選択したボリューム、ファイル・パス、アタッチされたクラスタおよびファイル・タイプに関する情報が表示されます。

ノート:

AIデータ・プラットフォーム・ワークベンチでは、スケジュール済取込みジョブはサポートされていません。データ・ソースの「パラメータ」タブで「今すぐ収集」をクリックすると、すぐにデータを取り込むことができます。

「詳細」タブでデータ・ソースの詳細情報を確認し、「ジョブ実行」タブでデータ取込みジョブの履歴を確認できます。

ナレッジ・ベースの作成

AIデータ・プラットフォーム・ワークベンチでのナレッジ・ベースの作成は、ドキュメント・ソースの登録、ファイルの自動チャンク、埋込みおよび索引付け、およびエージェント・フローを介したセマンティック検索とRAG取得を可能にするワンタイム設定です。

AIデータ・プラットフォーム・ワークベンチでは、ナレッジ・ベースを直接問い合せることはできません。ナレッジ・ベースを問い合せるには、AIエージェントにアタッチされたRAGツールを作成します。詳細は、AIエージェントを参照してください。

「Master catalog」をクリックします。
ナレッジ・ベースを作成する標準カタログおよびスキーマにナビゲートします。
「ナレッジ・ベース」をクリックします。
「ナレッジ・ベースの作成」をクリックします。
ナレッジ・ベースの名前と説明を入力します。
ファイル収集用のワークスペースおよびSparkクラスタを選択します。クラスタが選択されていない場合は、デフォルトのマスター・カタログ・コンピュートが使用されます。
必要に応じて、使用する埋込みモデルを選択します。
必要に応じて、チャンク・サイズとチャンク・オーバーラップを指定します。
「作成」をクリックします。

ナレッジ・ベースの編集

関連する権限がある場合は、既存のナレッジ・ベースの名前、説明、クラスタ、モデルまたはチャンク化の詳細を変更できます。

ナレッジ・ベース・フォルダにナビゲートします。
編集するナレッジ・ベースの横にある「アクション」をクリックし、「編集」をクリックします。
ナレッジ・ベースの属性を変更します。
「保存」をクリックします

ナレッジ・ベースの削除

不要になったナレッジ・ベースを削除したり、カタログから使用したりできます。

ナレッジ・ベース・フォルダにナビゲートします。
削除するナレッジ・ベースの横にある「アクション」をクリックし、「削除」をクリックします。
「削除」をクリックします

ナレッジ・ベースへのデータソースの追加

ナレッジ・ベースを作成した後、そのナレッジ・ベースに収集用のデータ・ソースを割り当てる必要があります。

ナレッジ・ベースにナビゲートします。
「データ・ソース」タブをクリックします。
「ナレッジ・ベースへのデータ・ソースの追加」をクリックします。
マスター・カタログで、ナレッジ・ベースに収集するボリュームまたはフォルダを選択します。個々のファイルは選択できません。
必要に応じて、データの取込みに使用するコンピュート・クラスタを選択します。
収集するファイル・タイプを選択します。サポートされているファイル・タイプは、PDF、TXTおよびDOCXです。
データ・ソースの追加直後に取込みを開始するには、「追加時に取込みジョブを開始」を選択します。
「追加」をクリックします

ナレッジ・ベースへのデータの取込み

データ・ソースがナレッジ・ベースに追加されると、「パラメータ」タブからデータ取込みジョブの実行を手動で開始できます。

ナレッジ・ベースにナビゲートします。
「データ・ソース」タブで、データ収集ジョブを実行するデータ・ソースの名前をクリックします。
「パラメータ」タブで、「今すぐ収集」をクリックします。

収集ジョブ実行ステータスの表示

データ・ソースのすべての取込みジョブのリストは、データ・ソースの「ジョブ実行」タブから表示できます。

ナレッジ・ベースにナビゲートします。
「Data Source」タブで、ステータスを表示するデータ・ソースの名前をクリックします。
「ジョブ実行」タブをクリックします。
フィルタを使用して、表示されるジョブ実行のリストを絞り込みます。

データソースの削除

不要になったデータ・ソースまたは使用したデータ・ソースをナレッジ・ベースから削除できます。

データ・ソースを削除すると、対応するベクトル埋込みもAIデータ・プラットフォームから削除されます。

ナレッジ・ベースに移動します。「データ・ソース」タブをクリックします。
削除するデータ・ソースの横にある「アクション」をクリックし、「削除」をクリックします。
「削除」をクリックします