生成AIエージェントでのデータ・ソース・データの取込み

データ取込みジョブは、データ・ソース・ドキュメントからデータを抽出し、分析に適した構造化形式に変換してから、ナレッジ・ベースに格納します。

  1. 「ナレッジ・ベース」リスト・ページで、データ・ソースのデータを収集するナレッジ・ベースを選択します。
    リスト・ページの検索に関するヘルプが必要な場合は、ナレッジ・ベースのリストを参照してください。
  2. データを取り込むデータ・ソースを選択します。
  3. 「取込みジョブの作成」を選択します。
  4. 次の値を入力します:
    • 名前: 文字またはアンダースコアで始まり、文字、数字、ハイフンまたはアンダースコアが続く名前。長さは1から255文字です。
    • 説明: 説明(オプション
    • タグ: 「拡張オプションの表示」を選択し、取込みジョブに1つ以上のタグを追加します。リソースを作成する権限がある場合は、そのタグを更新する権限があります。ヘルプが必要な場合は、タグおよびタグ・ネームスペースの概念を参照してください。
  5. 「作成」を選択します。
  6. 取込みジョブのステータスが変更されるまで待機します。

ノート

取込みジョブの作成後
  1. ステータス・ログをレビューして、すべての更新済ファイルが正常に収集されたことを確認します。ステータス・ログの取得に関するヘルプが必要な場合は、「データ収集ジョブの詳細の取得」を参照してください。
  2. 取込みジョブが失敗した場合(ファイルのサイズが大きすぎるなど)、問題に対処し、ジョブを再起動します。
収集パイプラインによる以前実行されたジョブの処理方法

以前に実行した取込みジョブを再起動すると、パイプラインは次のようになります。

  1. 以前に正常に取り込まれたファイルを検出してスキップします。
  2. 以前に失敗し、それ以降に更新されたファイルのみを取り込みます。
シナリオの例

取り込むファイルが20個あり、最初のジョブ実行で失敗したファイルが2個あるとします。ジョブを再起動すると、パイプラインは次のようになります。

  1. 18個のファイルがすでに正常に取り込まれていることを認識し、無視します。
  2. 以前に失敗し、その後更新された2つのファイルのみを取り込みます。