Webクローラ・コネクタ

コンテンツ・インテリジェンス・セキュリティ・モデルによって保護されているWebコンテンツへのリアルタイム・アクセスが、AIエージェント・チームで使用できるようになりました。 このコネクタには、次の機能があります。

  • ハイブリッド字句検索およびセマンティック検索
  • 開始URLおよびクロールの深さの指定
  • ファイル・パターンを含める/除外する
  • Basic認証(ユーザー名/パスワード)

ビジネス上の利点

  • 知識の発見と意思決定の迅速化
  • 手動検索とコンテンツ・トリアージの削減
  • コンテンツの再利用と一貫性の向上

有効化および構成ステップ

1つ以上のWebクローラ・コネクタの作成

  • AI Agent Studioへのアクセス
  • 「資格証明」→「コネクタ」にナビゲートします。
  • 新規コネクタの追加
  • 「WebCrawler」を選択
  • すべての必須フィールドに入力

クロールするプロセスのスケジュール

「Content Intelligence SharePointコネクタ・ジョブ」スケジュール済プロセスは、サイトを定期的にクロールするために定期的に実行するようにスケジュールする必要があります。 大きなサイトをクロールしている場合は、最初の実行にかなり時間がかかる場合があります。 後続の実行は増分であるため、より迅速に完了する必要があります。 最初にコネクタを設定するときには、すべてが正しく構成され、最初のクロールが完了するまで、このジョブad hocを実行することをお薦めします。 その後、30分ごとに実行し、実行の間に完了する時間を確保します。 この同じスケジュール済プロセスがSharePointコネクタの同期に必要であるため、両方をカバーするために1回のみスケジュールする必要があります。

(オプション)クロールされたページのユーザー・グループを更新します

クロールされたページに、コネクタ設定で選択したユーザー・グループとは異なるユーザー・グループを設定する場合は、オーサリングにアクセスしてユーザー・グループを確認および更新する必要があります。 ユーザー・グループを一括更新することもできます。 オーサリングにアクセスするには、https://<your domain>/fscmUI/redwood/knowledgeauthoring/main?contentType=<connector code>に移動します。 例のURLの太字部分を実際のデータに置き換えてください。

1つ以上のエージェント・チームでコネクタを使用

  • 構成したすべてのWebクローラ・コネクタのツールを作成します。
  • コネクタ・ツールを役に立つ任意のエージェントに追加します
  • エージェントのプロンプトを使用して、そのデータを参照する状況でツールを使用するように指示します

ヒントと考慮事項

大量のコンテンツの取込みと索引付けは、4TBの制限があるContent Intelligenceコンテンツの合計サイズに寄与します。