1.2 ドキュメント・コレクション・アプリケーション
テキスト問合せアプリケーションを使用すると、ユーザーは、Webサイト、デジタル・ライブラリ、ドキュメント・ウェアハウスなどのドキュメント・コレクションを検索できます。
この項では、次の項目について説明します。
1.2.1 ドキュメント・コレクション・アプリケーションについて
通常、コレクションは静的で、最初に索引付けを実行した後に内容が大幅に変更されることはありません。ドキュメントのサイズおよび形式(HTML、PDF、Microsoft Wordなど)は任意です。これらのドキュメントは、ドキュメント表に格納されます。検索を可能にするには、ドキュメント・コレクションを最初に索引付けします。
通常、問合せはワードまたは句で構成されます。アプリケーション・ユーザーは、OR
やAND
などの演算子を使用して、ワードおよび句の論理的な組合せを指定します。ユーザーは、ステミング、近接検索、ワイルドカード操作などの他の問合せ操作を適用して、検索結果を改善できます。
このタイプのアプリケーションでは、問合せに最も関係があるドキュメントを取得する必要があります。そのドキュメントが、結果リストの上位にランク付けされる必要があります。
問合せには、ドキュメント表に対するCONTEXT
索引が最も適しています。この索引への問合せでは、アプリケーションは、SQL
SELECT
文のWHERE
句でCONTAINS
演算子を使用します。
1.2.2 テキスト問合せアプリケーションのフローチャート
ドキュメント・コレクションに対する典型的なテキスト問合せアプリケーションでは、ユーザーが問合せを入力できるようになっています。アプリケーションはCONTAINS
問合せを入力し、その問合せを満たすドキュメントのリスト(ヒットリスト)を戻します。問合せの結果は通常、関連性の度合によってランク付けされています。アプリケーションでは、ヒットリスト内の1つ以上のドキュメントを表示できます。
たとえば、アプリケーションでWeb上のURL (HTMLファイル)を索引付けすることにより、索引付けされた一連のURL内での問合せ機能が提供されます。この場合、問合せアプリケーションにより戻されるヒットリストは、ユーザーがアクセスできるURLで構成されます。
図1-2は、単純なテキスト問合せアプリケーションとユーザーとの対話のフローチャートを示しています。
-
ユーザーが問合せを入力します。
-
アプリケーションが
CONTAINS
問合せを実行します。 -
アプリケーションがヒットリストを表示します。
-
ユーザーがヒットリストからドキュメントを選択します。
-
アプリケーションがドキュメントを表示します。