目次
はじめに
第 1 章 Netshare について
第 2 章 Web サーバ パブリッシングについて
第 3 章 インストールと設定
第 4 章 Web Publisher クイックスタート
第 5 章 サービスとメニュー
第 6 章 検索について
第 7 章 アクセス コントロール
戻る 次へ 目次


第 6 章 検索について

Web Publisher には、リモート サーバ上のドキュメントのプロパティや内容を検索できる機能があります。サーバでは、ファイルのインデックスが作成されるため、検索結果のファイルは、Web ブラウザで表示することができます。

この章では、次のトピックについて説明します。


検索するデータの準備
サーバで検索機能を使用するには、まず、検索対象となるドキュメントを選択します。検索の実行前には、検索対象となる検索可能データのデータベースが必要です。サーバ管理者は、コレクションと呼ばれるドキュメント情報データベースを作成する必要があります。このデータベースは、検索対象となる各ドキュメントの内容やファイル プロパティのインデックスを作成して保存するためのものです。

Web Publisher には、パブリッシュや、アップロードをはじめ、その他 Web Publisher で処理されたすべてのドキュメントを含むデフォルトの Web パブリッシング コレクションが用意されています。また、サーバ管理者は、Web パブリッシング データのインデックスを一括して作成することもでき、たとえば、Web Publisher 用に定義されたディレクトリ内のすべてのドキュメントのインデックスをまとめて作成することが可能です。

コレクションには、ドキュメントの形式、使用言語、検索可能な属性、コレクション内のドキュメント数、コレクションのステータス、コレクションについての簡単な説明などの情報が収録されています。詳細については、「コレクションの内容の表示」を参照してください。

この節では、次のトピックについて説明します。

コレクションの属性について 一部のファイル形式には、デフォルトの属性が設定されており、その形式のファイルのインデックス化に使用されます (表 6.1 参照)。ASCII ファイルには、デフォルトの属性はありません。

表 6.1 インデックス化に使用される各ファイル形式のデフォルト属性

ファイル形式
属性
タイプ
説明
ASCII
-
-
-
HTML
Title
テキスト
ユーザ定義されたファイルのタイトル

SourceType
テキスト
ドキュメントの元のファイル形式
NEWS
From
テキスト
ニュース アイテムのソース ユーザ ID

Subject
テキスト
ニュース アイテムの件名フィールドのテキスト

Keywords
テキスト
ニュース アイテムの定義に使用されるキーワード

Date
日付
ニュース アイテムの作成日
EMAIL
From
テキスト
電子メールの送信ユーザ ID

To
テキスト
電子メールの宛先のユーザ ID

Subject
テキスト
電子メールの件名フィールドのテキスト

Date
日付
電子メールの作成日
PDF
InstanceID
テキスト
内部 ID 番号の 1 つ

PermanentID
テキスト
内部 ID 番号の 1 つ

NumPages
整数
ドキュメントのページ数

DirID
テキスト
PDF ファイルが保存されているディレクトリ

FTS_ModificationDate
日付
ドキュメントの最終更新日

FTS_CreationDate
日付
ドキュメントの作成日

WXEVersion
整数
PDF ドキュメントからのテキスト抽出に使用される Adobe Word Finder のバージョン

FileName
テキスト
Adobe ファイル名

FTS_Title
テキスト
ドキュメントのタイトル

FTS_Subject
テキスト
ドキュメントのサブジェクト

FTS_Author
テキスト
ドキュメントのオーサ

FTS_Creator
テキスト
ドキュメントのクリエータ

FTS_Producer
テキスト
ドキュメントのプロデューザ

FTS_Keywords
テキスト
ドキュメントのキーワード

PageMap
テキスト
そのページの単語のインスタンスを記述したページマップ

META タグ付きの属性
HTML コレクションのデフォルトでは、Title および SourceType 属性のみが設定されていますが、HTML の <META> タグ付き属性を 30 個まで設定して検索やソートに使用することが可能です。

たとえば、次のような META タグ付きの属性が設定できます。

<META NAME="Writer" CONTENT="J. S. Smith">
<META NAME="PubDate" CONTENT="07-24-00">
<META NAME="Product" CONTENT="Communicator">

このドキュメントのインデックスが、上記の META タグで作成されている場合は、検索の際、作者、作成日時、製品の各フィールドに、該当する値を入力します。たとえば、「Writer <contains> Smith」や「PubDate > 1/1/00」などのクエリを入力することができます。

ノート
META タグ付きのフィールドの属性値はすべてテキスト文字列で、日付や数値もテキストとしてソートされます。また、META タグ付きの属性に不正な HTML 文字がある場合は、ハイフンに置き換えられます。


検索の実行 (基本)
検索における主なプロセスは、検索コレクション内のデータに対するクエリの実行とその結果返されるドキュメントの一覧の表示です。iPlanet Web Server では、デフォルトで検索クエリと結果ページがインストールされ、これらを利用して検索をすばやく簡単に実行することが可能です。

サーバ ドキュメントは、特定の単語や属性値で検索することができ、クエリに一致するすべてのドキュメントは、検索結果として一覧表示されます。この一覧からドキュメントを選択して全体を参照することも可能です。検索の利用により、サーバ上のコンテンツに簡単にアクセスすることができます。

テキスト検索は、以下の 4 つの部分から成り立っています。

この節では、次のトピックについて説明します。

検索クエリの作成
デフォルトの検索クエリ ページには、標準 HTML フォーム、高度な HTML フォーム、Java ベース ガイド付きアプレットの 3 つがあります。

標準検索フォームでは、まず検索の対象となるコレクションを選択し、クエリ言語演算子を使用して検索する単語やフレーズを入力します。

高度な HTML フォームでは、検索の対象となる複数のコレクションの選択、結果に使用するソート シーケンスの作成、1 ページに表示されるドキュメント数の指定 ([前へ]、[次へ] の矢印をクリックすることにより、結果ページの前後移動が可能) などのオプションを使用できます 。

Java ベース ガイド付き検索アプレットでは、ドロップダウン リストを利用してクエリを作成することができます。このアプレットを使用するには、ブラウザで Java を有効にしてください。

この節では、次のトピックについて説明します。

標準検索クエリ フォーム
標準検索クエリ フォームからは 2 種類の検索を実行することができます。サーバ コレクションを検索するには、以下の操作を行います。

  1. Web ブラウザの場所フィールドに次の URL を入力します。
  2. 図 6.1    標準検索クエリ ページ

  3. 表示された検索クエリ ページで、[検索対象] フィールドのドロップダウン リストから検索対象となるコレクションを選択します。
  4. [For] フィールドに検索クエリとして使用する単語またはフレーズを入力します。演算子を組み合わせて複雑なクエリを作成することもできます。検索演算子の詳細については、「クエリ演算子 (リファレンス)」を参照してください。
  5. [検索] ボタンをクリックしてクエリを実行します。 個々のサーバではなくワールド ワイド ウェブを検索することもできます。これを行うには、[Web を検索] ボックスを使用して [検索] をクリックします。

高度な HTML 検索クエリ ページ
クエリの作成では、高度な HTML 検索フォームを利用することもできます。このフォームは、複数のコレクションを検索対象とする場合や、特定の属性値で結果をソートして表示させる場合に便利です。

標準検索クエリ ページから高度な HTML 検索を利用するには、以下の操作を行います。

  1. Web ブラウザの場所フィールドに次の URL を入力して標準クエリ ページを表示させます。
  2. ブラウザで Java を無効にします。これを行うには、[詳細] オプション プリファレンス メニューのコマンドを使用します。
  3. 標準検索フォームの [ガイド付き検索] をクリックして高度な HTML クエリ ページを表示させます。
  4. 図 6.2    高度な HTML 検索クエリ ページ

  5. [For] フィールドに、検索する単語またはフレーズを入力します。演算子を組み合わせて複雑なクエリを作成することもできます。検索演算子の詳細については、「クエリ演算子 (リファレンス)」を参照してください。
  6. 属性値 (複数可) を入力して結果をその属性値に基づいてソートすることができます。デフォルトでは、昇順ソートですが、-Pubdate のように負の符号を付けることにより降順ソートにすることができます (ソートの詳細については、「結果のソート」を参照)。
  7. 検索結果ページの各ドキュメントのフィールド数や、一度に表示される数は、必要に応じて調節することができます。検索結果を一度に 1 ページに表示できない場合は、[前へ] や [次へ] ボタンを使用することにより、ほかのページにアクセスできます。
  8. [検索対象] フィールドのドロップダウン リストを使用して検索対象となるコレクションを選択します。Ctrl キーを押しながらほかのコレクションをクリックすることにより、複数のコレクションを選択できます。1 つのクエリ内のすべてのコレクションは同じ言語である必要があります。
  9. [検索] ボタンをクリックしてクエリを実行します。
ガイド付き検索アプレット
Java ベース ガイド付き検索インターフェイスも、クエリ作成に使用することができます。このインターフェイスは、ドキュメント内の単語と特定の属性値の両方を検索する場合など、複数の要素を含むクエリを作成する場合に便利です。

ノート
ブラウザで Java が有効になっていることを確認してください。この設定には、[言語] オプション プリファレンス メニュー コマンドを使用します。

ノートリンク管理やエージェント サービスの属性もリストに表示されますが、これらは Web Publisher 4.0 では使用できないため、これらの属性を選択しても有効な結果は得られません。

標準検索クエリ ページからガイド付き検索アプレットにアクセスするには、以下の操作を行います。

  1. 次の URL を入力して標準検索クエリ ページを表示させます。
  2. 標準検索ページの [ガイド付き検索] をクリックすると、Java ベース ガイド付きクエリ ページが表示されます。
  3. 図 6.3    ガイド付き検索クエリ アプレット

  4. [検索対象] フィールドのリストから検索対象のコレクションを選択します。
  5. [For] ボックスの一覧から検索項目の種類を選択します。この例では、[Words] を選択します。
  6. 空白のテキスト フィールドに、検索する単語を入力します。検索演算子の詳細については、「クエリ演算子 (リファレンス)」を参照してください。
  7. [Add Line] をクリックし、クエリの最初の部分を追加します。フォームの下部にある大きなテキスト表示ボックスにその単語が表示されます。
  8. ほかの検索項目をクエリに追加する場合は、ドロップダウン リストから該当する項目を選択します。この例では、[属性] を選択します。
  9. フォームの右側に新しいドロップダウン リストが表示され、選択したコレクションで使用可能なすべての属性が一覧表示されます。この中から検索に使用する属性を選択します。
  10. テキスト入力フィールドの上にあるドロップダウン リストから、クエリで使用するクエリ演算子 (Contains、Starts、Ends、Matches、Has a substring) や論理演算子 (=、<、>、<=、>=) を選択します。
  11. 空白のテキスト フィールドに、検索する属性値を入力します。
  12. [Add Line] をクリックしてクエリに行を追加します。[Undo Line] をクリックして最後に追加した行を削除、または [クリア] をクリックしてクエリ全体をクリアすることもできます。
  13. [検索] ボタンをクリックして検索を実行します。
検索結果の表示
標準の検索結果には、検索条件に一致するすべてのドキュメントが一覧表示されたものと、その一覧から選択したドキュメントのテキストが表示されたものの 2 種類があります。

この節では、次のトピックについて説明します。

アクセス許可チェック
検索結果として返されるドキュメントは、関連する各ドキュメントやコレクションに設定されたアクセス コントロール規則によって異なります。以下の操作を行った場合は、サーバでアクセス チェックが実行されます。

クエリに一致するドキュメントへのアクセスが、アクセス コントロール規則により制限されている場合、そのドキュメントは検索結果には表示されません。また、検索結果のドキュメントを表示するパーミッションを持っていない場合、そのドキュメントは検索結果として表示されません。

条件に一致するドキュメントの一覧表示
iPlanet Web Server のデフォルトでは、標準検索または高度な検索のいずれのクエリ ページで検索を実行した場合でも、検索条件に一致するドキュメントが一覧表示されます。この一覧では、コレクションの形式に応じて、各ファイルの一般的な情報が表示されます。たとえば、電子メール コレクションのデフォルトの結果ページでは、各エントリに対して subject、to、from、date が、ニュース コレクションのページでは、subject、from、date が表示されます。

図 6.4    検索結果の例

検索に使用できるデフォルトの属性は、コレクションに含まれるファイル形式の種類によって異なります。各形式に対する属性の詳細については、「

コレクションの属性について」およびその節の表 6.1 を参照してください。

単語間の近接度の比較や、完全に一致する単語をチェックする検索の結果エントリでは、ファイルの一致度を得点で表して順位を付けることが可能です。

条件に一致するドキュメントを 1 ページに表示できない場合は、[次へ] をクリックして次のページを表示させることができます。新しいクエリ データを入力して[検索] をクリックすることにより、新しい検索を任意に実行できます。

結果のソート
デフォルト、または高度な HTML クエリ ページの [ソート] フィールドに何も入力しなかった場合は、検索条件に一致するすべてのドキュメントが、一致度の高い順 (これが可能なクエリの場合)、またはサーバ ファイル データベースにおける位置 (一致度を表示できないクエリの場合) に応じて表示されます。

[ソート] フィールドに属性名を入力した場合は、ドキュメントが昇順で表示されます。ドキュメントの一覧を降順で表示する場合は、「-keywords」や「-title」のように属性値の前に負の符号 (-) を付けます。また、「Author,-PubDate」など複数のフィールドに入力して、複数の属性値に基づくソートも可能です。

短いクエリでは、通常、ソート順は重要ではありませんが、非常に多くの検索結果が返される可能性があるクエリでは、有効な結果を得るために必要に応じてソート値を設定します。ただし、特殊なソート シーケンスを使用した場合は、検索効率に影響することがあります。

ノート
META タグ付きフィールド内の属性値はテキスト文字列で、日付や数値もテキストとしてソートされます。値を日付や数値に変換するには、[Web Publishing|Add Custom Property] フォームで新しいプロパティを作成し、このプロパティを META タグ付き属性にするチェック ボックスをオンにします。

ドキュメントの表示
デフォルトで iPlanet Web Serverをインストールした場合は、検索条件に一致するドキュメントの一覧表示から、1 つのドキュメントを選択して Web ブラウザで表示できます。ブラウザでは、ドキュメントを元の形式まま、または色、ボールド、点滅などのテキスト属性を使用して検索クエリの単語やフレーズが強調表示される形式で表示することができます。

ドキュメントを元の形式のまま表示するには、そのドキュメントへの URL を含むハイパーテキスト リンクをクリックします。そのドキュメントが HTML に変換されている場合は、その場所がこの URL で指定されます。このリンクをクリックすることにより、外部ビューアが起動し、ドキュメントが元の形式で表示されます。

強調表示された形式のドキュメントを表示するには、検索結果のドキュメント エントリの横にあるグラフィックをクリックします。

コレクションの内容の表示
コレクション データベースでは、データベース内の内容を表示して各コレクションに設定されている属性を確認することができます。ただし、非表示で定義されている一部のコレクションは表示されません。通常、コレクションの内容には、以下の項目が含まれます。

コレクション データベースの内容を表示するには、Web ブラウザの場所フィールドに次の URL を入力します (スペースは含まない)。

http://yourServer/search?NS-search-page=c


クエリ演算子の使用

効果的な検索を行うには、クエリ演算子の使用方法を理解する必要があります。検索では、ブール値検索のみが可能なため、ここではブール値検索規則に基づいて説明します。

ノート
クエリ言語では、大文字小文字は区別されませんが、例では、わかりやすくするために大文字を使用します。

検索エンジンは、シンタックスに基づいて検索クエリを解釈します。たとえば、region と入力した場合は、region という単語に加え、語幹が一致する単語 (regionsregional など) も検出されます。検索結果は、「重要度」に応じて、入力した検索条件に一致する順に順位が付けられます。上の例では、region が、最も一致度が高い順位になります。

すべてのクエリで、結果が順位付けされるわけではありません。たとえば、指定された文字列がフィールドの値と一致するかどうかをチェックするクエリでは、順位付けは行われず、文字列が値と一致するかどうかのみがチェックされます。また、ある文字列がフィールドに含まれているかどうか、またはフィールドの先頭や末尾がその文字列になっているかかどうかをチェックする場合も同様に行われません。

この節では、次のトピックについて説明します。

デフォルト時の解釈
検索クエリ言語には、入力された値の解釈方法を命令するデフォルト値や仮定が用意されています。このデフォルトは、使用しないことも可能です。ここでは、検索エンジンが条件に一致する検索結果を選択する仕組みを説明します。

<STEM> - 語幹が一致するものも含め検索する単語やフレーズを含むすべてのドキュメントが検出されます。検索エンジンでは、単語の綴りのみではなく、意味もチェックするため、たとえば、plan という単語を検索する場合、planningplans を含むドキュメントは検索結果になりますが、planeplanet を含むドキュメントは検出されません。

<MANY> - 検索した単語やフレーズが、検索結果のドキュメント内でどの程度使用されるか (適合度) に基づいて、結果が順位付けされます。

<PHRASE> - スペースで区切られた単語はフレーズの一部として解釈されます。たとえば、Monterey otter はフレーズで、かつ 2 つの単語は連続して記載されているものと解釈されます。この検索方法では、sea otterMonterey Bay などを含むドキュメントは検出されません。

ノート
2 つの単語をフレーズとして解釈するべきかどうかが明確でない場合は、丸括弧で囲んで区別することができます。たとえば、
<PHRASE> (rise "and" fall) などです。

OR - クエリ内の各単語やフレーズがカンマで区切られている場合は、少なくともどちらか一方を含むドキュメントが検出されます。つまり、これは実質上 OR 演算です。たとえば、Monterey, otter は、Monterey または otter のいずれかを含むドキュメントを検出するものとして解釈されます。OR には、山かっこ (<>) は必要ありません。

検索規則
複雑な検索クエリを作成するには、クエリ演算子の組み合わせ、クエリ シンタックスの操作、ワイルドカード文字の使用などが可能です。

この節では、次のトピックについて説明します。

山かっこ
ANDORNOT の各演算子、および日付や数値の比較演算子を除くすべてのクエリ演算子は、<CONTAINS> <WILDCARD>などのように山かっこで囲む必要があります。

演算子を組み合わせる
1 つのクエリで複数の演算子を使用することにより、正確な結果を得ることができます。たとえば、次のクエリを入力した場合は、BayMonterey を含み、Aquarium は含まないドキュメントが検出されます。

Monterey AND Bay NOT <CONTAINS> Aquarium

フレーズを含めることにより、さらに正確な検索結果を得ることができます。次のクエリでは、Monterey Bay Aquarium というまとまったフレーズと otters という単語を含み、shark は含まないドキュメントが検出されます。

Monterey Bay Aquarium AND otter AND NOT shark

クエリ演算子を検索する単語として使用する
すべてのクエリ演算子は、検索する単語として使用できますが、その場合は、演算子を引用符で囲みます。たとえば、次のクエリでは、潮の満ち引き (ebb and flow) という 1 つのフレーズを含むドキュメントを検索できます。

<CONTAINS> ebb "and" flow

完全に一致する単語のみ検索する
単語を引用符で囲むことにより、語幹一致単語の検索機能をオフにすることができます。たとえば、次のクエリを使用した場合は、完全に一致する単語のみ検索されます。

"plan"

この検索の場合は、plan と完全に一致する単語を含むドキュメントのみが検出され、plansplanning などを含むドキュメントは無視されます。

演算子を変更する
ANDORNOT の各演算子を使用し、ほかの演算子を変更することもできます。たとえば、theme park というフレーズが含まれるタイトルのあるドキュメントを検索から除外する場合は、次のようなクエリを使用します。

Title NOT <CONTAINS> theme park

使用する演算子の決定
使用する演算子を決定する際には、以下を参照してください。クエリ言語では、大文字小文字は区別されないため、<starts> と <STARTS> は同じものとして扱われます。このドキュメントでは、わかりやすくするために大文字を使用します。

表 6.1 使用する演算子の決定
検索のタイプ
有効な演算子

日付や数値を比較してドキュメントを検索
等しい (=)、
より大きい (>)、
〜以上 (>=)、
より小さい (<)、
〜以下 (<=)

DATE >= 06-30-99

1999 年 6 月 30 日以降に作成されたドキュメントを検索します。
特定のドキュメント フィールドやそのフィールド内の特定の位置にある単語やフレーズを検索
<STARTS>、
<CONTAINS>、
<ENDS>、
等しい (=)

Title <STARTS> Help

Help で始まるタイトルがあるドキュメントを検索します。
ドキュメント内の複数の単語を検索
AND、
<NEAR/1>

specifications AND review

specificationsreview の両方を含むドキュメントを検索します。

クエリ演算子 (リファレンス)
次の表では、一般的に使用される演算子の説明と、その使用例を記載します。特に明記していない限り、使用頻度の高い順に並んでいます。 表 6.2 クエリ言語の演算子
演算子
説明

AND

検索条件を追加します。指定した単語をすべて含むドキュメントを検索します。
Antarctica AND mountain climb

Antarcticamountain climb の両方に加え、mountain climbing など、語幹が一致するものの変形も含むドキュメントを検索します。
<CONTAINS>

ドキュメント フィールド内で指定した単語を含むドキュメントを検索します。単語の語順は、ドキュメント内で使用されている語順と完全に一致する必要があります。

英数字を検索する場合は、ワイルドカードを使用できます。

一致度によるドキュメントの順位付けは行われません。
Title <CONTAINS> higher profit

タイトルにhigher profit というフレーズが含まれるドキュメントを検索しますが、profits higher を含むドキュメントは無視されます。
<ENDS>

ドキュメント フィールドが、指定された文字列で終わっているドキュメントを検索します。

一致度による順位付けは行われません。
Title <ENDS> draft

draft という文字列で終わるタイトルのドキュメントを検索します。
等しい (=)
ドキュメント内の任意フィールドが特定の日付や数値と一致するドキュメントを検索します。
Created = 6-30-99

1999 年 6 月 30 日に作成されたドキュメントを検索します。
より大きい、またはより後 (>)
ドキュメント内の任意のフィールドが特定の日付より後のものである、または特定の数値よりも大きいドキュメントを検索します。
Created > 6-30-99

1999 年 6 月 30 日より後に作成されたドキュメントを検索します。
〜以上、または以降 (>=)
ドキュメント内の任意のフィールドが特定の日付以降、または特定の数値以上であるドキュメントを検索します。
Created >= 6-30-99

1999 年 6 月 30 日以降に作成されたドキュメントを検索します。
より小さい、またはより前 (<)
ドキュメント内の任意のフィールドが特定の日付より前である、または特定の数値未満であるドキュメントを検索します。
Created < 6-30-99

1999 年 6 月 30 日より前に作成されたドキュメントを検索します。
〜以下、または〜以前 (<=)
ドキュメント内の任意のフィールドが特定の日付以前である、または特定の数値以下であるドキュメントを検索します。
Created <= 6-30-99

1999 年 6 月 30 日以前に作成されたドキュメントを検索します。
<MATCHES>

ドキュメント フィールド内の文字列が指定した文字列に一致するドキュメントを検索します。

文字列の一部のみが一致する場合、そのドキュメントは無視されます。

一致度による順位付けは行われません。
<MATCHES> employee

employee あるいは employees などの語幹が一致する単語の変形を含むドキュメントを検索します。
<NEAR>

指定した単語を含むドキュメントを検索します。ドキュメント内での単語の場所が近いほど、そのドキュメントの得点は高くなります。
stock <NEAR> purchase

stockpurchase の両方を含むドキュメントをすべて検索しますが、stock purchase を含むドキュメントは purchase supplies and stock up を含むドキュメントより得点が高くなります。
<NEAR/N>

指定した複数の単語がお互いに N 単語以内の場所にあるドキュメントを検索します。N には 1000 以下の整数を使用します。また、ドキュメントは、単語の近接度に応じて順位付けされます。
stock <NEAR/1> purchase

stock purchasepurchase stock のフレーズを含むドキュメントを検索します。

purchase supplies and stock up というフレーズを含むドキュメントは、stockpurchase が隣接していないため無視されます。

N が 2 以上の場合は、その単語がその範囲内に含まれるドキュメントが検出され、ドキュメント内での単語の位置が近いものほどドキュメントの得点は高くなります。
NOT

特定の単語やフレーズを含まないドキュメントを検索します。

ノート: NOT を使用して OR 演算子や AND 演算子を変更することができます。
surf AND NOT beach

surf という単語は含み、beach という単語は含まないドキュメントを検索します。
OR

検索条件を追加します。検索条件のいずれかを含むドキュメントをすべて検索します。
apples OR oranges

apples または oranges のいずれかを含むドキュメントを検索します。
<PHRASE>

指定したフレーズを含むドキュメントを検索します。フレーズとは、一定の順序で並べられた複数の単語がグループ化されたものです。
<PHRASE> (rise "and" fall)

rise and fall というフレーズ全体を含むドキュメントを検索します。and が引用符で囲まれているのは、検索の際に、この単語を演算子ではなくリテラルとして解釈させるためです。
<STARTS>

ドキュメント内の任意のフィールドが特定の文字列で始まるドキュメントを検索します。

一致度による順位付けは行われません。
Title <STARTS> Corp

CorporateCorporation など、Corp で始まるタイトルを含むドキュメントを検索します。
<STEM>
(英語のみ)
指定した単語とその変形を含むドキュメントを検索します。
<STEM> plan

planplansplannedplanning など、同語幹の変形を含むドキュメントを検索します。綴りが類似していても意味が異なる planetplane などの単語は無視されます。
<SUBSTRING>

ドキュメント内のフィールドで指定した文字列の一部あるいは全部に一致する文字列を含むドキュメントを検索します。

<MATCHES> と類似していますが、部分的に一致する場合でも検索できます。

ワイルドカードは使用できません。

一致度による順位付けは行われません。
<SUBSTRING> employ

employ に完全に一致、またはその一部と一致するドキュメントを検索するため、ploy も検索の対象となります。

ノート: この演算子は、リテラルにのみ使用できます。web* と入力した場合、アスタリスクは、ワイルドカードとして認識されず、"web*" と全く同じ文字列のみ検出されます。
<WILDCARD>

検索文字列にワイルドカードを使用してドキュメントを検索します。綴りは類似しているが、語幹が一致する単語の検索では検出されないものを検索する場合に使用します。

* や ? などの文字を使用した場合は、ワイルドカード検索であると自動的に認識されるため、<WILDCARD> という演算子を使用する必要はありません。
<WILDCARD> plan*


planplaneplanet をはじめ、plannedplansplanetopolis など、plan で始まる単語を含むドキュメントを検索します。

詳細および例については、次の節を参照してください。

<WORD>

指定した単語を含むドキュメントを検索します。
<WORD> theme

themethematicthemes をはじめ、theme と語幹が一致する変化形を検索します。

ワイルドカードの使用
ワイルドカードを使用することにより、特殊な場合にも対応することができます。綴りが類似しているが、語幹一致単語の変形ではない単語を含むドキュメントの検索も可能です。たとえば、plan の語幹一致単語には plansplanning などがありますが、planeplanet などは同語幹の単語ではありません。ワイルドカードを使用した場合は、これらの単語すべてを検索できます。

* や ? など一部の文字は、ワイルドカードを使用した検索であると自動的に認識されるため、式の中に <WILDCARD> という演算子を使用する必要はありません。 表 6.3 ワイルドカード演算子
文字
説明
*
0 個以上の英数字を指定します。たとえば、air* とした場合は、airairlineairhead などを含むドキュメントを検索します。

このワイルドカードは、式の最初の文字として使用することはできません。

このワイルドカードは、角かっこ ([ ]) 内や中かっこ ({ }) 内にある場合は無視されます。

このワイルドカードでは、<WILDCARD> 演算子を使用する必要はありません。
?
1 文字の英数字の代用として使用しますが、複数の ? を使用して文字列を指定することもできます。 たとえば、?at とした場合は、cathat などを含むドキュメントを検索し、??at とした場合は、thatchat などを含むドキュメントを検索します。

このワイルドカードが、角かっこ ([ ]) 内や中かっこ ({ }) 内にある場合は無視されます。

このワイルドカードでは、<WILDCARD> 演算子を使用する必要がありません。
{}
各パターンをカンマで区切って列挙し、その中から該当するものを検索します。たとえば、
<WILDCARD> `Chat{s, ting, ty}`
とした場合、chatschattingchatty を含むドキュメントを検索します。


文字列全体は、バッククオーツ (`) で囲み、スペースは使用しません。
[ ]
検出される文字列になり得る文字のセットを囲みます。たとえば、
<WILDCARD> `[chp]at`
とすると、cathatpat という単語を含むドキュメントを検索します。


文字列全体は、バッククオーツで囲み、スペースは使用しません。

^
(検索対象の)集合から除外する 1 つ以上の文字を指定します。たとえば、<WILDCARD> `C[^io]t` とした場合、catcut を含むドキュメントは検索されますが、cot を含むものは検索されません。

カレット (^) は左角かっこのすぐ後に使用します。
-
集合内の文字の範囲を指定します。たとえば、<WILDCARD> `Ch[a-j]t` とした場合は、chat から chjt までの任意の 4 文字を含むドキュメントを検索します。

ワイルドカードをリテラルとして使用
*or? の式のように、通常はワイルドカードとして使用する文字を検索する場合が考えられます。ワイルドカードをリテラルとして使用するには、その前にバックスラッシュ (システムによっては円記号) を付けます。アスタリスクの場合は、バックスラッシュ (円記号) が 2 つ必要です。たとえば、Zine*** というタイトルの雑誌を検索するには、次のように入力します。

<WILDCARD>Zine\\*\\*\\*

一部の文字は、検索エンジンで特殊な検索文字として認識されるため、リテラルとして解釈させるにはバッククオーツを使用する必要があります。特別な検索文字は以下のとおりです。

たとえば、文字列 "a{b" を検索する場合は、次のように入力します。

<WILDCARD>`a{b`

また、バッククオーツを含む文字列 "c`t" を検索する場合は、次のように入力します。

<WILDCARD>`c``t`


(c) Copyright (c) 2000 Sun Microsystems, Inc. (一部) Copyright (c) 2000 Netscape Communications Corp. All rights reserved.