『Netshare および Web Publisher ユーザガイド』検索について

目次
はじめに
第 1 章 Netshare について
第 2 章 Web サーバパブリッシングについて
第 3 章インストールと設定
第 4 章 Web Publisher クイックスタート
第 5 章サービスとメニュー
第 6 章検索について
第 7 章アクセスコントロール

戻る

第 6 章 検索について

Web Publisher には、リモートサーバ上のドキュメントのプロパティや内容を検索できる機能があります。サーバでは、ファイルのインデックスが作成されるため、検索結果のファイルは、Web ブラウザで表示することができます。

この章では、次のトピックについて説明します。

検索するデータの準備

検索の実行 (基本)

クエリ演算子の使用

検索するデータの準備

サーバで検索機能を使用するには、まず、検索対象となるドキュメントを選択します。検索の実行前には、検索対象となる検索可能データのデータベースが必要です。サーバ管理者は、コレクションと呼ばれるドキュメント情報データベースを作成する必要があります。このデータベースは、検索対象となる各ドキュメントの内容やファイルプロパティのインデックスを作成して保存するためのものです。

Web Publisher には、パブリッシュや、アップロードをはじめ、その他 Web Publisher で処理されたすべてのドキュメントを含むデフォルトの Web パブリッシングコレクションが用意されています。また、サーバ管理者は、Web パブリッシングデータのインデックスを一括して作成することもでき、たとえば、Web Publisher 用に定義されたディレクトリ内のすべてのドキュメントのインデックスをまとめて作成することが可能です。

コレクションには、ドキュメントの形式、使用言語、検索可能な属性、コレクション内のドキュメント数、コレクションのステータス、コレクションについての簡単な説明などの情報が収録されています。詳細については、「コレクションの内容の表示」を参照してください。

この節では、次のトピックについて説明します。

コレクションの属性について

META タグ付きの属性

コレクションの属性について 一部のファイル形式には、デフォルトの属性が設定されており、その形式のファイルのインデックス化に使用されます (表 6.1 参照)。ASCII ファイルには、デフォルトの属性はありません。

表 6.1 インデックス化に使用される各ファイル形式のデフォルト属性


ファイル形式	属性	タイプ	説明
ASCII	-	-	-
HTML	Title	テキスト	ユーザ定義されたファイルのタイトル
	SourceType	テキスト	ドキュメントの元のファイル形式
NEWS	From	テキスト	ニュースアイテムのソースユーザ ID
	Subject	テキスト	ニュースアイテムの件名フィールドのテキスト
	Keywords	テキスト	ニュースアイテムの定義に使用されるキーワード
	Date	日付	ニュースアイテムの作成日
EMAIL	From	テキスト	電子メールの送信ユーザ ID
	To	テキスト	電子メールの宛先のユーザ ID
	Subject	テキスト	電子メールの件名フィールドのテキスト
	Date	日付	電子メールの作成日
PDF	InstanceID	テキスト	内部 ID 番号の 1 つ
	PermanentID	テキスト	内部 ID 番号の 1 つ
	NumPages	整数	ドキュメントのページ数
	DirID	テキスト	PDF ファイルが保存されているディレクトリ
	FTS_ModificationDate	日付	ドキュメントの最終更新日
	FTS_CreationDate	日付	ドキュメントの作成日
	WXEVersion	整数	PDF ドキュメントからのテキスト抽出に使用される Adobe Word Finder のバージョン
	FileName	テキスト	Adobe ファイル名
	FTS_Title	テキスト	ドキュメントのタイトル
	FTS_Subject	テキスト	ドキュメントのサブジェクト
	FTS_Author	テキスト	ドキュメントのオーサ
	FTS_Creator	テキスト	ドキュメントのクリエータ
	FTS_Producer	テキスト	ドキュメントのプロデューザ
	FTS_Keywords	テキスト	ドキュメントのキーワード
	PageMap	テキスト	そのページの単語のインスタンスを記述したページマップ

META タグ付きの属性
HTML コレクションのデフォルトでは、Title および SourceType 属性のみが設定されていますが、HTML の <META> タグ付き属性を 30 個まで設定して検索やソートに使用することが可能です。

たとえば、次のような META タグ付きの属性が設定できます。

このドキュメントのインデックスが、上記の META タグで作成されている場合は、検索の際、作者、作成日時、製品の各フィールドに、該当する値を入力します。たとえば、「Writer <contains> Smith」や「PubDate > 1/1/00」などのクエリを入力することができます。

ノート
META タグ付きのフィールドの属性値はすべてテキスト文字列で、日付や数値もテキストとしてソートされます。また、META タグ付きの属性に不正な HTML 文字がある場合は、ハイフンに置き換えられます。

検索の実行 (基本)

検索における主なプロセスは、検索コレクション内のデータに対するクエリの実行とその結果返されるドキュメントの一覧の表示です。iPlanet Web Server では、デフォルトで検索クエリと結果ページがインストールされ、これらを利用して検索をすばやく簡単に実行することが可能です。

サーバドキュメントは、特定の単語や属性値で検索することができ、クエリに一致するすべてのドキュメントは、検索結果として一覧表示されます。この一覧からドキュメントを選択して全体を参照することも可能です。検索の利用により、サーバ上のコンテンツに簡単にアクセスすることができます。

テキスト検索は、以下の 4 つの部分から成り立っています。

クエリの作成 - 検索条件を入力します。

検索結果の表示 - 入力した条件に一致するドキュメントが一覧表示されます。

ドキュメントの表示 - 検索結果の一覧から選択したドキュメントを表示させることができます。

ドキュメント情報コレクションの内容の表示 - 各コレクションで保持されている情報を確認することができます。

この節では、次のトピックについて説明します。

検索クエリの作成

検索結果の表示

コレクションの内容の表示

検索クエリの作成
デフォルトの検索クエリページには、標準 HTML フォーム、高度な HTML フォーム、Java ベースガイド付きアプレットの 3 つがあります。

標準検索フォームでは、まず検索の対象となるコレクションを選択し、クエリ言語演算子を使用して検索する単語やフレーズを入力します。

高度な HTML フォームでは、検索の対象となる複数のコレクションの選択、結果に使用するソートシーケンスの作成、1 ページに表示されるドキュメント数の指定 ([前へ]、[次へ] の矢印をクリックすることにより、結果ページの前後移動が可能) などのオプションを使用できます。

Java ベースガイド付き検索アプレットでは、ドロップダウンリストを利用してクエリを作成することができます。このアプレットを使用するには、ブラウザで Java を有効にしてください。

この節では、次のトピックについて説明します。

標準検索クエリフォーム

高度な HTML 検索クエリページ

ガイド付き検索アプレット

標準検索クエリフォーム
標準検索クエリフォームからは 2 種類の検索を実行することができます。サーバコレクションを検索するには、以下の操作を行います。

Web ブラウザの場所フィールドに次の URL を入力します。

http://yourServer/search

図 6.1 標準検索クエリページ

表示された検索クエリページで、[検索対象] フィールドのドロップダウンリストから検索対象となるコレクションを選択します。

[For] フィールドに検索クエリとして使用する単語またはフレーズを入力します。演算子を組み合わせて複雑なクエリを作成することもできます。検索演算子の詳細については、「クエリ演算子 (リファレンス)」を参照してください。

[検索] ボタンをクリックしてクエリを実行します。個々のサーバではなくワールドワイドウェブを検索することもできます。これを行うには、[Web を検索] ボックスを使用して [検索] をクリックします。

高度な HTML 検索クエリページ
クエリの作成では、高度な HTML 検索フォームを利用することもできます。このフォームは、複数のコレクションを検索対象とする場合や、特定の属性値で結果をソートして表示させる場合に便利です。

標準検索クエリページから高度な HTML 検索を利用するには、以下の操作を行います。

Web ブラウザの場所フィールドに次の URL を入力して標準クエリページを表示させます。

http://yourServer/search

ブラウザで Java を無効にします。これを行うには、[詳細] オプションプリファレンスメニューのコマンドを使用します。

標準検索フォームの [ガイド付き検索] をクリックして高度な HTML クエリページを表示させます。

図 6.2 高度な HTML 検索クエリページ

[For] フィールドに、検索する単語またはフレーズを入力します。演算子を組み合わせて複雑なクエリを作成することもできます。検索演算子の詳細については、「クエリ演算子 (リファレンス)」を参照してください。

属性値 (複数可) を入力して結果をその属性値に基づいてソートすることができます。デフォルトでは、昇順ソートですが、-Pubdate のように負の符号を付けることにより降順ソートにすることができます (ソートの詳細については、「結果のソート」を参照)。

検索結果ページの各ドキュメントのフィールド数や、一度に表示される数は、必要に応じて調節することができます。検索結果を一度に 1 ページに表示できない場合は、[前へ] や [次へ] ボタンを使用することにより、ほかのページにアクセスできます。

[検索対象] フィールドのドロップダウンリストを使用して検索対象となるコレクションを選択します。Ctrl キーを押しながらほかのコレクションをクリックすることにより、複数のコレクションを選択できます。1 つのクエリ内のすべてのコレクションは同じ言語である必要があります。

[検索] ボタンをクリックしてクエリを実行します。

ガイド付き検索アプレット
Java ベースガイド付き検索インターフェイスも、クエリ作成に使用することができます。このインターフェイスは、ドキュメント内の単語と特定の属性値の両方を検索する場合など、複数の要素を含むクエリを作成する場合に便利です。

ノート
ブラウザで Java が有効になっていることを確認してください。この設定には、[言語] オプションプリファレンスメニューコマンドを使用します。

ノートリンク管理やエージェントサービスの属性もリストに表示されますが、これらは Web Publisher 4.0 では使用できないため、これらの属性を選択しても有効な結果は得られません。

標準検索クエリページからガイド付き検索アプレットにアクセスするには、以下の操作を行います。

次の URL を入力して標準検索クエリページを表示させます。

http://yourServer/search

標準検索ページの [ガイド付き検索] をクリックすると、Java ベースガイド付きクエリページが表示されます。

図 6.3 ガイド付き検索クエリアプレット

[検索対象] フィールドのリストから検索対象のコレクションを選択します。

[For] ボックスの一覧から検索項目の種類を選択します。この例では、[Words] を選択します。

空白のテキストフィールドに、検索する単語を入力します。検索演算子の詳細については、「クエリ演算子 (リファレンス)」を参照してください。

[Add Line] をクリックし、クエリの最初の部分を追加します。フォームの下部にある大きなテキスト表示ボックスにその単語が表示されます。

ほかの検索項目をクエリに追加する場合は、ドロップダウンリストから該当する項目を選択します。この例では、[属性] を選択します。

フォームの右側に新しいドロップダウンリストが表示され、選択したコレクションで使用可能なすべての属性が一覧表示されます。この中から検索に使用する属性を選択します。

テキスト入力フィールドの上にあるドロップダウンリストから、クエリで使用するクエリ演算子 (Contains、Starts、Ends、Matches、Has a substring) や論理演算子 (=、<、>、<=、>=) を選択します。

空白のテキストフィールドに、検索する属性値を入力します。

[Add Line] をクリックしてクエリに行を追加します。[Undo Line] をクリックして最後に追加した行を削除、または [クリア] をクリックしてクエリ全体をクリアすることもできます。

[検索] ボタンをクリックして検索を実行します。

検索結果の表示
標準の検索結果には、検索条件に一致するすべてのドキュメントが一覧表示されたものと、その一覧から選択したドキュメントのテキストが表示されたものの 2 種類があります。

この節では、次のトピックについて説明します。

アクセス許可チェック

条件に一致するドキュメントの一覧表示

結果のソート

ドキュメントの表示

アクセス許可チェック
検索結果として返されるドキュメントは、関連する各ドキュメントやコレクションに設定されたアクセスコントロール規則によって異なります。以下の操作を行った場合は、サーバでアクセスチェックが実行されます。

各種コレクションの一部としてではなく、Web Publishing コレクションのみを検索した場合

Web Publishing コレクション以外のコレクションを検索した場合 (そのコレクションのみ、および複合コレクションの一部として検索した場合の両方を含む)

検索結果として表示されているドキュメントの URL をクリックした場合

検索クエリの単語やフレーズが強調表示される形式のドキュメントを表示するリンク (グラフィックなど) をクリックした場合

クエリに一致するドキュメントへのアクセスが、アクセスコントロール規則により制限されている場合、そのドキュメントは検索結果には表示されません。また、検索結果のドキュメントを表示するパーミッションを持っていない場合、そのドキュメントは検索結果として表示されません。

条件に一致するドキュメントの一覧表示
iPlanet Web Server のデフォルトでは、標準検索または高度な検索のいずれのクエリページで検索を実行した場合でも、検索条件に一致するドキュメントが一覧表示されます。この一覧では、コレクションの形式に応じて、各ファイルの一般的な情報が表示されます。たとえば、電子メールコレクションのデフォルトの結果ページでは、各エントリに対して subject、to、from、date が、ニュースコレクションのページでは、subject、from、date が表示されます。

図 6.4 検索結果の例

検索に使用できるデフォルトの属性は、コレクションに含まれるファイル形式の種類によって異なります。各形式に対する属性の詳細については、「

コレクションの属性について」およびその節の表 6.1 を参照してください。

単語間の近接度の比較や、完全に一致する単語をチェックする検索の結果エントリでは、ファイルの一致度を得点で表して順位を付けることが可能です。

条件に一致するドキュメントを 1 ページに表示できない場合は、[次へ] をクリックして次のページを表示させることができます。新しいクエリデータを入力して[検索] をクリックすることにより、新しい検索を任意に実行できます。

結果のソート
デフォルト、または高度な HTML クエリページの [ソート] フィールドに何も入力しなかった場合は、検索条件に一致するすべてのドキュメントが、一致度の高い順 (これが可能なクエリの場合)、またはサーバファイルデータベースにおける位置 (一致度を表示できないクエリの場合) に応じて表示されます。

[ソート] フィールドに属性名を入力した場合は、ドキュメントが昇順で表示されます。ドキュメントの一覧を降順で表示する場合は、「-keywords」や「-title」のように属性値の前に負の符号 (-) を付けます。また、「Author,-PubDate」など複数のフィールドに入力して、複数の属性値に基づくソートも可能です。

短いクエリでは、通常、ソート順は重要ではありませんが、非常に多くの検索結果が返される可能性があるクエリでは、有効な結果を得るために必要に応じてソート値を設定します。ただし、特殊なソートシーケンスを使用した場合は、検索効率に影響することがあります。

ノート
META タグ付きフィールド内の属性値はテキスト文字列で、日付や数値もテキストとしてソートされます。値を日付や数値に変換するには、[Web Publishing|Add Custom Property] フォームで新しいプロパティを作成し、このプロパティを META タグ付き属性にするチェックボックスをオンにします。

ドキュメントの表示
デフォルトで iPlanet Web Serverをインストールした場合は、検索条件に一致するドキュメントの一覧表示から、1 つのドキュメントを選択して Web ブラウザで表示できます。ブラウザでは、ドキュメントを元の形式まま、または色、ボールド、点滅などのテキスト属性を使用して検索クエリの単語やフレーズが強調表示される形式で表示することができます。

ドキュメントを元の形式のまま表示するには、そのドキュメントへの URL を含むハイパーテキストリンクをクリックします。そのドキュメントが HTML に変換されている場合は、その場所がこの URL で指定されます。このリンクをクリックすることにより、外部ビューアが起動し、ドキュメントが元の形式で表示されます。

強調表示された形式のドキュメントを表示するには、検索結果のドキュメントエントリの横にあるグラフィックをクリックします。

コレクションの内容の表示
コレクションデータベースでは、データベース内の内容を表示して各コレクションに設定されている属性を確認することができます。ただし、非表示で定義されている一部のコレクションは表示されません。通常、コレクションの内容には、以下の項目が含まれます。

コレクション名、ラベル、説明

コレクションの形式

コレクション内の属性の数および属性名の一覧

コレクション内のドキュメント数

コレクションのサイズとステータス

言語および文字セット

日付の入力形式と出力形式

コレクションデータベースの内容を表示するには、Web ブラウザの場所フィールドに次の URL を入力します (スペースは含まない)。

http://yourServer/search?NS-search-page=c

クエリ演算子の使用

効果的な検索を行うには、クエリ演算子の使用方法を理解する必要があります。検索では、ブール値検索のみが可能なため、ここではブール値検索規則に基づいて説明します。

ノート
クエリ言語では、大文字小文字は区別されませんが、例では、わかりやすくするために大文字を使用します。

検索エンジンは、シンタックスに基づいて検索クエリを解釈します。たとえば、region と入力した場合は、region という単語に加え、語幹が一致する単語 (regions や regional など) も検出されます。検索結果は、「重要度」に応じて、入力した検索条件に一致する順に順位が付けられます。上の例では、region が、最も一致度が高い順位になります。

すべてのクエリで、結果が順位付けされるわけではありません。たとえば、指定された文字列がフィールドの値と一致するかどうかをチェックするクエリでは、順位付けは行われず、文字列が値と一致するかどうかのみがチェックされます。また、ある文字列がフィールドに含まれているかどうか、またはフィールドの先頭や末尾がその文字列になっているかかどうかをチェックする場合も同様に行われません。

この節では、次のトピックについて説明します。

デフォルト時の解釈

検索規則

使用する演算子の決定

クエリ演算子 (リファレンス)

ワイルドカードの使用

デフォルト時の解釈
検索クエリ言語には、入力された値の解釈方法を命令するデフォルト値や仮定が用意されています。このデフォルトは、使用しないことも可能です。ここでは、検索エンジンが条件に一致する検索結果を選択する仕組みを説明します。

<STEM> - 語幹が一致するものも含め検索する単語やフレーズを含むすべてのドキュメントが検出されます。検索エンジンでは、単語の綴りのみではなく、意味もチェックするため、たとえば、plan という単語を検索する場合、planning や plans を含むドキュメントは検索結果になりますが、plane や planet を含むドキュメントは検出されません。

<MANY> - 検索した単語やフレーズが、検索結果のドキュメント内でどの程度使用されるか (適合度) に基づいて、結果が順位付けされます。

<PHRASE> - スペースで区切られた単語はフレーズの一部として解釈されます。たとえば、Monterey otter はフレーズで、かつ 2 つの単語は連続して記載されているものと解釈されます。この検索方法では、sea otter や Monterey Bay などを含むドキュメントは検出されません。

ノート
2 つの単語をフレーズとして解釈するべきかどうかが明確でない場合は、丸括弧で囲んで区別することができます。たとえば、
<PHRASE> (rise "and" fall) などです。

OR - クエリ内の各単語やフレーズがカンマで区切られている場合は、少なくともどちらか一方を含むドキュメントが検出されます。つまり、これは実質上 OR 演算です。たとえば、Monterey, otter は、Monterey または otter のいずれかを含むドキュメントを検出するものとして解釈されます。OR には、山かっこ (<>) は必要ありません。

検索規則
複雑な検索クエリを作成するには、クエリ演算子の組み合わせ、クエリシンタックスの操作、ワイルドカード文字の使用などが可能です。

この節では、次のトピックについて説明します。

山かっこ

演算子を組み合わせる

クエリ演算子を検索する単語として使用する

完全に一致する単語のみ検索する

演算子の変更

山かっこ
AND、OR、NOT の各演算子、および日付や数値の比較演算子を除くすべてのクエリ演算子は、<CONTAINS>や <WILDCARD>などのように山かっこで囲む必要があります。

演算子を組み合わせる
1 つのクエリで複数の演算子を使用することにより、正確な結果を得ることができます。たとえば、次のクエリを入力した場合は、Bay と Monterey を含み、Aquarium は含まないドキュメントが検出されます。

Monterey AND Bay NOT <CONTAINS> Aquarium

フレーズを含めることにより、さらに正確な検索結果を得ることができます。次のクエリでは、Monterey Bay Aquarium というまとまったフレーズと otters という単語を含み、shark は含まないドキュメントが検出されます。

Monterey Bay Aquarium AND otter AND NOT shark

クエリ演算子を検索する単語として使用する
すべてのクエリ演算子は、検索する単語として使用できますが、その場合は、演算子を引用符で囲みます。たとえば、次のクエリでは、潮の満ち引き (ebb and flow) という 1 つのフレーズを含むドキュメントを検索できます。

<CONTAINS> ebb "and" flow

完全に一致する単語のみ検索する
単語を引用符で囲むことにより、語幹一致単語の検索機能をオフにすることができます。たとえば、次のクエリを使用した場合は、完全に一致する単語のみ検索されます。

"plan"

この検索の場合は、plan と完全に一致する単語を含むドキュメントのみが検出され、plans や planning などを含むドキュメントは無視されます。

演算子を変更する
AND、OR、NOT の各演算子を使用し、ほかの演算子を変更することもできます。たとえば、theme park というフレーズが含まれるタイトルのあるドキュメントを検索から除外する場合は、次のようなクエリを使用します。

Title NOT <CONTAINS> theme park

使用する演算子の決定
使用する演算子を決定する際には、以下を参照してください。クエリ言語では、大文字小文字は区別されないため、<starts> と <STARTS> は同じものとして扱われます。このドキュメントでは、わかりやすくするために大文字を使用します。

表 6.1 使用する演算子の決定


検索のタイプ	有効な演算子	例
日付や数値を比較してドキュメントを検索	等しい (=)、より大きい (>)、～以上 (>=)、より小さい (<)、～以下 (<=)	DATE >= 06-30-99 1999 年 6 月 30 日以降に作成されたドキュメントを検索します。
特定のドキュメントフィールドやそのフィールド内の特定の位置にある単語やフレーズを検索	<STARTS>、 <CONTAINS>、 <ENDS>、等しい (=)	Title <STARTS> Help Help で始まるタイトルがあるドキュメントを検索します。
ドキュメント内の複数の単語を検索	AND、 <NEAR/1>	specifications AND review specifications と review の両方を含むドキュメントを検索します。

クエリ演算子 (リファレンス)
次の表では、一般的に使用される演算子の説明と、その使用例を記載します。特に明記していない限り、使用頻度の高い順に並んでいます。 表 6.2 クエリ言語の演算子


演算子	説明	例
AND	検索条件を追加します。指定した単語をすべて含むドキュメントを検索します。	Antarctica AND mountain climb Antarctica と mountain climb の両方に加え、mountain climbing など、語幹が一致するものの変形も含むドキュメントを検索します。
<CONTAINS>	ドキュメントフィールド内で指定した単語を含むドキュメントを検索します。単語の語順は、ドキュメント内で使用されている語順と完全に一致する必要があります。英数字を検索する場合は、ワイルドカードを使用できます。一致度によるドキュメントの順位付けは行われません。	Title <CONTAINS> higher profit タイトルにhigher profit というフレーズが含まれるドキュメントを検索しますが、profits higher を含むドキュメントは無視されます。
<ENDS>	ドキュメントフィールドが、指定された文字列で終わっているドキュメントを検索します。一致度による順位付けは行われません。	Title <ENDS> draft draft という文字列で終わるタイトルのドキュメントを検索します。
等しい (=)	ドキュメント内の任意フィールドが特定の日付や数値と一致するドキュメントを検索します。	Created = 6-30-99 1999 年 6 月 30 日に作成されたドキュメントを検索します。
より大きい、またはより後 (>)	ドキュメント内の任意のフィールドが特定の日付より後のものである、または特定の数値よりも大きいドキュメントを検索します。	Created > 6-30-99 1999 年 6 月 30 日より後に作成されたドキュメントを検索します。
～以上、または以降 (>=)	ドキュメント内の任意のフィールドが特定の日付以降、または特定の数値以上であるドキュメントを検索します。	Created >= 6-30-99 1999 年 6 月 30 日以降に作成されたドキュメントを検索します。
より小さい、またはより前 (<)	ドキュメント内の任意のフィールドが特定の日付より前である、または特定の数値未満であるドキュメントを検索します。	Created < 6-30-99 1999 年 6 月 30 日より前に作成されたドキュメントを検索します。
～以下、または～以前 (<=)	ドキュメント内の任意のフィールドが特定の日付以前である、または特定の数値以下であるドキュメントを検索します。	Created <= 6-30-99 1999 年 6 月 30 日以前に作成されたドキュメントを検索します。
<MATCHES>	ドキュメントフィールド内の文字列が指定した文字列に一致するドキュメントを検索します。文字列の一部のみが一致する場合、そのドキュメントは無視されます。一致度による順位付けは行われません。	<MATCHES> employee employee あるいは employees などの語幹が一致する単語の変形を含むドキュメントを検索します。
<NEAR>	指定した単語を含むドキュメントを検索します。ドキュメント内での単語の場所が近いほど、そのドキュメントの得点は高くなります。	stock <NEAR> purchase stock と purchase の両方を含むドキュメントをすべて検索しますが、stock purchase を含むドキュメントは purchase supplies and stock up を含むドキュメントより得点が高くなります。
<NEAR/N>	指定した複数の単語がお互いに N 単語以内の場所にあるドキュメントを検索します。N には 1000 以下の整数を使用します。また、ドキュメントは、単語の近接度に応じて順位付けされます。	stock <NEAR/1> purchase stock purchase と purchase stock のフレーズを含むドキュメントを検索します。 purchase supplies and stock up というフレーズを含むドキュメントは、stock と purchase が隣接していないため無視されます。 N が 2 以上の場合は、その単語がその範囲内に含まれるドキュメントが検出され、ドキュメント内での単語の位置が近いものほどドキュメントの得点は高くなります。
NOT	特定の単語やフレーズを含まないドキュメントを検索します。ノート: NOT を使用して OR 演算子や AND 演算子を変更することができます。	surf AND NOT beach surf という単語は含み、beach という単語は含まないドキュメントを検索します。
OR	検索条件を追加します。検索条件のいずれかを含むドキュメントをすべて検索します。	apples OR oranges apples または oranges のいずれかを含むドキュメントを検索します。
<PHRASE>	指定したフレーズを含むドキュメントを検索します。フレーズとは、一定の順序で並べられた複数の単語がグループ化されたものです。	<PHRASE> (rise "and" fall) rise and fall というフレーズ全体を含むドキュメントを検索します。and が引用符で囲まれているのは、検索の際に、この単語を演算子ではなくリテラルとして解釈させるためです。
<STARTS>	ドキュメント内の任意のフィールドが特定の文字列で始まるドキュメントを検索します。一致度による順位付けは行われません。	Title <STARTS> Corp Corporate や Corporation など、Corp で始まるタイトルを含むドキュメントを検索します。
<STEM> (英語のみ)	指定した単語とその変形を含むドキュメントを検索します。	<STEM> plan plan、plans、planned、planning など、同語幹の変形を含むドキュメントを検索します。綴りが類似していても意味が異なる planet や plane などの単語は無視されます。
<SUBSTRING>	ドキュメント内のフィールドで指定した文字列の一部あるいは全部に一致する文字列を含むドキュメントを検索します。 <MATCHES> と類似していますが、部分的に一致する場合でも検索できます。ワイルドカードは使用できません。一致度による順位付けは行われません。	<SUBSTRING> employ employ に完全に一致、またはその一部と一致するドキュメントを検索するため、ploy も検索の対象となります。ノート: この演算子は、リテラルにのみ使用できます。web* と入力した場合、アスタリスクは、ワイルドカードとして認識されず、"web*" と全く同じ文字列のみ検出されます。
<WILDCARD>	検索文字列にワイルドカードを使用してドキュメントを検索します。綴りは類似しているが、語幹が一致する単語の検索では検出されないものを検索する場合に使用します。 * や ? などの文字を使用した場合は、ワイルドカード検索であると自動的に認識されるため、<WILDCARD> という演算子を使用する必要はありません。	<WILDCARD> plan* plan、plane、planet をはじめ、planned、plans、planetopolis など、plan で始まる単語を含むドキュメントを検索します。詳細および例については、次の節を参照してください。
<WORD>	指定した単語を含むドキュメントを検索します。	<WORD> theme theme、thematic、themes をはじめ、theme と語幹が一致する変化形を検索します。

ワイルドカードの使用
ワイルドカードを使用することにより、特殊な場合にも対応することができます。綴りが類似しているが、語幹一致単語の変形ではない単語を含むドキュメントの検索も可能です。たとえば、plan の語幹一致単語には plans や planning などがありますが、plane や planet などは同語幹の単語ではありません。ワイルドカードを使用した場合は、これらの単語すべてを検索できます。

* や ? など一部の文字は、ワイルドカードを使用した検索であると自動的に認識されるため、式の中に <WILDCARD> という演算子を使用する必要はありません。 表 6.3 ワイルドカード演算子


文字	説明
*	0 個以上の英数字を指定します。たとえば、air* とした場合は、air、airline、airhead などを含むドキュメントを検索します。このワイルドカードは、式の最初の文字として使用することはできません。このワイルドカードは、角かっこ ([ ]) 内や中かっこ ({ }) 内にある場合は無視されます。このワイルドカードでは、<WILDCARD> 演算子を使用する必要はありません。
?	1 文字の英数字の代用として使用しますが、複数の ? を使用して文字列を指定することもできます。たとえば、?at とした場合は、cat や hat などを含むドキュメントを検索し、??at とした場合は、that や chat などを含むドキュメントを検索します。このワイルドカードが、角かっこ ([ ]) 内や中かっこ ({ }) 内にある場合は無視されます。このワイルドカードでは、<WILDCARD> 演算子を使用する必要がありません。
{}	各パターンをカンマで区切って列挙し、その中から該当するものを検索します。たとえば、 <WILDCARD> `Chat{s, ting, ty}` とした場合、chats、chatting、chatty を含むドキュメントを検索します。文字列全体は、バッククオーツ (`) で囲み、スペースは使用しません。
[ ]	検出される文字列になり得る文字のセットを囲みます。たとえば、 <WILDCARD> `[chp]at` とすると、cat、hat、pat という単語を含むドキュメントを検索します。文字列全体は、バッククオーツで囲み、スペースは使用しません。
^	（検索対象の）集合から除外する 1 つ以上の文字を指定します。たとえば、<WILDCARD> `C[^io]t` とした場合、cat や cut を含むドキュメントは検索されますが、cot を含むものは検索されません。カレット (^) は左角かっこのすぐ後に使用します。
-	集合内の文字の範囲を指定します。たとえば、<WILDCARD> `Ch[a-j]t` とした場合は、chat から chjt までの任意の 4 文字を含むドキュメントを検索します。

ワイルドカードをリテラルとして使用
*or? の式のように、通常はワイルドカードとして使用する文字を検索する場合が考えられます。ワイルドカードをリテラルとして使用するには、その前にバックスラッシュ (システムによっては円記号) を付けます。アスタリスクの場合は、バックスラッシュ (円記号) が 2 つ必要です。たとえば、Zine*** というタイトルの雑誌を検索するには、次のように入力します。

<WILDCARD>Zine\\*\\*\\*

一部の文字は、検索エンジンで特殊な検索文字として認識されるため、リテラルとして解釈させるにはバッククオーツを使用する必要があります。特別な検索文字は以下のとおりです。

カンマ ,

左右のかっこ ( )

二重引用符 "

バックスラッシュ (円記号) \

アットマーク @

左中かっこ {

左角かっこ [

バッククオーツ ` (ノート: バッククオーツは、サーバ管理者がこれをリテラルとして設定している場合のみ、リテラルと認識されます。)

たとえば、文字列 "a{b" を検索する場合は、次のように入力します。

<WILDCARD>`a{b`

また、バッククオーツを含む文字列 "c`t" を検索する場合は、次のように入力します。

<WILDCARD>`c``t`