"管理者ガイド": 検索機能の使用

コンフィグレーションファイル
検索を管理するコンフィグレーションファイルは次のとおりです。

コンフィグレーションファイル

属性の最大数の調整

索引作成用のメモリの制限

索引ファイルサイズの制限

Web パブリッシングコレクションへのアクセスの削除

webpub.confこのシステムコンフィグレーションファイルには、システム設定およびファイルのパスが保存されます。サーバの obj.conf ファイルでは、検索システムの初期化が webpub.conf ファイルにマッピングされます。 [Search Configuration] および [Search Pattern Files] ウィンドウを使うと、入力したデータが webpub.conf ファイルに反映されます。webpub.conf ファイルの設定を変更することによってサーバの検索設定をカスタマイズすることもできますが、通常は、iPlanet Web Server のウィンドウから必要な変更を行うことができます。

userdefs.iniこのユーザ定義ファイルでは、ユーザ定義のパターン変数が定義されます。webpub.conf ファイルでは、このパターン変数が、使う言語 (英語、ドイツ語、日本語など) の userdefs.ini ファイルにマッピングされます。

検索インターフェイスをカスタマイズするには、パターンファイル全体で使用できる userdefs.ini ファイルで独自のパターン変数を作成および定義します。詳細については、ユーザ定義のパターン変数を参照してください。

dblist.iniこのコレクションコンテンツファイルには、コレクション固有の情報が記述されます。コレクションを作成および管理する場合、dblist.ini ファイルは、コレクションに関する情報によって更新されます。

属性の最大数の調整
コレクションには、ファイル形式によって異なるさまざまなデフォルト属性セットがあります。たとえば、HTML ファイルには Title や SourceType があります。また、HTML ファイルに META タグ付きのHTML 属性を定義することもできます。PDFのように、非常に多くのデフォルト属性を持つファイル形式もあります。各ファイル形式の属性の詳細については、コレクションの属性についてと表 16.2 を参照してください。

[Add Custom Property] ウィンドウを使って、Web パブリッシングコレクションにプロパティを追加することができます。次に、デフォルトの最大設定を示します。

テキスト (最大数 30、すべての META タグ付きの属性を含む)

数値 (最大数 5)

日付 (最大数 5)

これらの最大設定は webpub.conf ファイルで変更することができますが、属性のセットが大きくなると、サーバのパフォーマンスに悪影響を与えます。テキストに 100 を超える最大数、日付および数値に 50 を超える最大数を設定することはできません。

設定を変更するには、webpub.conf ファイルの [NS-loader] セクションを手作業で編集して、属性の最大数を定義する必要があります。たとえば、3 つの値すべてを変更するには、次の行を使うことができます。

NS-max-text-attr = 50
NS-max-numeric-attr = 10
NS-max-date-attr = 10

ノート 追加の属性を既存のコレクションで使うことはできません。後で作成したコレクションでのみ使用できます。検索コレクションで追加の属性を使うには、[Maintain Collection] ウィンドウ ([Search] を選択して [Maintain Collection] リンクをクリックする) を使ってコレクションを削除してから、[New Collection] ウィンドウ ([New Collection] リンクをクリックする) を使って新しいコレクションを作成する必要があります。Web パブリッシングコレクションで新しい属性を使う場合は、ファイルシステムを使って、検索コレクションディレクトリから web_htm と link_mgr の両方のコレクションファイルを削除した後、サーバを再起動する必要があります。

索引作成用のメモリの制限
索引作成操作に使用可能な RAM の量に制限を設定することができます。そのためには、webpub.conf ファイルの [NS-loader] セクションを手作業で編集して、最大のメモリ量を定義する行を追加する必要があります。たとえば、次のような行を追加します。

NS-max-memory = 32000000

デフォルトでは、システムで提供できる使用可能なすべてのメモリをサーバで使うように設定されています。索引作成に使われる RAM を制限する必要がある最も一般的なケースは次のとおりです。

サーバが、推奨最低条件である RAM が搭載されていないマシンにインストールされている場合。

Windows NT サーバのサーバ管理者が、大量の索引を作成する必要があるが、他のサーバ操作用にメモリを取っておきたい場合。

索引ファイルサイズの制限
索引ファイルに使用可能なディスク容量を制限することができます。そのためには、webpub.conf ファイルの [NS-loader] セクションを手作業で編集して、索引ファイルの最大サイズを定義する必要があります。たとえば、次のように定義します。

NS-max-idx-file-size = 1500000

通常、索引作成操作には、1 ファイルあたり約 1.5MB のディスク容量が必要です。1 つの一時ファイルを含む 2 つのファイルがあるので、索引作成には 3MB のディスク容量が必要になります。ファイルサイズを 1 ファイルあたり 1.5MB に設定すると、各ファイルの最大サイズが制限されます。

Web パブリッシングコレクションへのアクセスの削除
Web パブリッシングは、ユーザの標準検索クエリページの [Search In] フィールドに表示されます。このフィールドから Web パブリッシングコレクションを削除するには、次のように dblist.ini ファイルを編集する必要があります。

[web_htm] セクションで、"NS-display-select=YES" を "NS-display-select=NO" に変更します。

サーバを再起動します。

ドキュメントの索引作成

ユーザが検索を実行するには、検索の対象にすることができる検索可能なデータのデータベースが必要です。そのためには、コンテンツおよびファイルのプロパティなどのドキュメントに関する情報に索引を作成して保存するコレクションと呼ばれるデータベースを作成します。

検索には、検索を実行するファイルのコレクションが必要です。ドキュメントに索引が作成されると、タイトル、作成日、作成者などのコンテンツおよびファイルのプロパティが検索に使用可能になります。

コレクションからドキュメントを追加または削除することができます。必要に応じて、コレクションを最適化、更新、および管理することもできます。

ノート Web パブリッシングコレクションが存在しないか、または削除されていると、検索は機能しません。検索が機能しない場合は、Web パブリッシング機能をオンにして (デフォルト) サーバを再起動し、もう一度検索を行ってください。

コレクションについて
サーバ管理者がすべてまたは一部のサーバのドキュメントに索引を作成すると、そのドキュメントに関する情報がコレクションに保存されます。コレクションには、ドキュメントの形式、ドキュメントで使われる言語、検索可能な属性、コレクション内のドキュメント数、コレクションの状態、コレクションの簡単な説明などの情報が含まれます。詳細については、コレクションコンテンツの表示を参照してください。

コレクションについて

コレクションの属性について

新規コレクションの作成

コレクションの設定

コレクションの更新

コレクションの管理

定期的な管理のスケジューリング

コレクション管理スケジュールの削除

コレクションを作成する場合は、HTML、ASCII、ニュース、電子メール、PDF、複数の形式などのファイルの種類を指定します。これによって、どの属性に索引を作成するか、どういったファイル変換 (ある場合) を行う必要があるかなど、索引作成時に行われる操作が決まります。インストールしたkeyview フィルタがある場合、複数の形式によるコレクションのファイルは HTML に変換されます。詳細については次を参照してください。

http://www.keyview.com

ディレクトリ内のすべてのファイル、または HTML、PDF、*.doc ドキュメントなど、特定の拡張子が付いているファイルにのみ索引を作成することができます。

コレクションには、索引が作成されている各ドキュメントに関する情報を含むレコードがあります。ドキュメントがコレクションから削除される場合、そのドキュメントのコレクションのエントリのみが削除されます。元のドキュメントは削除されません。

複数のサーバインスタンスがある場合、作成するコレクションは、そのコレクションが作成されたサーバインスタンスのみに関連付けられます。したがって、ユーザは、そのサーバインスタンスのコレクションしか検索することができません。

コレクションの属性について
表 16.2 のように、特定のファイル形式には、そのタイプのファイル用に索引が作成される属性のデフォルトのセットがあります。

表 16.2 各ファイル形式用に索引が作成されるデフォルトの属性


ファイル形式	属性	種類	説明
ASCII	(なし)	-	-
HTML	Title	テキスト	ファイルのユーザ定義のタイトル
	SourceType	テキスト	ドキュメントの元の形式。Web パブリッシングおよびその他の複数形式のコレクションで使われます。
ニュース	From	テキスト	ニュース項目の発信元ユーザ ID
	Subject	テキスト	ニュース項目の件名フィールドのテキスト
	Keywords	テキスト	ニュース項目に定義されているキーワード
	Date	日付	ニュース項目が作成された日付
電子メール	From	テキスト	電子メールの発信元ユーザ ID
	To	テキスト	電子メールの送信先ユーザ ID
	Subject	テキスト	電子メールの件名フィールドのテキスト
	Date	日付	電子メールが作成された日付
PDF	InstanceID	テキスト	内部 ID 番号
	PermanentID	テキスト	内部 ID 番号
	NumPages	整数	ドキュメント内のページ数
	DirID	テキスト	PDF ファイルが存在するディレクトリ
	FTS_ModificationDate	日付	ドキュメントの最終変更日
	FTS_CreationDate	日付	ドキュメントの作成日
	WXEVersion	整数	PDF ドキュメントからテキストを抽出するために使われた Adobe Word Finder のバージョン
	FileName	テキスト	Adobe のファイル名の仕様
	FTS_Title	テキスト	ドキュメントのタイトル
	FTS_Subject	テキスト	ドキュメントの件名
	FTS_Author	テキスト	ドキュメントの著者
	FTS_Creator	テキスト	ドキュメントの作成者
	FTS_Producer	テキスト	ドキュメントの生産者
	FTS_Keywords	テキスト	ドキュメントのキーワード
	PageMap	テキスト	ページの単語のインスタンスを記述するページマップ

デフォルトでは、HTML コレクションには Title および SourceType 属性がありますが、HTML <META> タグが付けられた最大 30 のファイル属性を検索してソートできるように索引を作成することができます。属性の最大数の調整で説明したように、ファイル属性の最大設定は webpub.conf で変更することができます。

たとえば、ドキュメントには次のような HTML コードの行があります。

このドキュメントが、抽出された META タグを使って索引が作成されていれば、Writer または Product フィールドの特定の値を検索することができます。たとえば、Writer <contains> Hunter または Song <contains> Blueのようなクエリの入力が可能です。

ノート META タグ付きのフィールド内の属性値はテキスト文字列のみです。つまり、日付および数値は、日付や数値としてではなくテキストとして保存されます。また、META タグ付きの属性内の不正な HTML 文字は、ハイフンで置換されます。[Add Custom Property] ウィンドウ ([Web Publishing] を選択して [Add Custom Property] リンクをクリックする) を使って、テキスト形式の日付および数値を再定義すると、Web パブリッシングコレクション内のデータの実際の日付および数値に基づいて検索を実行することができます。

新規コレクションの作成
ディレクトリ内のすべてまたは一部のファイルのコンテンツに索引が作成されるコレクションを作成することができます。1 種類のファイルのみを含むコレクションを定義したり、索引作成時に自動的に HTML に変換されるさまざまな形式のドキュメントのコレクションを作成したりすることができます。自動変換オプションを設定して複数の形式のコレクションを定義する場合は、まずインデクサーでドキュメントを HTML に変換してから、HTML ドキュメントのコンテンツの索引を作成します。変換された HTML ドキュメントは、サーバの検索コレクションフォルダ内の html_doc ディレクトリに格納されます。

サーバで所有できるのは 12 個のコレクションのみで、そのうち Web パブリッシングを使うサーバのユーザ定義コレクションは、10 個以下に制限されています。13 個目のコレクションを使う場合は、既存のコレクションのいずれかを削除する必要があります ([Search] を選択して [Maintain Collection] をクリックする)。サーバにある Web パブリッシングコレクションは削除しないでください。

コレクション内には最大 1,600 万個のドキュメントのエントリを所有することができます。複数のコレクションで索引が作成されているドキュメントは、複数のドキュメントとして数えます。10,000 個以上のドキュメントを持つ新しいコレクションを作成する場合は、トラフィックが少ないときに作成することをお勧めします。そうしないと、索引作成操作によってシステムのパフォーマンスに影響が生じます。

ノート コレクションを作成するには、システムに最低 3MB の使用可能なディスク容量が必要です。索引ファイルのサイズを制限する方法の詳細については、索引ファイルサイズの制限を参照してください。

新規コレクションを作成するには、次の手順を実行します。

[Server Manager] から [Search] を選択します。

[New Collection] リンクをクリックします。

[Create a Collection] ウィンドウが表示されます。[Directory to Index] フィールドには、現在定義されているドキュメントのディレクトリが表示され、サーバに定義されているすべてのアディショナルドキュメントディレクトリのドロップダウンリストが提供されます。アディショナルドキュメントディレクトリの詳細については、URL のマッピングを参照してください。

索引を作成するディレクトリを検索するには、まず、ドロップダウンリスト内の任意の項目を選択します。

異なるサブディレクトリの索引を作成する場合、[View] ボタンをクリックして、リソースのリストを表示します。

一覧表示されるディレクトリの索引を作成したり、表示されるディレクトリ内のサブディレクトリを表示して、そのうちの 1 つに索引を作成したりすることができます。ディレクトリの索引リンクをクリックすると、[Create Collection] ウィンドウに戻り、そのディレクトリ名が [Directory to Index] フィールドに表示されます。

選択したディレクトリ内のすべての HTML ファイルに索引を作成するには、[Documents matching] フィールドのデフォルトの *.html パターンをそのままにするか、またはワイルドカード式を定義して、そのパターンに一致するドキュメントのみに索引を作成するように設定します。

たとえば、「*.html」と入力して、.html 拡張子を持つドキュメント内のコンテンツのみに索引を作成することができます。または次のパターンのいずれかを使って (カッコで終了する)、すべての HTML ドキュメントに索引を作成することもできます。

(*.htm|*.html または *(.htm|.html)

1 つの式の中に複数のワイルドカードを定義することができます。ワイルドカードパターンのシンタックスの詳細については、ワイルドカードの使用を参照してください。

名前にセミコロン (;) が含まれるファイルには索引を作成することができません。そのようなファイルは、名前を変更してから索引を作成します。

指定したディレクトリ内のサブディレクトリに索引を作成するには、[Include Subdirectories] をクリックします。

[Collection Name] フィールドにコレクションの名前を入力します。

コレクション名はコレクションの管理に使われます。これは、ファイルの物理ファイル名なので、ご使用のオペレーティングシステムの標準のディレクトリ命名規則に従ってください。最大 128 文字の任意の文字を使うことができます。スペースは下線に変換されます。

コレクション名にはアクセント記号付き文字を使わないでください。アクセント記号付き文字が必要な場合、コレクション名からはアクセント記号を除外しますが、ラベルにはアクセント記号付き文字を使います。ラベルとは、検索インターフェイスからユーザに表示される内容です。

オプションの [Collection Label] フィールドに、コレクションのユーザ定義名を入力します。

この名前は、ユーザがテキスト検索インターフェイスを使う場合に表示されます。コレクションのラベルは、できるだけ説明的で意味があるものにしてください。シングルクオートまたはダブルクオートを除く、最大 128 文字の任意の文字を使うことができます。

オプションの [Description] フィールドに、最大 1024 文字のコレクションの説明を入力します。

この説明は、コレクションのコンテンツページに表示されます。

ASCII、HTML、ニュース、電子メール、または PDF の中から、コレクションを保存するファイルの種類を選択します。

選択したファイル形式の種類は、コレクションで使われるデフォルトの属性、およびコンテンツの自動 HTML 変換がある場合、索引作成の一部として実行されることを示します。各形式の属性の詳細については、表 16.2 とコレクションの属性についてを参照してください。

ファイルの種類として HTML を選択し、HTML 以外のファイルにも索引を作成しようとすると、サーバによってデフォルト属性の HTML セットを含むコレクションが作成され、索引を作成する HTML 以外のファイルの変換は試行されません。 HTML ファイルを ASCII コレクションに索引を作成した場合、ファイルのコンテンツの一部として HTML のマークアップタグにまで索引が作成され、ファイルを表示すると、コンテンツが生のテキストとして表示されます。選択したファイルの種類に関係なく、ファイルのコンテンツには常に索引が作成されます。

パスワードで保護されていたり、グラフィカルナビゲーション要素が含まれている複雑な PDF ファイルは、複数の形式によるコレクションの一部として索引が作成されていると正常に変換されません。PDF 形式のみのコレクションの一部である場合、ファイルデータは正常に変換されます。ただし、グラフィック要素は変換されません。

索引作成時に HTML ファイルから META タグ付きの属性を抽出するかどうかを選択します。

これらの属性を抽出すると、それらの値の検索が可能になります。1 つのドキュメント内で異なるユーザ定義の最大 30 個の META タグに索引を作成することができます。このオプションは、HTML コレクションにのみ使うことができます。

ドロップダウンリストからコレクションの言語を選択します。

デフォルトは英語であり、[English (ISO-8859-1)] というラベルが付いています。文字セットの詳細については、サーバのコンテンツ管理を参照してください。

[OK] をクリックして、新規コレクションを作成します。

ノート コレクションの索引作成をいったん開始すると、索引作成が完了するか、またはシステムを再起動するまで処理を中止することはできません。サーバをシャットダウンしても、処理は強制終了されません。

コレクションの設定
最初にコレクションを作成した後、コレクションの設定を変更することができます。このデータは、コレクション情報ファイル dblist.ini にあり、コレクションを再設定すると、dblist.ini ファイルが更新されて、変更内容が反映されます。コンフィグレーションファイルの詳細については、手作業によるファイルの設定を参照してください。説明の修正、ラベルの変更、およびドキュメントへの異なる URL の定義を行うことができます。さらに、表示されるドキュメント内での強調表示の方法、使うパターンファイル、および日付のフォーマット方法を定義することもできます。

ノート このウィンドウを使うと、実際のコレクションデータは変更しないので、Web パブリッシングのデフォルトのコレクション web_htm の設定を変更することができます。このコレクションの設定を不必要に変更しないでください。

コレクションを設定するには、次の手順を実行します。

[Server Manager] から [Search] を選択します。

[Configure Collection] リンクをクリックします。

[Configure Collection] ウィンドウが表示されます。

オプションの [Description] フィールドに、最大 1024 文字のコレクションの説明を入力することができます。

オプションの [Collection Label] フィールドに、コレクションのユーザ定義の名前を入力することができます。

これは、ユーザがテキスト検索インターフェイスを使う場合に表示されます。コレクションのラベルは、可能な限り説明的で意味があるものにしてください。シングルクオートまたはダブルクオートを除く、最大 128 文字の任意の文字を使うことができます。

変更されている場合は、[URL for Documents] フィールドにコレクションのドキュメントの新しい URL マッピングを入力することができます。

つまり、URL マッピング /publisher/help によって定義されているディレクトリに対応するファイルのディレクトリに索引を作成し、より簡単な/helpFiles にマッピングを変更する場合、このフィールドで / publisher/help を /helpFiles に置き換えます。アディショナルドキュメントディレクトリの詳細については、URL のマッピングを参照してください。

[Highlight Begin] および [Highlight End] フィールドに、表示されるドキュメントで検索クエリの単語またはフレーズを強調表示するときにサーバで使う HTML タグを入力することができます。

デフォルトでは、<b> および </b> タグを使った太字を使いますが、それに追加したり、変更したりすることができます。たとえば、<blink><FONT COLOR = #FF0000> と、対応する </blink></FONT> を追加すると、赤字のテキストを点滅させて強調表示することができます。

検索結果を表示するためのさまざまなデフォルトのパターンファイル、つまり検索結果のヘッダ、フッタ、およびリストのエントリ行のそれぞれのフォーマット方法を定義することができます。

最初にパターンファイルは
server_root\plugins\search\ui\text にあります。

[Result Pattern File] フィールドに、検索結果リスト内の強調表示された 1 つのドキュメントを表示するときに使うパターンファイルの名前を入力することができます。

[Date Format] フィールドで、このコレクションを使うときの入力日付の変換方法を指定することができます。 [MM/DD/YY]、[DD/MM/YY]、または [YY/MM/DD] から選択します。

[OK] をクリックして、コレクションの設定を変更します。

コレクションの更新
最初にコレクションを作成した後、ファイルを追加したり、削除したりすることができます。ドキュメントを追加する場合、エントリがコレクションに追加されると、ファイルのコンテンツに索引が作成され、さらに必要に応じて変換されます。ドキュメントを削除する場合は、メタデータと共にファイルのエントリがコレクションから削除されます。この機能は、元のドキュメントに影響を与えません。コレクション内のエントリにのみ影響を与えます。

ノート このコレクションの作成時に、[Extract Metatags] オプションを選択していた場合、新しいドキュメントをこのコレクションに追加すると、常に META タグ付きの HTML 属性に索引が作成されます。

コレクションを更新するには、次の手順を実行します。

[Server Manager] から [Search] を選択します。

[Update Collection] リンクをクリックします。

[Update Collection] ウィンドウが表示されます。

ドロップダウンリストから更新するコレクションを選択します。

フォームの中央にあるドキュメントのリストには、現在選択しているコレクションに索引エントリを所有するドキュメントが表示されます。リストには 100 個のレコードが表示され、[Prev] および [Next] ボタンによって、 100 個以上のファイルを持つコレクションの前または次の 100 個のファイルセットが表示されます。

[Documents Matching] フィールドで、1 つのファイル名を入力したり、ワイルドカードを使って、コレクションに追加またはコレクションから削除するファイルの種類を指定したりすることができます。

*.html などのワイルドカードを入力すると、この拡張子付きのファイルのみが指定されます。サブディレクトリ内のファイルを指定するには、ファイルのリストに表示されるパス名を入力します。たとえば、/frenchDocs ディレクトリ内のすべての HTML ファイルを削除するには、ディレクトリ名の前にスラッシュを付けずに、「frenchDocs/*.html」と入力します。

ワイルドカード式の作成方法には注意してください。たとえば、「index.html」と入力すると、その索引ファイルを現在のコレクションに追加したり、現在のコレクションから削除したりすることができます。代わりに、「*/index.html」という式を入力すると、コレクション内のすべての index.html ファイルを追加したり、削除したりすることができます。

最初にコレクションに定義されたドキュメントディレクトリのサブディレクトリ内にある、一致するすべてのドキュメントの索引作成および追加を行うかどうかを選択します。

つまり、コレクションで最初に /publisher ディレクトリに索引が作成されている場合、このオプションによって /publisher 内にあるすべてのサブディレクトリ内の新しいパターンに一致するドキュメントが検索されます。これは、ドキュメントの削除には適用されません。

[AddDocs] をクリックして、指定したファイルおよびサブディレクトリを追加します。

[RemoveDocs] をクリックして、指定したファイルを削除します。

コレクションの管理
定期的にコレクションを管理することができます。通常の使用については、定期的に管理タスクを行う必要はありませんが、多数のコレクションの索引作成および更新を行う場合、必要に応じてこれらの機能を使うことができます。次のコレクション管理タスクを実行することができます。

コレクションの最適化コレクションでドキュメントやディレクトリを頻繁に追加、削除、または更新する場合、コレクションを最適化して、パフォーマンスを向上させることができます。ハードドライブのデフラグのようなものです。最適化は自動的に実行されないので、コレクションの再索引作成または更新後に手作業で最適化する必要があります。コレクションを最適化するのは、コレクションを別のサイトにパブリッシュする前またはコレクションを読み取り専用の CD-ROM に保存する前に限られます。

再索引コレクションの再索引作成を実行することができます。これは、既にコレクションにエントリを所有している各ファイルを検索し、その属性およびコンテンツに再び索引を作成する機能です。さらに、最初にファイルがコレクションに索引が作成されたときに、オプションを選択していた場合、META タグ付きの属性が抽出されます。この機能は、コレクションを作成するための元の条件、つまり *.html に戻らず、元の条件に一致する新しいドキュメントを追加します。また、ソースドキュメントが削除されて見つからない場合、このオプションによって、コレクションエントリが削除されます。

削除コレクションを削除することができます。削除されるのは、元のソースドキュメントではなく、コレクションのみです。

ローカルファイルマネージャを使って、コレクション、特に Web パブリッシングコレクションを削除しないでください。誤って Web パブリッシングコレクションを削除した場合、サーバを再起動する前に検索を実行しようとすると、Web パブリッシングコレクションが使われていなくても検索に失敗します。サーバを再起動すると、新しい Web パブリッシングコレクションが自動的に作成されるので、検索を実行することができます。

コレクション管理タスクを実行するには、サーバマネージャの「Maintain Collection」ページを使います。

定期的な管理のスケジューリング
定期的なコレクション管理スケジュールを設定することができます。最適化および再索引作成のために異なる管理スケジュールを設定することもできます。通常の使用については、定期的な管理スケジューリングタスクを行う必要はありませんが、多数のコレクションの索引作成および更新を行う場合、必要に応じてこれらの機能を使うことができます。たとえば、新しいドキュメントが毎日追加される場合、非常に活発な Web サイトでは頻繁な再索引作成が必要なことがあります。

通常のタスクの組み合わせは、削除されたエントリの除去、およびコレクションの条件に一致する新しいドキュメントのエントリの追加を行うように定期的にスケジュールされた再索引作成と更新オペレーションのペアの設定です。

コレクションでドキュメントやディレクトリを頻繁に追加、削除、または更新する場合、コレクションを最適化して、パフォーマンスを向上させることができます。ハードドライブのデフラグのようなものです。最適化は自動的に実行されないので、コレクションの再索引作成または更新後に手作業で最適化する必要があります。コレクションを最適化するのは、コレクションを別のサイトにパブリッシュする前またはコレクションを読み取り専用の CD-ROM に保存する前に限られます。

コレクションの再索引作成を実行することができます。これは、コレクションにエントリを所有している各ファイルを検索し、その属性およびコンテンツに再び索引を作成する機能です。さらに、最初にファイルがコレクションに索引が作成されたときに、オプションを選択していた場合、META タグ付きの属性が抽出されます。この機能では、新しいドキュメントのエントリは追加されませんが、削除されたファイルへのエントリを削除することによってコレクションをクリーンアップします。

コレクションを更新するには、コレクションの新しい索引作成条件、つまり、条件に一致する新しいドキュメントを追加する *.html を入力します。

コレクションの最適化、再索引作成、または更新を行うには、次の手順を実行します。

[Server Manager] から [Search] を選択します。

[Schedule Collection Maintenance] リンクをクリックします。

[Schedule Collection Maintenance] ウィンドウが表示されます。

ドロップダウンリストからコレクションを選択します。

このドロップダウンリストには作成したコレクションのすべてが表示されます。

ドロップダウンリストから [Reindex]、[Optimize]、または [Update] のうちの 1 つのアクションを選択します。

同じコレクションに対するさまざまなオペレーションに異なるスケジュールを設定することができます。

コレクションの更新を選択した場合、ドキュメント一致条件を入力するフィールドと、条件に一致するサブディレクトリ内で検索されたドキュメントが表示されるフィールドの 2 つのフィールドが追加表示されます。

[Schedule Time] フィールドに、スケジュールされた管理を実行する時刻を入力します。

軍隊で使用されている形式 (HH:MM) を使います。 HH は 24 未満、MM は 60 未満にする必要があります。1 つの時刻を入力してください。

[Schedule Day(s) of the Week] というラベルがついたセクションで、1 つまたは複数の曜日のチェックボックスをオンにします。

すべての曜日を選択することができます。少なくとも 1 つの曜日を選択する必要があります。

[OK] をクリックして、管理をスケジュールします。

Unix/Linux ユーザの場合、新しくスケジュールした管理を有効にするには、Administration Server から ns-cron プロセスを再起動する必要があります。

ns-cron プロセスを再起動するには、次の手順を実行します。

Administration Server で [Global Settings] を選択します。

[Cron Control] リンクをクリックします。

ns-cron が既にオンになっている場合は、[Restart] をクリックして再起動します。ns-cron がオンになっていない場合は、[Start] をクリックして、開始します。

いずれの場合も、これ以降は定期的にスケジュールされた管理が行われます。

コレクション管理スケジュールの削除
コレクションの定期的な再索引作成または最適化をスケジュールしている場合、コレクションを定期的に管理する必要がなくなると、管理スケジュールを削除することができます。

コレクション管理スケジュールを削除するには、次の手順を実行します。

[Server Manager] から [Search] を選択します。

[Remove Scheduled Collection Maintenance] リンクをクリックします。

[Remove Scheduled Collection Maintenance] ウィンドウが表示されます。

[Choose Collection] ドロップダウンリストからコレクションを選択します。

このドロップダウンリストには、定期管理を設定しているすべてのコレクションが表示されます。

ドロップダウンリストから [Reindex] または [Optimize] のいずれかのアクションを選択します。

枠の下部に、現在スケジュールされている管理の実行時刻と曜日が表示されます。

[OK] をクリックして、管理スケジュールを削除します。

Unix/Linux ユーザの場合、新しくスケジュールした管理を有効にするには、ns-cron プロセスを再起動する必要があります。

ns-cron プロセスを再起動するには、次の手順を実行します。

Administiration Server で[Global Settings] を選択します。

[Cron Control] リンクをクリックします。

ns-cron が既にオンになっている場合は、[Restart] をクリックして再起動します。ns-cron がオンになっていない場合は、[Start] をクリックして、開始します。

いずれの場合も、これ以降は定期的にスケジュールされた管理は行われません。

検索の実行 : 基本事項

ユーザは、主に、検索コレクション内のデータについて質問し、代わりにドキュメントのリストを取得します。iPlanet Web Server をインストールすると、デフォルトの検索クエリおよび結果のフォームのセットが付属しています。

テキスト検索機能には、次の 4 つの部分があります。

クエリの作成検索条件を入力します。

検索結果の表示サーバによって、条件に一致するドキュメントのリストが表示されます。

ドキュメントの表示検索結果リストから特定の強調表示されたドキュメントを表示することができます。

コレクションのコンテンツの表示コレクションのそれぞれについて管理されている情報を表示することができます。

検索機能がオフになっていると、これらのクエリフォームを使うことができません。

検索ホームページ
検索ホームページ (http://serverid:port/search) では、インターフェイスのカスタマイズに関するオンラインのクイックスタートチュートリアルだけでなく、3 つの検索クエリインターフェイスへの個々のリンクが提供されます。チュートリアルでは、さまざまなパターンファイルについて説明し、それらを変更して異なる結果を生成する方法を示します。

検索ホームページ

検索クエリ

ガイド付き検索

高度な検索

検索結果

コレクションコンテンツの表示

検索クエリ
iPlanet Web Server をデフォルトでインストールした場合は、標準の HTML クエリ、高度な HTML クエリ、および Java ベースのガイド付きクエリの 3 つの検索クエリページがインストールされます。

標準の検索クエリでは、検索するコレクションを選択し、クエリ言語演算子を使って、検索する単語やフレーズを入力します。

ガイド付きの Java ベースの検索インターフェイスでは、多数のドロップダウンリストを使って、簡単にクエリを作成することができます。このインターフェイスが取得できるのは、ブラウザで Java が使用可能な場合だけです。

高度な HTML ページには、検索する複数のコレクションの選択、結果のソート順序の設定、および一度に 1 ページに表示するドキュメント数の定義を行う追加のオプションがあります ([Prev] および [Next] ボタンをクリックすると、結果のページ間を移動することが可能)。

ノート [Web Publishing] | [Add Custom Property] によって、Web パブリッシングコレクション内の HTML の META 属性値を日付または数字のプロパティとして再定義している場合は、それらの属性値に対して日付および数字の比較検索を実行することしかできません。

標準検索を実行するには、次の手順を実行します。

Web ブラウザの場所フィールドに次の URL を入力します。

ガイド付き検索
クエリの作成に便利な Java ベースのガイド付き検索インターフェイスの使用を選択することができます。このインターフェイスは、特に複数の部分から構成されるクエリ、つまり、ドキュメントのコンテンツ内の単語および特定の属性値を検索するクエリを作成する場合に便利です。

表示される検索クエリページで、[Search In] フィールドのドロップダウンリストから検索するコレクションを選択します。

[For] フィールドに検索クエリの単語またはフレーズを入力します。複雑なクエリは、演算子を組み合わせて作成します。検索演算子の詳細については、クエリ演算子の使用を参照してください。

[Search] ボタンをクリックして、クエリを実行します。

ノート ご使用のブラウザで Java が使用可能なことを確認してください。有効にするには、[Languages] オプションプリファレンスメニューコマンドを使います。

ノート バージョン管理機能およびリンク管理の属性は、現在、iPlanet Web Server では使われていません。ただし、ガイド付き検索を実行すると、iPlanet Web Server によってそれらの属性が返される場合があります。したがって、これらの変数を使わないでください。

ガイド付き検索ページを取得するには、2 つの方法があります。[Search] ホームページを使う方法と標準検索クエリページを使う方法です。

[Search] ホームページからガイド付き検索インターフェイスにアクセスするには、次の手順を実行します。

Web ブラウザの場所フィールドに次の URL を入力します。

標準検索クエリページからガイド付き検索インターフェイスにアクセスするには、次の手順を実行します。

ホームページ上で [Guided Search] をクリックします。

標準検索クエリページにジャンプするには、Web ブラウザの [location] フィールドに次の URL を入力します。

高度な検索
クエリの作成に役立つ高度な HTML 検索インターフェイスの使用を選択することができます。このインターフェイスは、特に複数のコレクションを検索するクエリまたは特定の属性値によってソートされる結果を生成するクエリを作成する場合に便利です。

標準検索ページ上で [Guided Search] をクリックすると、ガイド付きの Java ベースのクエリページが表示されます。

[Search In] フィールドのドロップダウンリストから検索するコレクションを選択します。

[For] ドロップダウンリストを使って、検索対象の要素の種類を選択します。この例では、[Words] を選択してください。

空白のテキストフィールドに、検索対象の単語を入力します。検索演算子の詳細については、クエリ演算子の使用を参照してください。

[Add Line] をクリックして、クエリの最初の部分を追加します。その単語は、フォームの下部にある大きなテキスト表示ボックスに表示されます。

クエリに追加するには、ドロップダウンリストから別の要素を選択します。この例では、[Attribute] を選択してください。

フォームの右側に、選択したコレクションに使用可能なすべての属性を一覧表示する新しいドロップダウンリストが表示されます。検索する属性を選択してください。

テキスト入力フィールドの上のドロップダウンリストから、クエリ演算子 (Contains、Starts、Ends、Has a substring) または論理演算子 (=、<、<=、=) を選択します。

空白のテキストフィールドに、検索対象の属性値を入力します。

[Add Line] をクリックし、クエリ用の別の行を追加します。[Undo Line] をクリックして最後に追加した行を削除したり、[Clear] を選択してクエリ全体を削除したりすることができます。

[Search] ボタンをクリックして、検索を実行します。

高度な HTML 検索ページを取得するには、2 つの方法があります。[Search] ホームページを使う方法と標準検索クエリページを使う方法です。

[Search] ホームページから高度な HTML 検索にアクセスするには、次の手順を実行します。

Web ブラウザの場所フィールドに次の URL を入力します。

標準検索クエリページから高度な HTML 検索にアクセスするには、次の手順を実行します。

ホームページ上で [Advanced HTML Search] リンクをクリックします。

標準検索クエリページにジャンプするには、Web ブラウザの [location] フィールドに次の URL を入力します。

検索結果
検索結果には、次の 2 つの標準的な種類があります。検索条件に一致するすべてのドキュメントのリストと、一致するドキュメントのリストから選択した 1 つのドキュメントのテキストです。

ブラウザで Java を無効にします。無効にするには、[Languages] オプション プリファレンス メニューコマンドを使います。

標準検索ページ上で [Guided Search] をクリックすると、高度な HTML クエリページが表示されます。

[For] フィールドに、検索対象の単語またはフレーズを入力します。複雑なクエリは、演算子を組み合わせて作成します。検索演算子の詳細については、クエリ演算子の使用を参照してください。

1 つまたは複数の属性を入力し、それによって結果をソートすることができます。デフォルトでは、昇順でソートされますが、マイナス記号を使うと降順を指定することもできます。ソートの詳細については、結果のソートを参照してください。

検索結果ページ内で各ドキュメントに一覧表示されるフィールド数または一度に表示するフィールド数によって、検索で一度に返される一致ドキュメントの数を拡大したり、制限したりすることができます。返されるドキュメントが多すぎて一度に 1 ページに表示できない場合は、[Prev] および [Next] ボタンを使ってドキュメントのその他のページにアクセスすることができます。

[Search In] フィールドのドロップダウンリストを使って、検索するコレクションを選択します。複数のコレクションを選択するには、Ctrl キーを押しながら別のコレクションをクリックします。クエリ内のすべてのコレクションは同じ言語である必要がありますが、Web パブリッシングコレクションを複数コレクション検索で使うことはできません。

[Search] ボタンをクリックして、クエリを実行します。

アクセスパーミッションは、検索時の次の時点でチェックされます。

検索結果のドキュメントに表示される、強調表示されたアイコンをユーザがクリックした場合。

NS-collection-acl-check オプションが yes に設定されている Web パブリッシング以外のコレクションで検索する場合。NS-collection-acl-check は webpub.conf ファイルで設定され、すべてのコレクションに適用されます。このオプションが設定されている場合、 dblist.ini でコレクションに定義されているプライマリドキュメントディレクトリに一致する URI に設定される ACL は、それらのコレクションで検索を実行できないために処理されません。

ユーザが Web パブリッシングコレクション上で検索する場合。

一致したドキュメントの一覧表示
iPlanet Web Server をデフォルトでインストールした場合、単純または高度な検索クエリページから検索を実行すると、検索条件に一致するドキュメントのリストを取得することができます。リストでは、コレクションの形式に基づいて、各ファイルに関する標準の情報が提供されます。たとえば、電子メールコレクションのデフォルトの結果ページでは、各エントリの件名、送信先、発信者、および日付が提供され、ニュースコレクションでは、各エントリの件名、発信者、および日付が提供されます。

コレクションのファイル形式の種類は、検索に使用可能なデフォルトの属性を示します。各形式の属性の詳細については、コレクションの属性についてを参照してください。

単語の比較近似性や一致の正確性をチェックする検索の結果によるエントリの場合は、得点を示すことによって、ファイルのランク付けを行うことができます。

一致するドキュメントがページに入りきらない場合は、[Next] をクリックして次のバッチを表示することができます。常に新しい検索を実行するには、新しいクエリデータを入力して [Search] をクリックします。

結果のソート
デフォルトで、または高度な HTML クエリページの [Sort By] フィールドに何も入力しなかった場合、検索に一致するすべてのドキュメントは、適合性ランク (これを考慮するクエリの場合) またはサーバファイルデータベース内の位置 (その他のクエリの場合) に基づいて出力されます。

[Sort By] フィールドに属性名を入力すると、ドキュメントは昇順で表示されます。ドキュメントを降順で一覧表示するには、「-keywords」や「-title」のように、属性の前にマイナス記号 (-) を追加します。複数のソートを行うには、「Author,-PubDate」のように複数の属性を入力します。

短いクエリでは、通常、ソート順は重要ではありませんが、多数の一致結果が返されるクエリでは、効果的な検索結果を取得するためにソートの値を設定する場合があります。ただし、特別なソート順序によって、検索のパフォーマンスに影響が生じる可能性があります。

ノート META タグ付きフィールド内の属性値は、日付または数字としてではなく、テキストとしてソートされる日付および数字を意味するテキスト文字列です。この値を日付または数字に変換するには、 [Web Publishing] タブの「Add Custom Property」ページで新しいプロパティを作成し、そのプロパティを META タグ付きの属性としてマークするボックスをチェックします。

強調表示されたドキュメントの表示
iPlanet Web Server をデフォルトでインストールした場合、検索条件に一致するドキュメントのリストを取得すると、1 つのドキュメントを選択して Web ブラウザに表示することができます。パターンファイルの設定方法に基づいて、色、太字のテキスト、または点滅を使って、検索クエリとして入力した、表示されたドキュメント内の単語を強調表示することができます。

強調表示されたドキュメントを表示するには、検索結果内のドキュメントのエントリをクリックします。強調表示されたドキュメントのアクセスに使うフィールドは、検索インターフェイスの設計方法によって異なりますが、デフォルトのインストールでは、ドキュメントのリストの隣りに表示されるアイコンをクリックします。このアイコンをクリックすると、アイコンのリンクの背後で追加のコードが定義され、強調表示された検索クエリによって表示されるドキュメントがフォーマットされます。

デフォルトの検索結果ページでは、ファイルの URL をクリックすると、特別に強調表示しなくてもブラウザ内でファイルを開くことができます。

HTML に変換されているドキュメントの場合は、URL が元のドキュメントを指しています。変換された HTML ドキュメントにアクセスするには、ドキュメントのタイトルをクリックします。

コレクションコンテンツの表示
コレクションデータベースのコンテンツを表示して、各コレクションに設定されている属性を参照することができます。 iPlanet Web Server をデフォルトでインストールした場合、HTML-description.pat ファイルを使うと、dblist.ini ファイルで表示可能 (NS-display-select = YES) と定義されている各コレクションの情報が表示されます。コレクションコンテンツには、通常、次の項目が含まれています。

コレクションの名前、ラベル、および説明

コレクションの形式

コレクション内の属性数および属性名のリスト

コレクション内のドキュメント数

コレクションのサイズおよび状態

言語および文字セット

入力および出力日付形式

コレクションデータベースのコンテンツを表示するには、次の URL を使います。

http://serverid:port/search?NS-search-page=c

クエリ演算子の使用

検索を効果的に実行するには、クエリ演算子の使用法を知っておく必要があります。ブール値検索のみが可能なので、次の情報はすべてブール値検索のルールに基づくものです。

ノート クエリ言語では大文字と小文字を区別しません。例では、明確にする目的でのみ大文字を使います。

検索エンジンでは、シンタックスルールのセットに基づいて検索クエリが解釈されます。たとえば、region という単語を入力すると、実際の単語 region と、regions や regional など、すべての同語源のバリエーションが検索されます。検索結果は、"重要性" を基準にランク付けされます。これによって、一致した単語が最初に入力された検索条件にどの程度近似しているかが示されます。上記の例で、region は同語源の変形よりも上位にランク付けされます。

すべてのクエリで結果がランク付けされるわけではありません。一致結果のさまざまな程度を設定できるクエリでのみランク付けを行うことができます。たとえば、<CONTAINS クエリは指定された文字列を含むか含まないかですが、<NEAR クエリは単語が相互にどの程度近似しているかによってランク付けすることができます。互いに近似している単語は検索結果の上部に表示され、違っている単語は検索結果の下部に表示されます。