この章では、Sun JavaTM System Portal Server 検索サーバーの設定方法と管理方法について説明します。
この章で説明する内容は次のとおりです。
Portal Server 検索サーバーは、Google および Alta Vista などの一般的なインターネット検索サーバーと同様の検索インタフェースおよびブラウズインタフェースをサポートするために設計された分類およびデータベースサービスです。検索サーバーには、ドキュメントリソースを発見、変換、および要約するロボットが含まれます。Portal Server デスクトップには、JavaServer PagesTM (JSPTM) に基づいた検索ユーザーインタフェースが含まれます。検索サーバーには、設定の編集を行うための管理ツールとシステム管理を行うためのコマンド行ツールが含まれます。設定は、Portal Server 管理コンソールを使用して定義および格納できます。
管理コンソールを使用すると、管理者は検索サーバーオプションの大部分を設定できますが、コマンド行インタフェースから使用できるすべての管理機能を実行できるわけではありません。
ユーザーは、検索サーバーのデータベースをクエリーして、リソースの場所を特定します。各データベースの個々のエントリをリソース記述 (RD) と呼びます。リソース記述は、単一のリソースに関するサマリー情報を提供します。データベーススキーマは、各リソース記述のフィールドを決定します。
検索サーバーは、リソース記述メッセージ (RDM) やサマリーオブジェクト交換形式 (SOIF) など、インターネットのオープンスタンダードに基づいているため、クロスプラットフォームのエンタープライズ環境で動作できることが保証されています。
ユーザーが検索システムと対話する場合、2 つの方法があります。クエリーを直接入力してデータベースを検索する方法と、カスタムなカテゴリセットを使用してデータベースコンテンツ経由で参照する方法です。カテゴリの階層構造は「分類」と呼ばれることがあります。リソースの分類は、データベースに目次を作成することにたとえることができます。
ブラウズは、検索システムではオプションの機能です。つまり、カテゴリによるブラウズの機能がなくても、検索システムは十分有用なものになります。ユーザーで表示できるカテゴリを追加することがインデックスのユーザーに役立つかどうかを検討する必要があります。また、役立つ場合、作成するカテゴリの種類も検討する必要があります。
検索データベースのリソースは、検索手順を単純にするためにカテゴリに割り当てられます。データベースに多数の項目がある場合には、関連する項目をグループ化すると便利です。そのようにすると、ユーザーは特定の種類の項目をすばやく検索したり、類似する項目と比較したり、目的の項目を選択したりすることができます。
このような分類は製品およびサービスのインデックスに共通です。衣料品のカタログでは、衣類を男性用、女性用、および子供用に分類して、さらに、これらのカテゴリをコート、シャツ、靴などに分類します。オフィス製品カタログの場合、家具は文具、コンピュータ、およびソフトウェアと区別されます。広告ディレクトリは、製品とサービスのカテゴリによって編成されます。
印刷物の索引で項目をカテゴリ別に分類するときの原則は、オンラインインデックスにも当てはまります。この発想では、種類別に検索することが容易になるので、ユーザーは目的のリソースを選択できます。設計するインデックスの適用範囲を問わず、カテゴリを設定する際にもっとも重要なのは使いやすさです。ユーザーがどのようにカテゴリを使用するかを知る必要があります。たとえば、異なる場所に 3 つの支社を持つ企業のためにインデックスを設計する場合、トップレベルのカテゴリを支社ごとに作成しようとするかもしれません。ユーザーにとって、支社の所在地よりも各部門の機能の方が重要であれば、リソースを部門別に分類することが適切です。
カテゴリを定義すると、カテゴリにリソースを割り当てるためのルールを設定する必要があります。これらのルールを、「分類ルール」と呼びます。分類ルールを適切に定義しないと、ユーザーがカテゴリでブラウズしようとしても、リソースを検索できません。リソースは正しく分類する必要がありますが、同時にドキュメントの分類も適切でなければなりません。
Sun Java System Portal Server は 1 つ以上の検索サーバーをサポートします。
 検索サーバーを作成する
検索サーバーを作成するPortal Server のインストール時にデフォルトの検索サーバー ( search1) が作成されます。新規検索サーバーウィザードを使用して、新しい検索サーバーを作成することもできます。
「管理コンソールにログインする」の手順に従って、管理コンソールにログインします。
「検索サーバー」を選択し、メニューバーから「新規」を選択します。
新しい検索サーバーウィザードが表示されます。
指示に従い、「完了」をクリックして指定した検索サーバーを作成します。
『Sun Java System Portal Server 7.2 Command-Line Reference』の「psadmin create-search-server」
 検索サーバーを削除する
検索サーバーを削除する「管理コンソールにログインする」の手順に従って、管理コンソールにログインします。
検索サーバーを選択し、「削除」をクリックします。
『Sun Java System Portal Server 7.2 Command-Line Reference』の「psadmin delete-search-server」
検索サーバーはデータベースにリソース記述を格納します。検索データベースはドキュメントコレクションのインデックスです。これらは、インデクサ (コマンド rdmgr、または検索サーバー自体) によって作成されます。たとえばデフォルトでは、Web サイトとロボットインデックスを巡回し、見つけ出したものをユーザーがデータを検索できるデフォルトの検索データベースにすべて格納するようにロボットをセットアップできます。データやインデックスはほかのデータベースに格納されます。
データベース管理のために行う必要のある設定作業およびメンテナンス作業は次のとおりです。
通常、検索データベースの項目はロボットから取得します。また、ほかの Portal Server 検索エンジン、iPlanet Web Server や NetscapeTM Enterprise Server、または別のソースから生成したデータベースから既存の項目のデータベースをインポートすることもできます。ロボットを使用して新規に作成する代わりに RD の既存データベースをインポートすると、ネットワークトラフィックが減少します。また、大量のインデックス作成作業を分割できるので、より高速にインデックスを作成できます。中央データベースがインデックスを作成するサーバーから物理的に遠くにある場合には、RD をローカルに生成して、中央データベースに各地点のリモートデータベースを定期的にインポートすると便利です。
検索サーバーは、インポートエージェントを使用して、別のサーバーやデータベースから RD をインポートします。「インポートエージェント」は、外部ソースから RD を検出して、ローカルデータベースに情報をマージするプロセスです。
データベースをインポートする前に、インポートエージェントを作成する必要があります。エージェントを作成したら、すぐにインポートプロセスを開始することも、インポートプロセスが定期的に実行されるようにスケジュールを設定することもできます。
「スキーマ」は、検索サーバーで管理するリソースごとの情報とその形式を決定します。スキーマの設計によって、インデックスのユーザビリティーに影響する次の 2 つの要因が決まります。
ユーザーがリソースを検索する方法
ユーザーがリソース情報を表示する方法
スキーマはデータベースのリソース記述のマスタデータ構造です。データ構造フィールドのインデックス作成方法と定義方法によって、リソースへのアクセス頻度が変わります。
スキーマは、検索サーバーとそのロボットが使用するファイルの構造に密接に結びついています。管理コンソールでスキーマツールを使用して、データ構造だけを変更してください。スキーマファイルは直接編集しないでください。
検索サーバーのデータベーススキーマを編集すると、新規のスキーマ属性の追加、スキーマ属性の変更、あるいは属性の削除ができます。
スキーマには次の属性があります。
編集可能: オンの場合、この属性はリソース記述エディタに表示される属性を示すので、ユーザーは値を変更できます。
インデックス作成可能: この属性はユーザーがこのフィールド内の値を検索できることを示します。インデックス作成可能フィールドは、「詳細検索」画面のポップアップメニューに表示されることもあります。
説明: この属性はスキーマの記述に使用するテキスト文字列です。コメントや注釈に使用します。
エイリアス: この属性は、インポートしたデータベーススキーマ名をユーザー独自のスキーマに変換するためのエイリアスを定義します。
乗数のスコア: 特定の要素をスコアリングする重み付けフィールドです。有効値は正の数です。
データタイプ: データタイプを定義します。
データベーススキーマのフィールド名が互いに矛盾していることがあります。あるサーバーから別のサーバーにリソース記述をインポートするとき、2 つのサーバーのスキーマの項目名が同一であることを、常に保証することはできません。同様に、ロボットが HTML <meta> タグをドキュメントからスキーマフィールドに変換するときは、名前はドキュメントによって制御されます。
検索サーバーは、ユーザーのスキーマ属性にスキーマのエイリアスを定義して、外部スキーマ名をデータベースのフィールドに有効な名前にマッピングできるようにします。
検索サーバーのレポートには、インデックスを作成したサイトの数、およびデータベースの各サイトのリソースの数などの情報が含まれます。
スキーマを編集してインデックスフィールドを追加または削除する場合、またはディスクエラーによってインデックスファイルが破損した場合は、検索サーバーが使用するリソース記述データベースのインデックスを再作成する必要があります。また、別の何らかの理由でデータベースのコンテンツとインデックスの間に矛盾が発生すると、再作成が必要となることがあります。たとえば、インデックス作成中にシステム障害が発生した場合です。
大規模なデータベースのインデックスを再作成するのに、数時間を要する場合があります。データベースのインデックスの再作成に要する時間は、データベースに含まれるレコードの数に応じて変わります。大規模なデータベースでは、サーバーの負荷が低い時にインデックスの再作成を行うようにしてください。
データベースを「期限切れ」にすると、古くなったリソース記述も削除されます。リソース記述が削除されるのは、期限切れを実行したとき「だけ」です。期限切れのリソース記述が削除されても、データベースのサイズは減少しません。
リソース記述の属性の 1 つに有効期限があります。ロボットは HTML <meta> タグ、またはリソースのサーバーが提供する情報を基に有効期限を設定します。リソースが有効期限を指定しないかぎり、リソース記述はデフォルトで作成から 3 か月有効です。検索サーバーで検索データベースから期限切れのリソース記述を定期的に破棄するようにしてください。
破棄を実行すると、データベースの中身を削除できます。これによって、インデックス用のディスク領域は回復しますが、メインデータベースのディスク領域は回復できません。これは、この領域が新規のデータをデータベースに追加したときに再利用されるためです。
検索サーバーを使用すれば、複数のディスク、ファイルシステム、ディレクトリ、またはパーティションにまたがる検索データベースを構成する物理ファイルを配置できます。異なる物理デバイス、または論理デバイスにデータベースを拡張することで、単一のデバイスに使用するよりも大きなデータベースを作成することができます。
デフォルトでは、検索サーバーは 1 つのディレクトリだけを使用するデータベースを設定します。コマンド行インタフェースを使用すると、データベースパーティションに次の 2 種類の操作を実行できます。
新しいパーティションの追加
パーティションの移動
検索サーバーは、各パーティションに空き領域があるかどうかを確認しません。データベースに適切な空き領域を確保するのは、ユーザーの作業です。
データベースのパーティションは、合計で最大 15 個追加できます。
一度パーティションの数を増やすと、あとでパーティションの数を減らすには、データベース全体を削除する必要があるので注意してください。
ただし、ディスク容量が十分にある場合に限り、パーティションの作成はお勧めしません。
データベースパーティションの物理的な場所を変更するには、新しい場所の名前を指定します。同様に、既存のパーティションの名前も変更できます。パーティションを操作するには rdmgr コマンドを使用します。psadmin コマンドの詳細については、『Sun Java System Portal Server 7.2 Command Line Reference』を参照してください。
データベースを管理するには、次の手順に従います。
 データベースを作成する
データベースを作成する「管理コンソールにログインする」の手順に従って、管理コンソールにログインします。
「検索サーバー」タブを選択し、検索サーバーを選択します。
「データベース」をクリックし、メニューバーの「管理」をクリックします。
「新規」をクリックします。
「新しいデータベース」ページが表示されます。
新しいデータベースの名前を入力し、「了解」をクリックします。
『Sun Java System Portal Server 7.2 Command-Line Reference』の「psadmin create-search-database」
 インポートエージェントを作成する
インポートエージェントを作成する「管理コンソールにログインする」の手順に従って、管理コンソールにログインします。
「検索サーバー」タブを選択し、検索サーバーを選択します。
「データベース」をクリックし、メニューバーの「エージェントのインポート」をクリックします。
「新規」をクリックしてウィザードを起動します。
「エージェントのインポート」属性を指定します。
属性の詳細については、『Sun Java System Portal Server 7.2 Technical Reference』の「Import Agents」を参照してください。
「完了」をクリックします。
『Sun Java System Portal Server 7.2 Command-Line Reference』の「psadmin create-search-importagent」
 リソース記述を作成する
リソース記述を作成する「管理コンソールにログインする」の手順に従って、管理コンソールにログインします。
「検索サーバー」タブを選択し、検索サーバーを選択します。
「データベース」をクリックし、メニューバーの「管理」をクリックします。
データベースを選択し、「リソース記述を管理」をクリックします。
「新規」をクリックし、属性を指定します。
属性の詳細については、『Sun Java System Portal Server 7.2 Technical Reference』の「Schema」を参照してください。
「了解」をクリックします。
 リソース記述を管理する
リソース記述を管理する「管理コンソールにログインする」の手順に従って、管理コンソールにログインします。
「検索サーバー」タブを選択し、検索サーバーを選択します。
「データベース」をクリックし、メニューバーの「管理」をクリックします。
データベースを選択し、「リソース記述を管理」をクリックします。
リソース記述を選択して、次のいずれかの操作を実行します。
編集
すべて編集
削除
属性の詳細については、『Sun Java System Portal Server 7.2 Technical Reference』の「Schema」を参照してください。
「保存」をクリックします。
検索サーバーには、検索アクティビティーを監視できる多数のレポートが用意されています。
 レポートを表示する
レポートを表示する「管理コンソールにログインする」の手順に従って、管理コンソールにログインします。
「検索サーバー」タブを選択し、検索サーバーを選択します。
メニューバーの「レポート」をクリックします。
メニューバーのリンクを選択すると特定のレポートが表示されます。
次のオプションを使用できます。
ログ
ロボットの詳細レポート
頻度の高い検索
除外 URL
次の作業に従って、カテゴリを管理できます。
 カテゴリを作成する
カテゴリを作成する「管理コンソールにログインする」の手順に従って、管理コンソールにログインします。
「検索サーバー」タブを選択し、検索サーバーを選択します。
「カテゴリ」を選択し、メニューバーの「参照/検索」を選択します。
「新規」をクリックします。
「新しい検索カテゴリ」ダイアログが表示されます。
必要に応じて属性を指定します。
属性の詳細については、『Sun Java System Portal Server 7.2 Technical Reference』の「Manage Categories」を参照してください。
「了解」をクリックします。
 カテゴリを編集する
カテゴリを編集する「管理コンソールにログインする」の手順に従って、管理コンソールにログインします。
「検索サーバー」タブを選択し、検索サーバーを選択します。
「カテゴリ」をクリックし、メニューバーの「参照/検索」を選択します。
カテゴリを選択し、「編集を」をクリックして「Category の編集」ページを表示します。
属性の詳細については、『Sun Java System Portal Server 7.2 Technical Reference』の「Manage Categories」を参照してください。
 自動分類を実行する
自動分類を実行する「管理コンソールにログインする」の手順に従って、管理コンソールにログインします。
「検索サーバー」タブを選択し、検索サーバーを選択します。
「カテゴリ」をクリックし、メニューバーの「自動分類」を選択します。
「自動分類を実行」をクリックします。
 自動分類の属性を編集する
自動分類の属性を編集する「管理コンソールにログインする」の手順に従って、管理コンソールにログインします。
「検索サーバー」タブをクリックし、検索サーバーを選択します。
「カテゴリ」をクリックし、メニューバーの「自動分類」を選択します。
必要に応じて属性を変更します。
属性の詳細については、『Sun Java System Portal Server 7.2 Technical Reference 』を参照してください。
「保存」をクリックします。