![]() |
Sun ONE Portal Server 6.0 管理者ガイド |
この章では、Sun ONE Portal Server 検索エンジン サービスを設定および管理する方法について説明します。
この章は次の節から構成されます。
検索エンジンの概要
Sun ONE Portal Server検索エンジン は、Yahoo や DMOZ などの一般的なインターネット検索エンジンと同様のインタフェースで検索とブラウズをサポートする、分類およびデータベースサービスです。また 検索エンジン には、ドキュメントリソースを検索、変換、および要約するロボット型検索の機能もあります。 Sun ONE Portal Server 6.0 では、デスクトップ のみが JSP プロバイダを使用してインターフェイスを提供しています。また、検索エンジン には、設定編集のための管理ツールおよびシステム管理のためのコマンド行ツールもあります。 設定は、iPlanet Directory Service Access Management Edition のサービス属性値として iPlanet Directory Server Access Management Edition 管理コンソールで定義と格納を行います。
注 管理コンソールでは、管理者が検索エンジンオプションの大半を設定できますが、管理コンソールはコマンド行を通じて使用できるすべての管理機能は使用できません。
検索データベース
特定のリソースや複数の種類にまたがるリソースの検索には、データベースを使用します。 データベースの個々のエントリをリソース記述 (RD) と呼びます。 RD とは、単一のリソースに関する特定の情報のセットのことです。 なお、各 RD のフィールドは、データベーススキーマによって決定されます。
データベースに RD を指定する場合、2 つの方法があります。
- RD の作成 通常はこの方法を使用します。ロボットプロセスを使用してリソースを検索し、その記述を生成します。
- RD の交換 大規模な分散ネットワークインデックス向きです。 リモートシステムで生成した RD を、検索エンジンでデータベースにインポートします。
Sun ONE Portal Server検索エンジンの RD は、SOIF (Summary Object Interchange Format) や RDM (Resource Description Message) などのオープンなインターネット標準に基づいてます。 このため、検索エンジンはクロスプラットフォームの企業環境でも動作します。
検索ロボット
ロボットを使用すると、データベースに RD を格納することができますが、 この場合、検索エンジンはロボットを使用してドメインのリソースを検索し、その結果を報告します。 ロボットは小規模なプログラムですが、次の 2 つの機能を備えています。
- リソースへのリンクを抽出し、追跡します(列挙またはクローリングとも呼びます)
- RD を作成して、データベースに格納します (生成またはインデックス作成とも呼びます)
システム管理者として、さまざまな方法で、あらゆる局面にわたってこれらのプロセスを制御することができます。主な制御対象は次のとおりです。
- ロボットの開始、停止、およびスケジュールを設定して、ロボットの稼動時間を制御します
- ロボットがアクセスするサイトを定義して、ロボットがリソースを検索する場所を制御します
- クローリング属性を定義して、検索の頻度を制御します
- フィルタを定義して、ロボットがインデックスを作成するリソースタイプを制御します
- インデックス属性を定義して、データベースに作成するエントリの種類を制御します
検索エンジンには、ロボットの実行結果を確認するためのユーティリティもあります。
データベース分類カテゴリ
ユーザーが検索システムと対話する場合、 クエリを直接入力してデータベースを検索する方法と、カスタムなカテゴリセットを使用してデータベースコンテンツ経由でブラウズする方法があります。 カテゴリの階層構造は分類と呼ばれます。 リソースの分類は、データベースに目次を作成することに例えることができます。
ブラウズは、検索システムではオプションの機能です。 つまり、カテゴリによるブラウズの機能がなくても、検索システムは十分有用なものになります。 表示可能なカテゴリを追加することがインデックスのユーザーに役立つかどうか、さらに、作成するカテゴリの種類も検討する必要があります。
検索データベースのリソースは、検索手順を単純にするためにカテゴリに割り当てられます。 データベースに多数の項目がある場合には、関連する項目をグループ化すると便利です。 これによって、ユーザーは特定の種類の項目をすばやく検索したり類似する項目と比較したり、目的の項目を選択したりすることができます。
このような分類は製品およびサービスのインデックスに共通です。 衣料品のカタログでは、衣類を男性用、女性用、および子供用に分類して、さらに、これらのカテゴリをコート、シャツ、靴などに分類します。 オフィス製品カタログの場合、家具は文具、コンピュータ、およびソフトウェアと区別されます。 広告ディレクトリは、製品とサービスのカテゴリによって編成されます。
印刷物の索引で項目をカテゴリ別に分類するときの原則は、オンラインインデックスにも当てはまります。 この発想では、種類別に検索することが容易になるので、ユーザーは目的のリソースを選択できます。 設計するインデックスの適用範囲を問わず、カテゴリを設定する際にもっとも重要なのは使いやすさです。 したがって、ユーザーがどのようにカテゴリを使用するかを知る必要があります。 例えば、異なる場所に 3 つの支社を持つ企業のためにインデックスを設計する場合、トップレベルのカテゴリを支社ごとに作成しようとするかもしれません。 しかし、ユーザーにとって、支社の所在地よりも各部門の機能の方が重要であれば、リソースを部門別に分類することが適切です。
カテゴリを定義すると、カテゴリにリソースを割り当てるための規則を設定する必要があります。 この規則を、分類規則と呼びます。 分類規則を適切に定義しないと、ユーザーがカテゴリでブラウズしようとしても、リソースを検索できないことがあります。 リソースは正しく分類する必要がありますが、同時にドキュメントの分類も適切でなければなりません。
ドキュメントは、この値に設定した最大数を上限として、任意の数のカテゴリに割り当てることができます。 分類規則はフロー制御による判定を実行しないので、フィルタ規則よりも単純です。 分類規則は、RD の一部として特定のカテゴリをリソースに割り当てるための基準を決定するだけで使用できます。分類規則は簡単な条件のステートメントで、「<ある条件> が真ならば、リソースを <カテゴリ> に割り当てる」という形式です。
検索チャネルの設定
この節では 検索エンジンサービスの初期設定の方法について説明します。 構成の設定は、iPlanet Directory Server Access Management Edition 管理コンソールで、iPlanet Directory Server Access Management Edition のサービス属性値として定義し、格納します。
検索サービスはグローバルに登録されるので、その構成は Portal Server 全体に適用されます。 デフォルトでは、Sun ONE Portal Server のインストール時に指定した組織に、検索 サービスが登録されます。 サンプルのポータルをインストールすると、サンプルのポータルデスクトップの検索タブに検索チャネルが配置されます。 この検索チャネルは Sun ONE Portal Server のインストール中に設定するものです。 ただし、新規組織と新規インスタンスには、検索 URL を定義する必要があります。
検索プロバイダユーザーのデフォルトの動作では、ユーザーがクエリを入力すると、「マッチする文書がありません。 (No document matches.)」というメッセージが表示されます。
検索結果を取得するには、サーバーを設定してドキュメントデータベースを作成する必要があります。
検索サーバーの初期設定
次の手順にしたがって 検索プロバイダを設定します。 この手順はデータベースに RD を 取り込む方法の一例です。 インポート機能を使用することもできます。
- iPlanet Directory Server Access Management Edition 管理コンソールに管理者としてログインします。
- 「サービス管理」を選択して、「サービス管理」に移動します。
- ナビゲーション区画の検索の横にあるプロパティの矢印を選択します。
- 新規サイトを作成します。
- 「ロボット」をクリックします。
- 「サイト」をクリックします。
- 「サイトの管理」の「新規」をクリックして、ロボットでインデックスを作成するサイトを定義します。
- サイト (URL またはドメイン) のタイプ、インデックスを作成するサイト、およびロボットがクローリングする深さを指定します。
- 「サイトの作成」を選択してデフォルトの検索属性を使用します。あるいは、「サイトの作成と編集」を選択して検索サイトを詳細に定義します。
サイトを定義する属性の詳細については 付録 F「検索の属性」を参照してください。
- 分類を作成します。
「カテゴリ」>「カテゴリエディタ」で分類を作成するか、サンプルの分類 SOIF ファイルを config/taxonomy.rdm にコピーします。
- 使用しないデフォルトのフィルタを無効にします。
「ロボット」をクリックし、「フィルタ」をクリックします。 「フィルタのルール」リストで使用しないフィルタをオフにします。
- (オプション) カテゴリ別にドキュメント結果を取得する必要があるなら、ここでロボット分類規則を作成します。
- ロボットを開始します。
「ロボット」、「コントロール」をクリックし、次に「開始」をクリックし、ロボットを開始します。
- カテゴリのインデックスを再作成します。
「カテゴリ」、「再インデックス作成」をクリックして、インデックスを再度作成します。
検索 URL の定義
searchServer プロパティは 検索 URL を定義します。 デフォルトの組織の場合、この値は自動的に設定されます。ただし、新規組織や新規 SearchProvider インスタンスを作成する場合、またはサンプルの dp-org.xml を手動でロードする場合には定義されません。 値が定義されていない場合にユーザーが検索を実行すると、ユーザーのデスクトップに次のエラーメッセージが表示されます。
com.sun.portal.search.providers.taglib.SearchTaglibException が発生し ました。SearchRequest エラー: 検索サーバーが定義されていません。
- iPlanet Directory Server Access Management Edition 管理コンソールに管理者としてログインします。
- 「ユーザー管理」を選択して、「ユーザー管理」に移動します。
- 検索 URL を定義する組織を選択します。
- 「表示」メニューから「サービス」を選択します。
ナビゲーション区画の「表示」メニューと位置区画の「位置」のパスを使用します。
- ナビゲーション区画の「Desktop」の横にあるプロパティの矢印を選択します。
「Desktop」ページがデータ区画に表示されます。
- 「Desktop」ページで「チャネルおよびコンテナの管理」リンクを選択します。
「チャネル」ページが表示されます。 ページの上部にコンテナのパスが表示されます。 定義済みのチャネルがリストに表示されます。
- 変更する検索チャネルの横の「編集」リンクを選択します。
「チャネルの編集」ページが表示されます。
- 次の書式で「seachServer」プロパティに検索 URL を指定します。
http://portal_server_name:port/portal/search
- 「保存」をクリックします。
- 検索 URL を確認する場合、次の操作を行います。
- 検索 URL を設定した組織にログインします。 例えば、次のように B という名前の組織にログインします。
http://portal_server_name:port/amserver/login?org=B
- 検索チャネルから検索を実行します。
検索エンジンの管理
検索エンジンの初期設定とデータベースの生成が完了すると、iPlanet Directory Server Access Management Edition 管理コンソールで、検索エンジンの表示と管理ができるようになります。
検索エンジン操作の表示、管理、監視
検索エンジンの操作属性には、基本と詳細の 2 つのレベルがあります。基本設定ページは、検索サービスを管理コンソールから選択したときにデフォルトで表示されます。 表示される基本設定には、サーバールート、一時ファイルの場所、およびドキュメントレベルのセキュリティが含まれます。 詳細設定には、検索エンジンの各種コンポーネントのログ場所と、設定されたログレベルが含まれます。
さらに、管理コンソールを使用して管理者はログファイルから抽出されたログファイルまたは特定の情報を表示することができます。
基本設定の表示または管理
- iPlanet Directory Server Access Management Edition 管理コンソールに管理者としてログインします。
- 「サービス管理」を選択して、「サービス管理」に移動します。
- ナビゲーション区画の「 検索」の横にあるプロパティの矢印を選択します。
- メニューバーで「サーバー」、「設定」の順に選択します。
- 検索エンジンの「サーバールート」のディレクトリを表示します。
- 検索エンジンの「一時ファイル」のディレクトリを表示または指定します。
- ドキュメントのレベルセキュリティ属性を表示または指定します。
「オフ」の場合、すべてのユーザーがこのデータベースの RD にアクセスできます。 「オン」の場合、RD の ReadACL フィールドを評価して、ユーザーに RD へのアクセス権があるかどうかを判断する必要があります。
- 「保存」を選択して、変更した属性を記録します。
詳細設定の表示または管理
- iPlanet Directory Server Access Management Edition 管理コンソールに管理者としてログインします。
- 「サービス管理」を選択して、「サービス管理」に移動します。
- ナビゲーション区画の検索の横にあるプロパティの矢印を選択します。
- メニューバーで「サーバー」、「詳細」の順に選択します。
- 詳細属性を表示または指定します。
ここでは、 「検索」 (rdm)、「検索ログを無効にする」、「インデックスのメンテナンス」、「RD マネージャ」、「RDM サーバー」、および「ログレベル」が設定できます。
- 「保存」を選択して、変更した設定を記録します。
検索エンジンの活動の監視
検索エンジンは、検索活動を監視するための多数のレポートを提供します。
各種レポートを表示するには、次の手順に従います。
- iPlanet Directory Server Access Management Edition 管理コンソールに管理者としてログインします。
- 「サービス管理」を選択して、「サービス管理」に移動します。
- ナビゲーション区画の「検索」の横にあるプロパティの矢印を選択します。
- 「レポート」を選択します。
- メニューバーのタブを選択すると特定のレポートが表示されます。
ここでは、 「開始位置」、「除外された URL」、「ロボットの詳細レポート」、「ログファイルの表示」、「頻度の高い検索」レポートオプションを使用できます。
ロボットの管理
ロボットを管理するために必要な構成とメンテナンスのタスクを次に示します。
ロボットの開始と停止
通常、検索エンジンの実行中はロボットを稼動させておきます。 その結果新しいリソースをいつでも列挙できます。 ただし、定期的にロボットを開始して開始位置に再度アクセスし、既存の RD を更新する必要があります。
データベースを更新するときには、スケジュールによって定期的に、かつ自動的に開始することも、手動でロボットを開始することもできます。 自動的にロボットを開始する方法については、「ロボットのスケジュールの設定」で説明しています。
ロボットを開始する前に、ステータスを削除するか、あるいは単に再起動するかを指定します。
- ステータス削除の場合、全ロボットのステータスが削除されるので、次回実行時にロボットは、確実に元の開始位置で開始して同じ位置のリソースを列挙します
- 再起動の場合は、ロボット停止時の既存の状態の情報でロボットを開始します
ロボットを再び開始する前にロボットの状態の情報を削除するには、「ステータスの削除」オプションを使用します。
アイドル、再起動、あるいはタスクスクリプトの実行などの、ロボットの実行完了時に実行する操作を指定できます。 これらのオプションはメニューバーの「ロボット」の「クローリング」の「完了のアクション」で指定します。
ロボットを開始および停止する
- iPlanet Directory Server Access Management Edition 管理コンソールに管理者としてログインします。
- 「サービス管理」を選択して、「サービス管理」に移動します。
- ナビゲーション区画の「検索」の横にあるプロパティの矢印を選択します。
- メニューバーで「ロボット」、「コントロール」の順に選択します。
- ロボットを開始するには、「開始」を選択します。
- ロボットを停止するには、「終了」を選択します。
- ロボットの状態情報を消去するには、「ステータスの削除」を選択します。
実行中の場合は、ロボットを停止する必要があります。その後で「ステータスの削除」ボタンが表示されます。
サイトの定義
ロボットは、リソースを見つけて、それらの記述をデータベースに追加するかどうか (およびその方法) を決定します。 どのサーバーを訪問し、サーバーのどの部分のインデックスを作成するかの判断が、サイト定義に呼び出されます。
検索エンジンのサイトの定義は、サーバー管理者の最も重要なジョブの 1 つです。 ロボットは、インデックス作成が必要なすべてのサーバーに送信しなければなりませんが、同時に、データベース領域を過度に拡張して正確な情報の検索を困難にする可能性のある外部サイトを排除することも必要です。
ロボットでインデックスを作成するサイトの定義
- iPlanet Directory Server Access Management Edition 管理コンソールに管理者としてログインします。
- 「サービス管理」を選択して、「サービス管理」に移動します。
- ナビゲーション区画の「検索」の横にあるプロパティの矢印を選択します。
- メニューバーで「ロボット」、「サイト」の順に選択します。
- 次のようにサイトを作成します。
- 「新規作成」をクリックします。
- サイトのタイプ (URL またはドメイン) を選択します。
- サイトと深さを指定します。
- 「保存」をクリックします。
- サイト属性を編集するには、「編集」リンクをクリックします。
サイト属性の形式が表示されます。 サイトの属性については、付録 F「検索の属性」を参照してください。
- 属性を編集します。
- 「保存」をクリックします。
ロボットのクローリングの制御
ロボットはインデックスの作成に選択したさまざまなサイトにクロールします。 管理者はクローリング操作パラメータを定義することで、ロボットのサイト検索方式を制御できます。 クローリングパラメータにより、速度、完了動作、ロギングレベル、規格への準拠、認証パラメータ、プロキシ設定、追従する最大リンク数、その他の設定を定義できます。 ロボットのクローリングの属性については、付録 F「検索の属性」を参照してください。
ロボットのクローリングを制御する
- iPlanet Directory Server Access Management Edition 管理コンソールに管理者としてログインします。
- 「サービス管理」を選択して、「サービス管理」に移動します。
- ナビゲーション区画の「検索」の横にあるプロパティの矢印を選択します。
- メニューバーで「ロボット」、「クローリング」の順に選択します。
これによって、ロボットのクローリング操作のパラメータと設定を定義する属性のフォームが表示されます。 ロボットのクローリングの属性については、付録 F「検索の属性」を参照してください。
- 必要に応じてロボットのクローリング属性を変更します。
注 jvm12.conf ファイルにプロキシ設定 (http.proxyHost= と http.proxyPort= オプションを使用) がある場合は、「すべてのホストからコマンドを受け入れる」をチェックしてからロボットを実行する必要があります。
- 「保存」をクリックします。
ロボットデータのフィルタリング
フィルタを使用すると、リソースの属性をフィルタ定義と比較することでリソースを識別できるようになるので、これをサイト定義から除外することも、サイト定義に含むこともできます。 ロボットには多くの事前定義されたフィルタがあります。一部のフィルタはデフォルトで有効です。 次のフィルタは事前定義されています。アスタリスク (*) の付いたファイルがデフォルトで有効です。
- アーカイブファイル*
- オーディオファイル*
- バックアップファイル*
- バイナリファイル*
- CGI ファイル*
- 画像ファイル*
- Java、JavaScript、スタイルシートファイル*
- ログファイル*
- Power Pointファイル
- バージョン管理ファイル*
- ソースコードファイル*
- 一時ファイル*
- ビデオファイル*
- スプレッドシートファイル
- プラグインファイル
- Lotus Domino ドキュメント
- Lotus Domino オープンビュー
- システムディレクトリ (UNIX)
- システムディレクトリ (NT)
フィルタリングプロセスの管理には、新規フィルタ定義を作成する方法、フィルタ定義を変更する方法、およびフィルタを有効化または無効する方法があります。
新規フィルタ定義を作成する
- iPlanet Directory Server Access Management Edition 管理コンソールに管理者としてログインします。
- 「サービス管理」を選択して、「サービス管理」に移動します。
- ナビゲーション区画の「検索」の横にあるプロパティの矢印を選択します。
- メニューバーで「ロボット」、「フィルタ」の順に選択します。
- 「新規」を選択して、新規フィルタに「ニックネーム」を指定します。
- 「フィルタ定義」では、チェックボックスをオンにして、「フィルタソース」、「選別基準」、および「フィルタ文字列」の値を指定します。 必要に応じて、任意の数の「フィルタ定義」を指定することができます。
- フィルタの説明を入力します。
- 新規サイトの作成時にこのフィルタを使用するには、「新規サイト」をチェックします。
- このフィルタに一致するリソースを含めるか除外するかを「デフォルト配備」ラジオボタンで指定します。
- 「保存」をクリックします。
既存のフィルタ定義の変更
- iPlanet Directory Server Access Management Edition 管理コンソールに管理者としてログインします。
- 「サービス管理」を選択して、「サービス管理」に移動します。
- ナビゲーション区画の「検索」の横にあるプロパティの矢印を選択します。
- メニューバーから「ロボット」、「フィルタ」を順に選択します。
- 「フィルタルール」リストから変更するフィルタを検索し、「編集」を選択します。
- 必要に応じてフィルタを変更します。
- フィルタの説明を入力します。
- 「保存」をクリックします。
フィルタを有効または無効にする
- iPlanet Directory Server Access Management Edition 管理コンソールに管理者としてログインします。
- 「サービス管理」を選択して、「サービス管理」に移動します。
- ナビゲーション区画の「検索」の横にあるプロパティの矢印を選択します。
- メニューバーから「ロボット」、「フィルタ」を順に選択します。
- 「フィルタルール」リストで変更するフィルタを検索します。
- フィルタのオンまたはオフを示すボタンを選択します。
- 「保存」をクリックします。
インデックス作成の属性の定義
ロボットフィルタを通過する各リソースに、ロボットによってデータベースに格納する RD を生成します。 RD 生成を設定するときの選択によって、データベース検索時にユーザーに表示する範囲が決定されます。 たとえば、ドキュメントの全文や、ドキュメントの最初の固定部分だけに対してインデックスを作成することができます。
インデックス作成の属性の定義
- iPlanet Directory Server Access Management Edition 管理コンソールに管理者としてログインします。
- 「サービス管理」を選択して、「サービス管理」に移動します。
- ナビゲーション区画の「検索」の横にあるプロパティの矢印を選択します。
- メニューバーで「ロボット」、「インデックス作成」の順に選択します。
ロボットによるインデックス作成操作のパラメータと設定を定義する属性のページが表示されます。 ロボットのインデックス作成の属性については、付録 F「検索の属性」を参照してください。
- 必要に応じてロボットインデックス作成の属性を変更します。
- 「保存」をクリックします。
ロボットユーティリティの使用方法
ロボットには次の 2 つのデバッグツールまたはユーティリティがあります。
- サイトプローブ - DNS エイリアス、サーバーリダイレクト、仮想サーバーなどを確認します。
- シミュレータ - 特定の URL でロボットフィルタリングを部分的にシミュレートします。 確認する URL を入力して「OK」を選択します。 シミュレータは表示されたサイトをロボットが受け入れるかどうかを示します
サイトプローブユーティリティの実行
- iPlanet Directory Server Access Management Edition 管理コンソールに管理者としてログインします。
- 「サービス管理」を選択して、「サービス管理」に移動します。
- ナビゲーション区画の「検索」の横にあるプロパティの矢印を選択します。
- メニューバーで「ロボット」、「サイトプローブ」の順に選択します。
- プローブするサイトの URL を入力します。
- プローブで DNS 情報を取得するには、「DNS 情報の詳細を表示」を選択します。
- 「OK」を選択して、サイトプローブを開始します。
シミュレータの実行
- iPlanet Directory Server Access Management Edition 管理コンソールに管理者としてログインします。
- 「サービス管理」を選択して、「サービス管理」に移動します。
- ナビゲーション区画の 「検索 」の横にあるプロパティの矢印を選択します。
- メニューバーで「ロボット」、「シミュレータ」の順に選択します。
- シミュレートを実行する URL を入力します。
- シミュレータでエイリアスを確認するには、「DNS エイリアスへ確認」を選択します。
- シミュレータでリダイレクトを確認するには、「サーバーリダイレクトへ確認 (302)」を選択します。
- 「OK」を選択して、シミュレータを開始します。
ロボットのスケジュールの設定
検索データを最新に維持するには、ロボットはサイトを定期的に検索してインデックスを作成する必要があります。 ロボットのクローリングとインデックス作成は処理リソースとネットワークの帯域幅を消費する場合があるためです。 これらのリソースの制約を避けるために、ピーク以外の時間帯にロボットを実行するようにスケジュール設定する必要があります。 管理コンソールを使用すると、管理者はロボットを実行する日時を指定して cron ジョブをセットアップすることができます。
ロボットをスケジューリングする
- iPlanet Directory Server Access Management Edition 管理コンソールに管理者としてログインします。
- 「サービス管理」を選択して、「サービス管理」に移動します。
- ナビゲーション区画の「検索」の横にあるプロパティの矢印を選択します。
- メニューバーで「ロボット」、「スケジュール」の順に選択します。
- ロボットを開始する曜日と時刻 (時間と分) を選択します。
- ロボットを停止する曜日と時刻を選択します。
- 「保存」を選択して、「クーロンの開始」を選択します。
データベースの管理
検索エンジンは RD をデータベースに格納します。 次にデータベースの管理に必要な構成と保守タスクを示します。
- データベースへのインポート
- RD の編集
- データベーススキーマの編集
- スキーマの別名の定義
- データベース分析の表示
- データベースのインデックスの再作成
- データベースの期限切れ
- データベースの破棄
- データベースのパーティションの作成
- データベースの最適化
データベースへのインポート
通常、検索データベースの項目はロボットから取得します。 ユーザーは、ロボットにアクセスするサイトを指定して、そのサイトのすべてのリソースを検索して RD を作成します。 ただし、他の Sun ONE Portal Server 検索エンジン、 iPlanet Web ServerやNetscape Enterprise Server 、または別のソースから生成したデータベースから、既存の項目のデータベースをインポートすることができます。 ロボットを使用して新規に作成する代わりに RD の既存データベースをインポートすると、ネットワークトラフィックが大幅に減少し、大量のインデックス作成作業を分割できるので、より高速にインデックスを作成できます。 中央データベースがインデックスを作成するサーバーから物理的に遠くにある場合には、RD をローカルに生成して、中央データベースに各地点のリモートデータベースを定期的にインポートすると便利です。
検索エンジンは、インポートエージェントを使用して、別のサーバーやデータベースから RD をインポートします。 インポートエージェントは、外部ソースから RD を検索して、ローカルデータベースに情報をマージするプロセスです。 RD のインポート元、インポート元で検索するデータ、およびこのジョブの実行方法を詳細に調整するための情報を指定するパラメータがあります。
データベースをインポートする前に、インポートエージェントを作成する必要があります。 エージェントを作成したら、すぐにインポートプロセスを開始することも、インポートプロセスのスケジュールを設定してから実行することもできます。
インポートエージェントを作成する
- iPlanet Directory Server Access Management Edition 管理コンソールに管理者としてログインします。
- 「サービス管理」を選択して、「サービス管理」に移動します。
- ナビゲーション区画の「検索」の横にあるプロパティの矢印を選択します。
- メニューバーから「データベース」、「インポート」の順に選択します。
- 「新規作成」をクリックします。
インポートエージェントの属性ページが表示されます。
- インポートエージェントに適切な属性を指定します。
データベースインポートの属性の情報については付録 F「検索の属性」を参照してください。
- ソースには、ローカルファイルと検索サーバーのどちらかをを示します。
- ソースがファイルの場合には、ローカルファイルパスを指定します。
- ソースが別の検索サーバーの場合には、リモートサーバー、インスタンス名、および検索 URI の URL を指定します。
- インポート元のサーバーが Compass Server 3.01 の場合には、チェックボックスをオンにします。
- インポート元のサーバーで SSL が有効な場合は、チェックボックスをオンにします。
- インポートしているサーバーが認証を要求する場合には、「★ユーザー/パスワード認証を使用」チェックボックスをオンにして、有効なユーザー名とパスワードを指定します。
- インポート中に転送するコンテンツに「フルコンテンツの増分収集を使用」、または「検索クエリの使用」を指定します。
- 「検索クエリの使用」を選択した場合は、クエリを定義します。
- エージェントの説明、最新リソース記述のデータ作成、ネットワークタイムアウト、およびインポートエージェントの文字セットを指定します。
- 「保存」をクリックします。
既存インポートエージェントを編集する
- iPlanet Directory Server Access Management Edition 管理コンソールに管理者としてログインします。
- 「サービス管理」を選択して、「サービス管理」に移動します。
- ナビゲーション区画の「検索」の横にあるプロパティの矢印を選択します。
- メニューバーから「データベース」、「インポート」を順に選択します。
- 編集するエージェントの右側にある「編集」リンクをクリックします。
- インポートエージェントに適切な属性を指定します。
データベースインポートの属性の情報については付録 F「検索の属性」を参照してください。
- 「保存」をクリックします。
インポートエージェントをすぐに実行する
- iPlanet Directory Server Access Management Edition 管理コンソールに管理者としてログインします。
- 「サービス管理」を選択して、「サービス管理」に移動します。
- ナビゲーション区画の「検索」の横にあるプロパティの矢印を選択します。
- メニューバーから「データベース」、「インポート」の順に選択します。
- エージェントを実行するために、「オン」ボタンをクリックします。
- 「実行」をクリックします。
処理するインポートエージェントのスケジュールを設定する
- iPlanet Directory Server Access Management Edition 管理コンソールに管理者としてログインします。
- 「サービス管理」を選択して、「サービス管理」に移動します。
- ナビゲーション区画の「検索」 の横にあるプロパティの矢印を選択します。
- メニューバーから「データベース」、「インポート」の順に選択します。
- エージェントを実行するために、「オン」ボタンをクリックします。
- 「保存」をクリックします。
- メニューバーの「スケジュール」を選択します。
- インポート処理を開始する曜日と時刻を選択します。
- 「保存」および「クーロン の開始」を選択します。
RD の編集
RD のコンテンツの変更が必要になることがあります。 たとえば、元のドキュメントから RD にコピーしたときに、スペルミスまでコピーした場合には、スペルの修正が必要になります。
RD を編集する
- iPlanet Directory Server Access Management Edition 管理コンソールに管理者としてログインします。
- 「サービス管理」を選択して、「サービス管理」に移動します。
- ナビゲーション区画の「検索」の横にあるプロパティの矢印を選択します。
- メニューバーで「データベース」、「編集」の順に選択します。
- 検索する RD のタイプを選択して編集します。
ここでは、 「すべての RD」、「カテゴリ化されていない RD」、「カテゴリ化された RD」、「カテゴリごとの RD」、「URL 特定の RD」、「RD を検索」を選択できます。
- 「RD を検索」では、RD で検索するテキスト文字列を指定します。
- 「検索」をクリックします。
- 見つかったリソース記述のリストで、編集する RD を選択します。
- 適切なリソース記述属性を編集します。
- 「保存」をクリックします。
データベーススキーマの編集
スキーマは、検索エンジンで管理するリソースごとの情報とその形式を決定します。 スキーマの設計によって、インデックスの有用性に影響する次の 2 つの要因が決まります。
- ユーザーがリソースを検索する方法
- ユーザーがリソース情報を表示する方法
スキーマはデータベースの RD のマスタデータ構造です。 データ構造のフィールドインデックスの作成方法と定義方法によって、リソースへのアクセス頻度が変わります。
スキーマは、検索エンジンとそのロボットが使用するファイルの構造に密接に結びついています。 管理コンソールでスキーマツールを使用して、データ構造を変更するだけです。 スキーマファイル (schema.rdm) は、それがテキストファイルの場合でも、直接編集しないでください。
検索エンジンのデータベーススキーマを編集すると、新規のスキーマ属性の追加、スキーマ属性の編集、または属性の削除ができます。
スキーマには次の属性があります。
- 編集可能 - オンの場合、この属性は RD エディタに表示される属性を示すので、ユーザーは値を変更できます。RD エディタについては「RD の編集」を参照してください。
- インデックス作成可能 - オンの場合、この属性は「詳細検索」画面のポップアップメニューにフィールドが表示されることを示します。 ユーザーは特定のフィールドにある値を検索できます。
- 記述 - これはスキーマの記述に使用するテキスト文字列です。 コメントや注釈に使用します。
- 別名 - この属性は、インポートしたデータベーススキーマ名をユーザー独自のスキーマに変換するための別名を定義します。
データベーススキーマを編集する
- iPlanet Directory Server Access Management Edition 管理コンソールに管理者としてログインします。
- 「サービス管理」を選択して、「サービス管理」に移動します。
- ナビゲーション区画の「検索」の横にあるプロパティの矢印を選択します。
- メニューバーで「データベース」、「スキーマ」の順に選択します。
「スキーマ」属性ページが表示されます。
- スキーマへ新しい属性を追加します。
- 「名前」および「説明」フィールドに、新しい属性の名前と説明を入力します。
- 「編集可能」をオンにして、属性を編集可能にします。
- 「インデックス作成可能」をオンにして、属性インデックスを作成可能にします。
- 「追加」をクリックします。
- 既存の属性を編集可能にするか、あるいはインデックスを作成可能にするには、次の手順を行います。
- 「スキーマ」リストで属性を選択します。
- 「編集可能」をオンにして、属性を編集可能にします。
- 「インデックス作成可能」をオンにして、属性インデックスを作成可能にします。
- 「更新」をクリックします。
- 次の手順で属性を削除します。
- スキーマリストで属性を選択します。
- 「削除」をクリックします。
スキーマの別名の定義
一部のインスタンスの名前は、データベーススキーマのフィールド名と矛盾している可能性があります。 1 つはサーバーから別のサーバーへ RD をインポートするときのものです。 2 つのサーバーのスキーマの項目名が同一であることを、常に保証することはできません。 同様に、ロボットが HTML META タグをドキュメントからスキーマフィールドに変換するときは、名前はドキュメントによって制御されます。
検索エンジンは、ユーザーのスキーマ属性にスキーマの別名を定義して、外部スキーマ名をデータベースのフィールドに有効な名前にマッピングできるようにします。
スキーマを別名で定義する
- iPlanet Directory Server Access Management Edition 管理コンソールに管理者としてログインします。
- 「サービス管理」を選択して、「サービス管理」に移動します。
- ナビゲーション区画の「検索」の横にあるプロパティの矢印を選択します。
- メニューバーで「データベース」、「スキーマ」の順に選択します。
「スキーマ」属性ページが表示されます。
- 別名を定義する属性をクリックします。
- インポートしたデータベースで使用するフィールド名を指定します。
- 「更新」をクリックします。
- 「インデックス再作成」をクリックします。
大規模なデータベースの場合、インデックスの再作成プロセスに数時間かかることがあります。
データベース分析の表示
検索エンジンのレポートには、インデックスを作成したサイトの数、およびデータベースの各サイトのリソースの数を含む情報が含まれます。
データベース分析情報を表示する
- iPlanet Directory Server Access Management Edition 管理コンソールに管理者としてログインします。
- 「サービス管理」を選択して、「サービス管理」に移動します。
- ナビゲーション区画の「検索」の横にあるプロパティの矢印を選択します。
- メニューバーで「データベース」、「分析」の順に選択します。
現在検索データベースに存在するすべてのサイトをソートしたリストと、各サイトのリソースの数です。
- 「保存」を選択して最新のリストを生成します。
データベースのインデックスの再作成
一部のインスタンスでは、検索エンジンが使用する RD データベースのインデックスを再作成する必要があります。 わかりやすい例は、スキーマを編集してインデックスフィールドを追加または削除する場合です。
ディスクエラーによってインデックスファイルが破損した場合にも、データベースのインデックスを再作成する必要があります。 また、新規の RD を大量に追加したあとにインデックスを再作成することも有効です。
データベースのインデックスを再作成するのに、数時間を要する場合があります。
データベースのインデックスの再作成に要する時間は、データベースに含まれるレコードの数に比例します。大型のデータベースでは、サーバーの負荷が低い時にインデックスの再作成を行う必要があります。
データベースのインデックスを再作成する
- iPlanet Directory Server Access Management Edition 管理コンソールに管理者としてログインします。
- 「サービス管理」を選択して、「サービス管理」に移動します。
- ナビゲーション区画の「検索」 の横にあるプロパティの矢印を選択します。
- メニューバーの「データベース」、「再インデックス作成」の順に選択します。
- 「データベースのインデックスを再作成しますか?」をオンにして、「OK」をクリックします。
検索エンジンによって、検索コレクションとそのインデックスファイルが再構築されます。
データベースの期限切れ
データベースが期限切れになると、古くなった RD も期限切れになります。 RD が期限切れになるのは、期限切れを実行するときだけです。 期限切れになった RD が削除されても、データベースのサイズは減少しません。
データベースを期限切れにする
- iPlanet Directory Server Access Management Edition 管理コンソールに管理者としてログインします。
- 「サービス管理」を選択して、「サービス管理」に移動します。
- ナビゲーション区画の「検索」 の横にあるプロパティの矢印を選択します。
- メニューバーの「データベース」、「期限切れ」の順に選択します。
- 「RD を期限切れにしますか ?」をオンにして、「OK」をクリックします。
データベースの破棄
RD の属性の 1 つはその有効期限です。 ロボットは HTML META タグ、またはリソースのサーバーが提供する情報を基に有効期限を設定します。 リソースが有効期限を指定しない限り、RD はデフォルトで作成から 3 カ月有効です。 期限切れの RD は、検索エンジンによって定期的にデータベースから破棄する必要があります。
破棄を実行すると、データベースのコンテンツを削除できます。 これによって、インデックス用のディスク領域は回復しますが、メインデータベースのディスク領域は回復できません。これは、この領域が新規のデータをデータベースに追加したときに再利用されるためです。
サーバーから期限切れの RD を破棄する手順
- iPlanet Directory Server Access Management Edition 管理コンソールに管理者としてログインします。
- 「サービス管理」を選択して、「サービス管理」に移動します。
- ナビゲーション区画の「検索」 の横にあるプロパティの矢印を選択します。
- メニューバーで「データベース」、「破棄」の順に選択します。
- 「データベースを破棄しますか?」をオンにして、「OK」をクリックします。
破棄が完了すると、システムに「データベースのコンテンツは正常に破棄されました」というメッセージが表示されます。
データベースのパーティションの作成
検索エンジンを使用すれば、複数のディスク、ファイルシステム、ディレクトリ、またはパーティションにまたがる検索データベースの物理ファイルを分割できます。 異なる物理デバイス、または論理デバイスにデータベースを拡張することで、単一のデバイスを使用するよりも大きなデータベースにできます。
デフォルトでは、検索エンジンは 1 つのディレクトリだけを使用するデータベースを設定します。 コマンド行インターフェイスを使用すると、データベースパーティションに次の 2 種類の操作を実行できます。
- 新しいパーティションの追加
- パーティションの移動
検索エンジンは、各パーティションに空き領域があるかどうかを確認しません。 データベースに適切な空き領域を確保するのは、ユーザーの作業です。
データベースのパーティションは、合計で最大 15 個追加できます。
注 一度パーティションの数を増やすと、あとでパーティションの数を減らすときに、データベース全体を削除する必要があるので注意してください。
新しい場所の名前を指定することで、データベースパーティションの物理的な場所も変更できます。 同様に、既存のパーティションの名前も変更できます。 パーティションを操作するには rdmgr コマンドを使用します。 rdmgr コマンドの詳細については第 12 章「コマンド行ユーティリティ」を参照してください。
データベースの最適化
ロボットを繰り返し実行すると、データベースファイルとインデックスが空き領域によって細分化されるので、必要以上のディスク領域が占有されます。このため、ユーザー検索とロボット操作の両方で検索速度が低下します。 この問題を解決するには、定期的にデータベースを最適化します。 データベースを最適化するには、rdmgr コマンドを使用します。 rdmgr コマンドの詳細については第 12 章「コマンド行ユーティリティ」を参照してください。
データベース分類の管理
次に、データベース分類を管理するために必要な設定とメンテナンスを示します。
カテゴリの設定
iPlanet Directory Server Access Management Edition 管理コンソールを使用してデータベース分類を設定するには、次の手順を行います。
子カテゴリの作成
- iPlanet Directory Server Access Management Edition 管理コンソールに管理者としてログインします。
- 「サービス管理」を選択して、「サービス管理」に移動します。
- ナビゲーション区画の「検索」の横にあるプロパティの矢印を選択します。
- メニューバーから「カテゴリ」、「カテゴリエディタ」の順に選択します。
- 子カテゴリを作成するカテゴリを選択します。
それまでにカテゴリを定義していない場合、一覧表示されるのは、「検索」タイトルの付いたルートカテゴリだけです。 下位への検索リンクを選択して、ルートカテゴリを展開します。
- 「名前」フィールドに、カテゴリの名前を指定します。
- 「説明」フィールドに、カテゴリの説明を指定します (オプション)。
- 「子として追加」をクリックして、カテゴリを作成します。
- 「保存」をクリックします。
兄弟カテゴリの作成
- iPlanet Directory Server Access Management Edition 管理コンソールに管理者としてログインします。
- 「サービス管理」を選択して、「サービス管理」に移動します。
- ナビゲーション区画の「検索」の横にあるプロパティの矢印を選択します。
- メニューバーから「カテゴリ」、「カテゴリエディタ」の順に選択します。
- シブリングカテゴリを作成するカテゴリを選択します。
- 「名前」フィールドに、カテゴリの名前を指定します。
- 「説明」フィールドに、カテゴリの説明を指定します (オプション)。
- 「兄弟として追加」をクリックして、カテゴリを作成します。
- 「保存」をクリックします。
カテゴリの更新
- iPlanet Directory Server Access Management Edition 管理コンソールに管理者としてログインします。
- 「サービス管理」を選択して、「サービス管理」に移動します。
- ナビゲーション区画の「検索」 の横にあるプロパティの矢印を選択します。
- メニューバーから「カテゴリ」、「カテゴリエディタ」の順に選択します。
- 更新するカテゴリを選択します。
- カテゴリ名を変更するには、「名前」フィールドにカテゴリの新しい名前を指定します。
- カテゴリの説明を変更するには、「説明」フィールドにカテゴリの説明を指定します。
- 「更新」をクリックします。
- 「保存」をクリックします。
カテゴリの削除
- iPlanet Directory Server Access Management Edition 管理コンソールに管理者としてログインします。
- 「サービス管理」を選択して、「サービス管理」に移動します。
- ナビゲーション区画の 検索 の横にあるプロパティの矢印を選択します。
- メニューバーから「カテゴリ」、「カテゴリエディタ」の順に選択します。
- 削除するカテゴリを選択します。
カテゴリを削除すると、すべての子カテゴリも削除されます。
- 「削除」をクリックします。
- 「保存」をクリックします。
分類規則の定義
分類規則は簡単な条件付きステートメントです。 その形式は「 <ある条件>が真であれば、リソースを<カテゴリ>に割り当てる」です。
分類規則を定義する
- iPlanet Directory Server Access Management Edition 管理コンソールに管理者としてログインします。
- 「サービス管理」を選択して、「サービス管理」に移動します。
- ナビゲーション区画の「検索」の横にあるプロパティの矢印を選択します。
- メニューバーで「カテゴリ」、「分類ルールエディタ」の順に選択します。
- 既存の規則を編集する場合は、その規則を選択します。
- ドロップダウンメニューから、使用する要素タイプまたは属性をクリックして、リソースを分類します。
- ドロップダウンメニューから、比較テストをクリックします。
使用可能な比較テストは文字列が等しい、文字列を含む、始めの文字列が等しい、終りの文字列が等しい、または正規表現です。
- 比較するテキスト文字列を定義します。
- 比較が真の場合は、リソースを分類するカテゴリをクリックします。
- 新しい規則を作成する場合は、「追加」を選択します。
- 既存の規則を編集する場合は、「更新」を選択します。
カテゴリツリーのインデックスの再作成
常にカテゴリを最新の状態に保ち、ユーザーが使用できるようにするには、カテゴリを変更するたびにカテゴリツリーのインデックスを再作成する必要があります。
カテゴリツリーのインデックスの再作成
- iPlanet Directory Server Access Management Edition 管理コンソールに管理者としてログインします。
- 「サービス管理」を選択して、「サービス管理」に移動します。
- ナビゲーション区画の「検索」の横にあるプロパティの矢印を選択します。
- メニューバーで「カテゴリ」、「再インデックス作成」の順に選択します。
- 「カテゴリツリーのインデックスを作成しますか ?」チェックボックスをオンにして、「OK」を選択します。
インデックスの再作成が終了すると、進行状況のメッセージが表示されます。