Sun ONE ロゴ      前へ      目次      索引      次へ     

Sun ONE Portal Server 6.2 管理者ガイド

付録 F
検索の属性

この付録では、Sun ONE Identity Server 管理コンソールを利用して検索エンジンに設定できる属性について説明します。

「サービス管理」から「検索」を選択すると、タブを持つ 2 色のメニューバーが表示されます。この付録は、メニューバー上部のトピックス (タブ) に従って構成されています。

上記のいずれかのタブを選択すると、それに関連するサブトピックが下のメニューバーに一覧表示されます。デフォルトの検索ページでは、「サーバーの設定」が選択されます。それぞれのサブトピックでは、1 つまたは複数の表を使用して、サブトピックの属性について説明します。この表には、属性、デフォルト値、説明の列があります。「属性」は、ページに表示される項目名を示します。「デフォルト値」は「属性」のデフォルト値、「説明」は「属性」の説明とその形式を示します。

表 F-1 は、それぞれの「検索」ページで使用できる「サーバーの選択」属性を示します。

表 F-1 検索サーバーの選択属性

属性

デフォルト値

説明

サーバーの選択

http://servername:80/portal

検索サーバーの完全修飾サーバー名

サーバー

「サーバー」セクションでは、サーバーの設定を行います。一時ファイルとして使用するディレクトリを選び、ログにどの情報を、どの程度詳細に記録するかを選択します。「サーバー」属性は 2 つのページに表示されます。

設定

このページには、検索サーバーの管理および操作に関する基本設定が含まれます。

表 F-2 サーバー設定属性 

属性

デフォルト値

説明

サーバールート

/var/opt/SUNWps/https-serv ernamefull/portal

設定、ログ、データベースおよびロボット 情報ファイルを格納する。検索を実行した ときに作成、および更新されるすべての検 索ファイルのルートディレクトリでもある。 このディレクトリの設定は変更できない

一時ファイル

/var/opt/SUNWps/https-serv ernamefull/portal/tmp

検索中に検索の管理に使用されるすべての 一時ファイルを格納する。このファイルに は、メインデータベースにはまだ追加され ていない、新しく生成されたリソース記述 も含まれる。検索が完了すると、これらの ファイルは削除される

ドキュメントレベルの セキュリティ

オフ

ドキュメントにアクセスできるユーザーを 制御する

設定を変更した場合は、サーバーを再起動 する必要がある

値 :

  • オフ (デフォルト) に設定すると、すべてのユーザーが RD にアクセス可能になる
  • オン に設定すると、アクセスしようとしているユーザーがアクセス権を持つかどうかについて、RD の ReadACL フィールドが調べられる。アクセス権を持つユーザーは、アクセスが許可された組織またはロールに所属するか、個人的にアクセスが許可されている。ReadACL フィールドは、「データベース」ページ、「リソース記述」ページで設定される

ロボット

このページには、検索サーバーの管理および操作に関する詳細設定が含まれます。ここでは、ユーザークエリ、インデックスのメンテナンス、リソース記述の管理、およびデバッグ用のそれぞれのログファイルを設定します。

表 F-3 サーバーの詳細設定属性 

属性

デフォルト値

説明

検索 (rdm)

/var/opt/SUNWps/https-serv ername/portal/logs/rdm.lo g

エンドユーザーが作成したデータベースの クエリを記録する。「検索ログを無効にす る」チェックボックスにチェックマークを 付けると、このログは記録されない

この場合、ユーザークエリ (rdm) レポート を表示することはできない

検索ログを無効にする

False (チェックボックスがオフ) - 有効

クエリログの使用を制御する

レポートセクションでは、このログを基に、 最もよく使用されるクエリを一覧表示した レポートを作成する

値 :

  • チェックボックスがオン : 無効
  • チェックボックスがオフ : 有効。ユーザークエリは、すべてこのログに入力される

インデックスのメンテ ナンス

/var/opt/SUNWps/https-serv ername/portal/logs/search engine.log

検索エンジンに関連するトランザクション を記録する。リソース記述の登録は記録さ れない

RD マネージャ

/var/opt/SUNWps/https-serv ername/portal/logs/rdmgr. log

ロボットまたはインポートエージェントか らデータベースへ登録したリソース記述の 記録。このログは、RD マネージャ (rdmgr) レポートとして表示される

RDM サーバー

/var/opt/SUNWps/https-serv ername/portal/logs/rdmser ver.log

RDM トランザクション上のデバッグ情報 を記録する。詳細レベルは、ログレベル で 制御する。このログは、RDM サーバー (rdmsvr) レポートとして表示される

ログレベル

1

RDM サーバーログファイルに含まれる詳 細情報の量を制御する

指定できるレベルは、2、10、20、50、100 および 999

1 (デフォルト) に設定すると、エラーのみ が記録される。値を大きくするほど、RDM サーバーのログファイルに含まれる情報が 詳細になる

ロボット

ロボットのプロパティは、非常に複雑です。検索 (クローリング) するサイトを決めたら、そのサイトが有効かどうかを確認し、取得するドキュメントのタイプを決め、検索を行うスケジュールを決めます。

ここで説明する内容は次のとおりです。

概要

「ロボットの「概要」」には、ロボットの動作が表示されます。このパネルは 30 秒ごとに更新され、ロボットの状態がオフ、アイドリング、実行中、一時停止のどの状態にあるのかを示します。実行中の場合は、検索のどの段階が処理されているか、その進捗状況が示されます。更新頻度は、search.conf ファイルの robot-refresh パラメータで定義されます。

右上の 2 つのボタンは、それぞれ状態に合わせて切り替わります。ロボットがオフの場合、ボタンは「開始」または「状態を削除」になります。実行中またはアイドリング状態の場合は、ボタンは「終了」または「一時停止」になります。一時停止状態の場合、ボタンは「終了」または「再開」になります。「属性」ボタンのいずれかを選択すると、「レポート」セクションに切り替わり、その属性の最新の詳細レポートを表示できます。

表 F-4 ロボットの「概要」属性 

属性

デフォルト値

説明

ロボットは

現在の状態

ロボットの状態。値は、アイドル実行中一時停止、または オフ

更新時刻

最終更新日時

ロボットによる作業の進捗状況を示すため に、このページは更新される

開始位置

指定された数値

検索対象として選択したサイト数。サイト は「ロボット」、「サイト」ページでは、無 効 (検索されない) になる

URL プール

待機中の URL の数

調査する URL の数。検索を開始すると、開 始位置の URL が URL プールに入力される。 検索作業が進行すると、ロボットは他の URL へのリンクを発見する。これらの URL はプールに追加される。プール内のす べての URL が検索されると、URL プール は空になり、ロボットはアイドリング状態 になる

抽出

秒あたりの接続数

1 秒あたりに参照されたリソース数

抽出とは、データベースに取り込むリソー ス、ドキュメント、またはハイパーリンク を発見し、不要な項目をフィルタリングす るプロセスである

フィルタリング

拒否された URL の数

除外された URL の総数

インデックス作成

秒あたりの URL の数

1 秒間にリソース記述に変換されるリソー スまたはドキュメントの数

インデックス作成とは、検索データベース に取り込むために、ドキュメントに収集さ れたすべての情報をリソース記述に変換す る段階である

除外 URL

フィルタによって除外された URL の数

フィルタリング条件を満たさなかった URL の数

 

エラーによって除外された URL の数

ロボットでファイルが見つからないという エラーが検出された URL の数

リソース記述

提供された RD の数

データベースに追加されたリソース記述の 数

 

提供された RD のバイト数

データベースに追加されたバイト数

全体の状態

取得された URL の数

実行中に取得された URL の数

 

RD の平均サイズのバイト数

リソース記述あたりの平均バイト数

 

稼動時間 (日数、時間、分および 秒)

ロボットを実行した時間

サイト

このセクションの最初のページには、検索を実行できるサイトが表示されます。

ラジオボタンを使用して、サイトを「オン」または「オフ」にできます。ロボットを実行しても、オフにしたサイトは検索されません。「編集」リンクは、検索サイトを定義する方法を変更するページを表示します。

サイトを削除するには、チェックボックスをオンにして、「削除」をクリックします。

新しいサイトを追加するには、「新規」をクリックします。URL またはドメインをテキストボックスに追加し、検索の深さを選択します。「作成」を選択すると、デフォルト値を使用して作成します。または、デフォルト以外の値を使用するために、「作成と編集」をクリックし、「編集」ページへ進み検索サイトを定義します。

表 F-5 ロボット管理サイト属性

属性

デフォルト値

説明

ロックまたはクラスタ の画像

サイトの状態

開いたロックは、URL にアクセス可能なこ とを意味する。閉じられたロックは、サイ トが安全な Web サーバーであり、SSL を使 用していることを意味する。クラスタは、 サイトがドメインであることを意味する

オン/オフ

オン

ロボットが実行しているときに、このサイ トを検索するか、しないかを指定する

「新規サイト」ページでは、インデックスを作成するサイト全体の設定ができます。

表 F-6 ロボットの新規サイト属性

属性

デフォルト値

説明

新規サイト

URL

URL の形式は、  http://www.sesta.com

ドメインの形式は、  *.sesta.com

深さ

10

この URL のみは 1、URL と最初のリンクは 2、ロボットは 100、さらに、3〜10、また は無制限から選択する。デフォルト値は、 「ロボット」、「クローリング」ページで設定 する

編集ページでは、検索サイトをより詳細に定義できます。サーバータイプの指定、検索の深さの再定義、および検索データベースに追加するファイルタイプの指定ができます。URL とドメインサイトの属性は、大部分は同じです。この表に追加されている列は、どの属性が共有され、どれが固有であるかを示します。

このページでは、多くの操作が行われます。入力した検索サイトのサーバー名を確認できます。「サーバーグループ」セクションで「追加」をクリックすると、サーバーグループにさらにサーバーを追加できます。「開始位置」セクションで「追加」をクリックすると、開始位置をさらに追加できます。「フィルタ定義」セクションでは、特定のタイプのファイルを追加または削除、除外または取り込むことができ、これらのファイルに適用するフィルタの順序も変更できます。

表 F-7 ロボットのサイト編集属性 

属性

URL またはドメイン

デフォルト値

説明

サイトのニックネーム

URL / ド メイン

入力されたサイト : www.sesta.com

最初のページに表示される名 前。デフォルトは、入力された URL またはドメイン。この名前 をここで変更できる

削除または確認するサ イトを選択するチェッ クボックス

URL / ド メイン

チェックボックスがオフ

チェックボックスがオフ : 選択 されない

チェックボックスがオン : 選択 される

サーバーグループ名

URL

URL : www.sesta.com

単一サーバーまたは単一サー バーの一部。エントリにはホス ト名全体を含める必要がある。 ホスト名だけを指定すると、そ のホストだけにサイトが制限さ れる。ホスト名に加えてディレ クトリ情報を入力すると、サイ トはそのディレクトリおよびす べてのサブディレクトリとして 定義される

ドメインのサフィック ス

ドメイン

入力されたドメイン : *.sesta.com

*.sesta.com のように、ドメ イン内のすべてのサーバーを含 む

ポート

URL / ド メイン

URL は 80、ドメインでは空白

検索中のサイトが別のポートを 使用する場合は、そのポートを 入力する

タイプ

URL

Web サーバー

Web サーバー、ファイルサー バー、FTP サーバー、セキュリ ティ保護された Web サーバー

許容されるプロトコル

ドメイン

すべてのチェックボックスがオ ン

http、file、ftp、https のチェッ クボックス

開始位置 : 削除するサイ トを選択するための チェックボックス

URL / ド メイン

チェックボックスがオフ

チェックボックスがオフ : 選択 されない

チェックボックスがオン : 選択 される

開始位置 : URL

URL / ド メイン

http:// URL:80

URL またはドメイン

開始位置 - 深さ

URL / ド メイン

10

1 は、この URL のみ

2 は、この URL と最初のリンク

3-10

無制限

フィルタ定義 : 削除する ファイルのタイプを選 択するためのチェック ボックス

URL / ド メイン

チェックボックスがオフ

チェックボックスがオフ : 選択 されない

チェックボックスがオン : 選択 される

フィルタ定義

URL / ド メイン

デフォルトの順番 : アーカイブ ファイル、オーディオファイ ル、バックアップファイル、バ イナリファイル、CGI ファイ ル、イメージファイル、Java、 JavaScript、スタイルシート ファイル、ログファイル、レビ ジョンコントロールファイル、 ソースコードファイル、一時 ファイル、ビデオファイル

選択可能なファイルは次のとお り : アーカイブファイル、オー ディオファイル、バックアップ ファイル、バイナリファイル、 CGI ファイル、イメージファイ ル、Java、JavaScript、スタイル シートファイル、ログファイ ル、パワーポイントファイル、 レビジョンコントロールファイ ル、ソースコードファイル、一 時ファイル、ビデオファイル、 スプレッドシートファイル、プ ラグインファイル、ロータスド ミノドキュメント、ロータスド ミノ OpenView、システムディ レクトリ (UNIX)、システム ディレクトリ (Windows)

コメント

URL / ド メイン

空白

サイトの説明を記述するテキス トフィールド。ロボットはこれ を使用しない

DNS 変換

URL

空白

DNS 変換は、ドメイン名または エイリアスを cname に変換し、 URL および クローリングの方 法を変更する。形式 : alias1->cname1,alias2->cname1

フィルタ

このセクションの最初のページには、定義されているすべてのフィルタルールと、それを使用するサイト定義が表示されます。それぞれのフィルタ名の前には、ドキュメントタイプを選択するためのチェックボックスと、フィルタルールをオン、オフするための 2 つのラジオボタンがあります。チェックボックスにチェックマークを付けると、そのフィルタを選択して削除することができます。新規フィルタを追加するには「新規」をクリックします。新規フィルタのページは「編集」ページを簡略化したもので、1 つのニックネームと 1 つのルールだけが要求されます。もう 1 つのオプションとして「編集」リンクがあります。これを選択すると、特定のファイルタイプに対するルールやフィルタの動作を定義するページへ移動します。それぞれのルールは、フィルタソースのドロップダウンリスト、検索条件のドロップダウンリスト、およびフィルタ文字列の詳細を入力するテキストボックスで構成されています。

表 F-8 ロボットのフィルタ編集の属性 

属性

デフォルト値

説明

フィルタ名

新しい名前を入力するプロンプト。編 集のために選択するファイルタイプの ファイル名

そのフィルタを適用するファイルタ イプを反映する、明確な名前

フィルタソースのドロッ プダウンリスト

新規フィルタでは URL。そのファイ ルタイプ用に、以前に選択された情報 が表示される

URL、プロトコル、ホスト、パス、 MIME タイプ

選択基準のドロップダウ ンリスト

新規フィルタでは is。そのファイル タイプ用に、以前に選択された情報が 表示される。たとえば、バイナリファ イルでは exe で終わる (ends with)

「である (is)」、「を含む (contains)」、 「で始まる (begins with)」、「で終わる (ends with)」、「正規表現 (regular expression)」

タイプ (ディレクトリ、 プロトコル、ファイル拡 張子) を指定するテキス トボックス

新規フィルタの場合は空白。そのファ イルタイプ用に、以前に入力された情 報が表示される。たとえば、/tmp/ を含む (contains) 一時ファイル

このテキストボックスに、一致させ る項目を列挙する。たとえば、 http://docs.sesta.com/manual.html と一致する項目は

プロトコルは http、ホストは sesta を 含む。ファイル名は html で終わる

説明

新しい説明を入力するプロンプト。以 前入力したそのファイルタイプの説明 が表示される

フィルタ規則の説明。ロボットはこ れを使用しない

新規サイト

新規フィルタの場合は、True (チェッ クボックスがオン)。そのファイルタ イプ用に以前に選択された値が表示さ れる

これは、新規サイトの作成時にデ フォルトフィルタの 1 つとして使用 される。このチェックボックスをオ ンにしなくても、「ロボット」、「サイ ト」ページでサイトを編集してこの フィルタを新規サイトに追加できる

デフォルト

新規フィルタの場合は何も選択されて いない。定義済みのファイルタイプ用 に、以前に選択されたデフォルト

このフィルタと一致するドキュメン トを除外する

このフィルタと一致するドキュメン トを含める

新規フィルタ用の選択は、既存のサ イト定義には影響しない。新規フィ ルタを既存のサイトで使用するには、 「ロボット」、「サイト」ページでサイ トを編集して追加する

属性

このフィルタを使用するサイトが一覧 表示される

 

クローリング

このページの設定によって、ロボットのオペレーションパラメータとデフォルトを制御します。速度、完了のアクション、ログファイルの設定、標準への準拠、認証パラメータ、プロキシ、詳細設定、およびリンクの抽出のセクションに分けられます。

表 F-9 ロボットのクローリング属性 

属性

デフォルト値

説明

サーバー遅延

遅延なし

遅延なし (デフォルト)、1 秒、2 秒、5 秒、 10 秒、30 秒、1 分、5 分

最大接続数 : 同時に取得 する URL 数の最大値

8

1、2、4、8 (デフォルト)、10、12、16、20

サイトあたりの最大接 続

2

(無制限)、1、2、4、8、10、12、16、20

RD を送信してすべての インデックスを作成

30 分

3 分、5 分、10 分、15 分、30 分 (デフォル ト)、1 時間、2 時間、4 時間、8 時間

起動スクリプト

なし (デフォルト)

なし (デフォルト)。サンプルファイルは、 /opt/SUNWps/samples/robot ディレク トリ (デフォルトのインストール) の cmdHookファイルを参照

すべての URL の処理後

アイドル (デフォルト)

アイドル状態になる (デフォルト)、シャッ トダウン、やり直し

連絡先の電子メール

user@domain

電子メールアドレスを入力する

ログレベル

1 : 生成

0 エラーのみ、1 生成 (デフォルト)、2 列 挙、変換、3 フィルタリング、4 作成、5 取 得。

ユーザーエージェント

SunONERobot/6.0

検索サーバーのバージョン

robots.txt プロトコルを 無視

False (チェックボックスがオフ)

サーバーの中には、robot.txt ファイル にロボットによる検索を拒否する記述をし たものがある。このファイルを持つサイト に遭遇した場合、属性が false の時にロボッ トはそのサイトを検索しない。この属性が true の場合、ロボットはファイルを無視し てそのサイトを検索する

認証の実行

はい

はい

いいえ

ロボットのユーザー名

匿名

ロボットは匿名のユーザー名を使用してサ イトにアクセスする

パスワード

user@domain

匿名ユーザーを認めるサイトの多くは、パ スワードとして電子メールアドレスを要求 する。このアドレスはプレーンテキストで ある

プロキシのユーザー名

匿名

ロボットは匿名のユーザー名を使用してサ イトにアクセスする

パスワード

user@domain

匿名ユーザーを認めるサイトの多くは、パ スワードとして電子メールアドレスを要求 する。このアドレスはプレーンテキストで ある

プロキシ接続タイプ

インターネットへの直接接続

インターネットへの直接接続、プロキシ (自 動設定)、プロキシ (手動設定)

自動プロキシ設定/タ イプ

ローカルプロキシファイル

ローカルプロキシファイル、リモートプロ キシファイル

自動プロキシ設定/位 置

空白

自動プロキシのファイルには、必要なプロ キシ情報すべての一覧が含まれる

ローカルプロキシファイルの例は、 robot.pac を参照。リモートプロキシファイ ルの例は、 http://proxy.sesta.com:8080/prox y.pac を参照

手動プロキシ設定 /HTTP プロキシ

空白

形式 : server1.sesta.com:8080。これ ら 3 つの手動設定値は、 /var/opt/SUNWps/https-servername/p ortal/config ディレクトリにある robot.pac ファイルに保存される

手動プロキシ設定 /HTTPS プロキシ

空白

この手動設定値は、robot.pac ファイル に保存される

形式 : server1.sesta.com:8080

手動プロキシ設定/FTP プロキシ

空白

この手動設定値は、robot.pac ファイル に保存される

形式 : server1.sesta.com:8080

HTML のリンクを追跡

True (チェックボックスがオン)

HTML からハイパーリンクを抽出する

最大リンク数

1024

1 つの HTML リソースから、ロボットが抽 出できるリンク数を制限する。ロボットが サイトを検索すると、他のリソースへのリ ンクも発見するため、場合によっては多数 のリンクをたどって元の開始位置から極端 に離れたリンクまで追ってしまう可能性が ある

プレーンテキストのリ ンクを追跡

False (チェックボックスがオフ)

プレーンテキストからハイパーリンクを抽 出する

最大リンク数

1024

1 つのテキストリソースから、ロボットが 抽出できるリンク数を制限する

Cookie の使用

False (チェックボックスがオフ)

True (チェックボックスがオン) の場合、 ロボットはクローリングの際に cookie を使 用する。クッキーを使用しないと、正常に ナビゲートできないサイトも存在する。 cookie はロボットの状態ディレクトリにあ る cookies.txt ファイルに保存される。 cookies.txt の形式は、NetscapeTM Communicator のブラウザで使用されてい る形式と同じ

IP をソースとして使用

True (チェックボックスがオン)

ほとんどの場合、ロボットはリソースのド メイン名だけを対象に動作する。場合に よっては、インターネットプロトコル (IP) アドレスによるサブネットに基づいて、 フィルタリングまたは分類を可能にする必 要もある。この場合、ドメイン名に加えて IP アドレスの取得も、ロボットに対して明 示的に許可する必要がある。IP アドレスを 取得するには、DNS をさらに検索する必要 があるため、ロボットの動作速度が低下す る。必要のない場合は、このオプションを オフにするとパフォーマンスが向上する

ホストの発見的解決

False (チェックボックスがオフ)

チェックマークを付けた場合、ロボットは サーバーが使用する共通の代替ホスト名を 単一の名前に変換する。この設定は、1 つ のサイトが同じアドレスのエイリアスとし て、複数のサーバーを持っている場合に最 も便利である。たとえば、 www.sesta.com というサイトには他にも、 www1.sesta.comwww2.sesta.com な どの名前を持つ場合がある

このオプションをオンにすると、wwwn (こ の n は任意の整数) で始まるすべてのホス ト名が内部で www に変換される。この属性 はホスト名が wwwn で始まる場合にのみ有 効である

この属性は CNAME 解決がオフ (False) の 場合は使用できない

ホスト名を CNAME に 解決

False (チェックボックスがオフ)

True の場合、ロボットは検出したすべての ホスト名の妥当性検査を行い、標準的なホ スト名に変換する。これにより、ロボット は固有の RD を正確に追跡できるようにな る。False (チェックボックスがオフ) の場 合、ロボットはホスト名の妥当性検査は行 うが、標準的なホスト名への変換は行わな い。このため、ロボットが検出したそれぞ れのホスト名に重複する RD がリストされ る可能性が生じる

たとえば、devedge.sesta.com は、 developer.sesta.com のエイリアスで ある。CNAME 解決がオンの場合、 devedge.sesta.com として参照された URL は、developer.sesta.com で検出 されたものとしてリストされる。CNAME 解決がオフの場合、RD は参照元である devedge.sesta.com を保持する

ホストの発見的解決は、CNAME 解決が オ フ (False) の場合には有効化できない

すべてのホストからの コマンドを受け入れる

False (チェックボックスがオフ)

ロボットの持つ制御機能のほとんどは、 TCP/IP ポート経由で動作する。この属性 は、ロボットがローカルホストからのコマ ンドだけを受け入れるか (False)、あるいは ネットワーク上からのコマンドをすべて受 け入れる (True) かを設定する

ロボットの直接制御をローカルホストに限 定する (False) ことが推奨される。この設定 でも、管理コンソールによるロボットの遠 隔制御は可能である

デフォルトの開始位置 の深さ

10

1 開始位置のみ、2 ブックマークスタイル、 3 〜 10、無制限。

ロボットがすべての開始位置からたどる、 ハイパーリンクレベルのデフォルト値。「ロ ボット」、「サイト」ページでのサイトの編 集により、どの開始位置に対しても深さを 設定できる

ワークディレクトリ

/var/opt/SUNWps/https-ser vernamefull/portal/tmp

ロボットがデータを保存するために使用す る、一時的な作業用ディレクトリの完全パ ス名。ロボットは、多数のドキュメントの 全内容を取得してこのディレクトリに保存 するため、ディレクトリには一度に大量の ドキュメントを扱うのに充分な容量が必要 である

状態ディレクトリ

/var/opt/SUNWps/https-ser vernamefull/portal/robot

ロボットが訪問した URL のリスト、URL プールなどの状態情報を保存するために使 用する、一時ディレクトリの完全パス名。 このデータベースのサイズは、かなり大き くなる可能性があるため、ワークディレク トリとは異なるパーティションに置くこと が推奨される

インデックス作成

ロボットはサイトを検索し、選択されたフィルタを基準にドキュメントを収集します。さまざまな形式のドキュメントが収集されます。収集したドキュメントを統一し、読みやすくするために、形式を HTML に統一します。このページでは、各リソース記述に関連するいくつかの部分を設定します。

表 F-10 ロボットのインデックスの属性 

属性

デフォルト値

説明

完全なテキスト/部分 的なテキスト

部分的なテキスト

完全なテキストの場合、リソース記述には 完全なドキュメントを使用する。部分的な テキストの場合、リソース記述にはドキュ メントの内から、指定されたバイト数だけ を使用する。

最初に抽出するバイト 数

4096

バイト数を入力する

目次を抽出

True (チェックボックスがオン)

True の場合、リソース記述に目次を含める

META タグのデータを 抽出

True (チェックボックスがオン)

True の場合、リソース記述に META タグ を含める

ドキュメントコンバー タ

すべてにチェックマークが付け られている (True)。False の場 合、そのタイプのドキュメント は、インデックスが作成されな い

Adobe PDF

Corel Presentations

Corel Quattro Pro

FrameMaker

Lotus Ami Pro

Lotus Freelance

Lotus Word Pro

Lotus 1-2-3

Microsoft Excel

Microsoft Powerpoint

Microsoft RTF

Microsoft Word

Microsoft Works

Microsoft Write

WordPerfect

StarOfficeTM Calc

StarOfficeTM Impress

StarOfficeTM Writer

XyWrite

コンバータのタイムア ウト

600

1 つのドキュメントを HTML に変換するた めに要する時間の許容値 (秒単位)。この時 間を超過した場合、その URL は除外される

シミュレータ

このページは、URL に対するロボットのフィルタリングを、部分的にシミュレートするデバッグツールです。新規の URL を入力してチェックすることができます。URL、DNS 変換 (ホストの発見的解決を含む)、およびサイトリダイレクトをチェックします。URL で指定されるドキュメントの内容はチェックしません。このため、重複、MIME タイプ、ネットワークエラー、許可などは検出しません。シミュレータは、一覧にあるサイトをロボットが受け入れる (同意) か、受け入れない (拒否) かを表示します。

表 F-11 ロボットシミュレータのプロパティ

属性

デフォルト値

説明

URL

定義済みの URL、および空白の テキストボックス

空白のテキストボックスに URL を入力し て、新規サイトへのアクセスをチェックで きる。新規のサイトがクローリングを許可 するかどうかをチェックする

形式 : http://www.sesta.com:80/

DNS エイリアスを確認

True (チェックボックスがオン)

True (チェックボックスがオン) の場合、 同じアドレスのエイリアスになっている サーバーの数をチェックする

サーバーリダイレクト を確認 (302)

True (チェックボックスがオン)

True (チェックボックスがオン) の場合、 サーバーのリダイレクトをすべてチェック する

サイトプローブ

このページは、DNS エイリアス、サーバーのリダイレクト、および仮想サーバーをチェックするデバッグツールです。このツールは、サイトに関する情報は返しますが、そのサイトがクローリングを許可するかどうかのテストは行いません。

表 F-12 ロボットのサイトプローブの属性

属性

デフォルト値

説明

サイト

空白

http://www.sesta.com:80 の形式で URL を入力する

DNS 情報の詳細を表示

False (チェックボックスがオフ)

True (チェックボックスがオン) の場合、 IP アドレスを含む、サイトに関する詳細な 情報を表示する

スケジュール

このページでは、ロボットの自動検索スケジュールを設定します。

表 F-13 ロボットのスケジュールの属性

属性

デフォルト値

説明

時間指定によるロボッ トの開始

00:00

ロボットが検索を開始する時刻

曜日

選択されていない

日、月、火、水、木、金、または土

少なくとも 1 つの曜日にチェックマークを 付ける

時間指定によるロボッ トの停止

00:00

ロボットを連続して作動させる場合でも、 毎日 1 回はロボットを停止し、再スタート することが推奨される。これにより、ロ ボットはリソースを解放して初期化するこ とができる

曜日

選択されていない

日、月、火、水、木、金、または土

データベース

データベースの属性は、次のように分けられています。

管理

「管理」の最初のページには、利用できるデータベースがリスト表示されます。新規作成、既存データベースのインデックスの再作成、パージ、および有効期限の無効化が可能です。処理の対象となるデータベースを選択するには、対応するチェックボックスにチェックマークを付けます。すべてのデータベースを選択または選択解除するときは、チェックボックスの上にある小さなアイコンを使用します。「インデックスの再作成」、「破棄」、「期限切れ」を選択すると、選択されているデータベースの名前と、処理の確認を求めるプロンプトが表示されます。処理を実行する場合は、「了解」を選択します。

スキーマを編集してインデックスを作成したフィールドを (作成者として) 追加または削除した場合、またはディスクエラーでインデックスが破損した場合は、データベースのインデックスを再作成する必要があります。スキーマを変更した後でサーバーを再起動する必要があります。

データベースのインデックスの再作成に要する時間は、データベースに含まれる RD の数に比例します。大型のデータベースでは、サーバーの負荷が低い時にインデックスの再作成を行う必要があります。

データベースの内容をパージすると、インデックス用のディスク領域は回復しますが、メインデータベースのディスク領域は回復できません。これは、この領域が新規のデータを追加したときに再利用されるためです。

データベースの有効期限が切れると、古いと見なされるすべての RD が削除されます。データベースのサイズは減少しません。デフォルトでは、RD は作成された日から 90 日で期限切れになるように設定されます。

「編集」リンクをクイックしてデータベース属性を定義するページに移動し、そのページでデータベースを編集することもできます。

表 F-14 データベース管理属性

属性

デフォルト値

説明

名前

デフォルト

検索で使用されるデータベースの名前

タイトル

空白

データベースのタイトル

説明

空白

データベースの説明を入力する

インポートエージェント

インポートエージョントとは、他のサーバーまたはデータベースからリソース記述を取得し、検索データベースにマージするためのプロセスです。

「インポート」ページの最初に、利用可能なインポートエージェントの一覧があります。新規作成、実行、編集、および既存エージェントの削除が可能です。チェックボックスにチェックマークを付けてエージェントを選択し、削除することができます。すべてのインポートエージェントを選択または選択解除するときは、チェックボックスの上にある小さなアイコンを使用します。エージェント動作のオン、オフを切り替えるには、ラジオボタンを使用します。インポートエージェントをスケジューリングするには、下のメニューバーの「スケジュール」を選択します。

既存のインポートエージェントを編集または変更する場合、または新規エージョントの作成を選択する場合は、次の属性が表示されます。

表 F-15 データベースのインポートエージェント属性 

属性

デフォルト値

説明

文字セット

新規の場合は空白

入力 SOIF ストリームの文字セットを指定 する。たとえば、ISO8859-1、UTF-8、 UTF-16 など。ISO8859-1 から ISO8859-15 までの文字セットを使用できる

インポート元

ローカルファイル

ローカルファイルまたは検索サーバー (有 効化されているサーバーがある場合) を選 択する

ローカルファイルパス

新規の場合は空白

有効なリソース記述が SOIF (Summary Object InterchangeFormat) 形式で記述されて いるローカルファイルのフルパス名を指定 する。別サーバー上のファイルであっても、 そのパスがローカルにマウントされたよう にアドレス指定できる場合は、指定できる

データベース名

デフォルト

インポート先データベースの名前

リモートサーバー

新規の場合は空白

リソース記述を取得する対象になっている 検索サーバーの URL。形式 : http://www.sesta.com:80

インスタンス名

新規の場合は空白

検索サーバーが使用するサーバーのインス タンス名。このインスタンス名は、イン ポート元のサーバーの「サーバー設定」で 確認できる。この値は常に 3.01C か 3.01C SP1 のいずれかにする必要がある

検索 URI

新規の場合は空白

完全パスとファイル名を入力する。形式 : /portal/search

コンパスサーバー 3.01X を使用

False (チェックボックスがオフ)

インポート元のサーバーが Compass Server 3.01X であるかどうかを指定する

SSL を有効

False (チェックボックスがオフ)

これがサーバー間のトランザクションの場 合、サーバーが SSL (Secure Sockets Layer) プロトコルを使用する必要があるかどうか を指定する

認証

なし (デフォルト)

「なし」 (デフォルト) または「ユーザー/ パスワード認証を使用」

インポート元のシステムに対して、イン ポートエージェントが認証を示す方法をこ こで指定する。デフォルトでは認証は使用 されない。インポート元のサーバーが認証 を要求する場合、インポートエージェント が使用するユーザー名およびパスワードを 指定する。3.01C からのインポートでは認 証は要求されない。3.01C SP1 からのイン ポートでは認証が要求される

ユーザー

新規および使用しない場合は空 白

「ユーザー/パスワード認証を使用」を選 択した場合はユーザーを入力する

パスワード

新規および使用しない場合は空 白

「ユーザー/パスワード認証を使用」を選 択した場合はパスワードを入力する (* とし て表示される)

コンテンツの転送

「フルコンテンツの増分収集を使 用」 (デフォルト)

「フルコンテンツの増分収集を使用」 (デ フォルト) または「検索クエリの使用」を 選択する

これは、リソースのどの記述をソースから インポートするかを指定する

デフォルトでは、インポートエージェント は、同じソースから最後にインポートした 後に追加または変更された、すべてのリ ソース記述をインポートすることを要求す る

検索クエリはインポートエージェントに、 特定のリソース記述だけを、ソースからイ ンポートすることを要求するように指定す る。これは、ユーザーが検索データベース に対して、リソースリストを要求する場合 とほぼ同じである

「範囲」、「表示属性」、および「表示ヒット」 のフィールドを使用してクエリを指定する

範囲

新規の場合は空白

クエリのテキスト。クエリの構文は、サー バーからのエンドユーザークエリに使用さ れるものと同じ

表示属性

新規の場合は空白

リソース記述の中からインポートする フィールドを指定する (大文字、小文字は 区別されない)。たとえば、タイトル、作 成者など。デフォルトはすべてインポート される

表示ヒット

新規の場合は空白

インポートするリソースの説明の一致の最 大数。ヒット件数を指定しない場合のデ フォルトは 20

エージェント記述

新規の場合は空白

「インポート」ページの最初にある、利用可 能なインポートエージェントの一覧に表示 される。プログラムはこれを無視する。こ のフィールドが空白の場合、「リソース記述 のソース」のファイル名またはサーバー名 が、インポートエージェントの識別に使用 される。ユーザー名とパスワードの必要性 を確認する必要がある

最新のリソース記述

新規の場合は空白

このインポートエージェントによって以前 インポートされた、最新のリソース記述が 作成された日付。「フルコンテンツの増分収 集を使用」オプションは、この日付を使用 して最新のリソースを確認し、インポート すべきかどうかを決定する

ネットワークタイムア ウト

新規の場合は空白

ネットワークの接続を、インポートエー ジェントがタイムアウトさせるまでの秒数 を指定する。ネットワークのトラフィック および品質の変動を考慮して調整する

リソース記述

「リソース記述」の最初のページでは、データベース内のリソース記述を検索できます。たとえば、RD の誤植の修正をしたり、ロボットが検出した RD を手動でカテゴリに割り当てることができます。

表 F-16 リソース記述属性 

属性

デフォルト値

説明

検索対象

すべての RD

すべての RD、カテゴリ化されていない RD、カテゴリ化された RD、カテゴリごと のRD、URL 特定の RD、RD を検索する

テキストボックス

空白

検索対象の RD を識別するために固有の文 字列を入力する。カテゴリごとのRD、 URL 指定の RD、および属性値を含む RD に適用される

データベース

デフォルト

検索対象データベースの名前

カテゴリの選択

カテゴリツリーをブラウズし、カテゴリを 選択する

削除

RD 検索で返された 1 つまたは複数の RD を 選択し、削除する

次へ

RD 検索で返された次の RD セットを表示 する

前へ

RD 検索で返された前の RD セットを表示 する

選択内容を編集

RD 検索で返された 1 つまたは複数の RD の 属性を編集する

すべて編集

RD 検索で返された、現在表示されている RD セットの属性を編集する

検索をカテゴリ単位で制限するときは、「カテゴリの選択」を選択します。「カテゴリエディタ 」ページが表示され、分類から検索対象カテゴリを指定できます。カテゴリを選択するときは、「選択されているカテゴリ」テキストボックスにカテゴリを指定するか、分類をブラウズして選択します。カテゴリを選択したら、「了解」をクリックして RD 検索ページに戻ります。

表 F-17 カテゴリエディタの属性 

属性

デフォルト値

説明

選択されているカテゴ リ

空白

選択したカテゴリを表示するテキスト フィールド

すべて展開

分類を展開する。階層内のすべてのエント リをブラウズできる

すべて縮小

空白

分類を縮小表示する。階層内の最初の 2 レ ベルに含まれるカテゴリだけをブラウズで きる

各ページのカテゴリ

25

1 ページに表示するカテゴリの数を指定す るドロップダウンリスト。指定できる値は、 25、50、100、250、500、およびすべて

検索が成功すると、見つかった RD の件数が表示され、リストボックスにその RD が表示されます。RD の「編集」リンクをクリックすると、次の属性 (編集可能) と RD の部分的なテキストが表示されます。「Classification」以外の属性は、すべて「データベース」、「スキーマ」ページで編集できます。

表 F-18 データベース RD の編集可能な属性 

属性

デフォルト値

説明

作成者

空白

ドキュメントの作成者

Author e-mail

空白

ドキュメント作成者に連絡するための電子 メールアドレス

Classification

選択した RD のカテゴリ名

分類されている場合はカテゴリ名、分類さ れていない場合は「No Classification」が 表示される

ReadACL

空白

ドキュメントレベルのセキュリティに関連 する

Content-Charset

HTTP サーバーから取得した、コンテンツ の文字セットの情報

Content-Encoding

空白

HTTP サーバーから取得した、コンテンツ のエンコードの情報

Content-Language

空白

HTTP サーバーから取得した、コンテンツ の言語の情報

Content-Length

空白

HTTP サーバーから取得した、コンテンツ の長さの情報

Content-Type

空白

HTTP サーバーから取得した、コンテンツ のタイプの情報

説明

選択した RD から取得した説明

RD の説明

Expires

有効な日付

リソース記述が無効になる日付

Full-Text

空白

ドキュメントの全内容

キーワード

キーワードがあれば選択した RD から取得される

メタタグから取得したキーワード

Last-Modified

最終更新日

ドキュメントの最終更新日

部分的なテキスト

ドキュメントの部分的なテキス ト

ドキュメントから選択して抜粋した部分的 テキスト

電話番号

空白

作成者の連絡先電話番号

Title

選択した RD のタイトル

RD のタイトル

URL

空白

ドキュメントの URL (Uniform Resource Locator)

スキーマ

リソース記述に含まれる情報、およびその情報の形式は、スキーマによって決定されます。RD への新規の属性またはフィールドの追加や、編集およびインデックス作成の可否の設定が可能です。新規の RD をインポートする場合、新規 RD に組み込まれているスキーマを変換して取り込むことができます。

表 F-19 データベーススキーマ編集属性 

属性

説明

作成者

ドキュメントの作成者

Author-EMail

ドキュメント作成者に連絡するための電子メールアドレス

Content-Charset

HTTP サーバーから取得した、コンテンツの文字セットの情 報

Content-Encoding

HTTP サーバーから取得した、コンテンツのエンコードの情 報

Content-Language

HTTP サーバーから取得した、コンテンツの言語の情報

Content-Length

HTTP サーバーから取得した、コンテンツの長さの情報

Content-Type

HTTP サーバーから取得した、コンテンツのタイプの情報

説明

ドキュメントについての、一行だけの簡単な説明

Expires

リソース記述が無効になる日付

Full-Text

ドキュメントの全内容

キーワード

ドキュメントを最も良く表すキーワード

Last-Modified

ドキュメントの最終更新日

部分的なテキスト

ドキュメントから選択して抜粋した部分的テキスト

電話番号

作成者の連絡先電話番号

ReadACL

検索サーバーがセキュリティを実行するために使用

Title

ドキュメントのタイトル

URL

ドキュメントの URL (Uniform Resource Locator)

エイリアス

名前

説明

新規の RD をインポートする場合、新規 RD に組み込まれて いるスキーマを変換できる。この変換は、インポートする データベースのスキーマと、データベースの RD 用スキーマ で使用されているフィールド名が矛盾する場合に使用する。 たとえば、インポートした RD は作成者のフィールドに Writer を使用しているが、データベースの RD は Auther を 使用している場合がある。Writer を Author に変換する必要 があるため、このテキストボックスに Writer と入力する

データタイプ

データタイプを指定する

編集可能

True (チェックボックスがオン) の場合、選択された属性 (フィールド) がデータベースの RD エディタに表示され、値 を変更できる

「説明」、「キーワード」、「タイトル」、および「ReadACL」を 編集できる

インデックス作成可能

True (チェックボックスがオン) の場合、選択した属性 (フィー ルド) を基準にしてインデックスが作成される

エンドユーザー「詳細検索」画面のメニューに、「作成者」、 「タイトル」、「URL」が表示される。エンドユーザーは、こ れらの特定のフィールドで値を検索することができる。

「作成者」、「Expires」、「キーワード」、「Last Modified」、「タ イトル」、「URL」、および「ReadACL」はインデックス作成 の基準に使用できる

乗数のスコア

特定の要素の重みを指定するフィールド。任意の正の値が有 効

分析

「解析」ページには、すべてのサイトのソート済みリストと、現在検索データベースにあるサイトのリソースの数が表示されます。ファイルの分析を更新するときは、「分析の更新」を選択します。

表 F-20 データベース分析属性

属性

デフォルト値

説明

RD の合計数

デーベースの現在の RD の数

現在データベースにあるリソース記述の数 を表示する

サーバーの数

パーティションによって分割さ れたデータベースが配置されて いるサーバーの現在の数

データベースは、パーティションで分割し て複数のサーバーに配置することができる

サイト

ロボットが検索に成功した URL またはドメイン

データベースにリソース記述を追加した URL またはドメイン

RD の数

そのサイトの現在の RD の数

そのサイトから取得した現在の RD の数を 表示する

タイプ

RD のタイプ

リソース記述には、http など、さまざまな タイプがある

タイプの割合

そのタイプの RD の数を RD の総 数で割った比率

リソース記述の総数に対して、このタイプ が占める割合

スケジュール

このページでは、インポートエージェントの実行スケジュールを設定します。

表 F-21 データベースのインポートスケジュール属性

属性

デフォルト値

説明

時間指定によるイン ポート開始

00:00

インポートエージョントがインポートを開 始する時刻

曜日

選択されていない

日〜土

少なくとも 1 つの曜日にチェックマークを 付ける

カテゴリ

エンドユーザーは 2 つの別な方法で検索データベースと対話します。クエリを直接入力してデータベースを検索する方法と、カスタムなカテゴリセットを使用してデータベースコンテンツ経由でブラウズする方法があります。検索データベースのリソースにカテゴリを割り当てると、複雑さを解消できます。データベースに多数の項目がある場合には、関連する項目をグループ化すると便利です。カテゴリの設定を行う場合は特に使いやすさを考慮し、特定の項目をエンドユーザーが素早く見つけられるようにします。

検索サーバーは分類と呼ばれるカテゴリの階層を使用します。一般的に「分類」という言葉は、すべてのカテゴリ化方式を表します。検索サーバーデータベースのようなネットワーク型リソースデータベースの場合は、取得しやすくするために選択された、ネットワークリソースをカテゴリ化する方法を表します。

「カテゴリ」のトピックは、次のサブトピックに分れています。

カテゴリエディタ

「カテゴリエディタ 」ページには、分類に含まれるカテゴリがリスト表示され、カテゴリをブラウズできます。カテゴリをブラウズしたら、カテゴリのリンクを選択して「分類ルールエディタ」を呼び出し、特定のカテゴリでのロボット収集を設定できます。

表 F-22 カテゴリエディタの属性 

属性

デフォルト値

説明

すべて展開

分類を展開する。階層内のすべてのエントリをブ ラウズできる

すべて縮小

分類を縮小表示する。階層内の最初の 2 レベルに 含まれるカテゴリだけをブラウズできる

インデックスの再作成

データベースのインデックスを再作成する。分類 を作成したら、データベースのインデックスを作 成し、エンドユーザーがカテゴリ検索を利用でき るようにする必要がある。カテゴリを変更した場 合は、インデックスを再作成してカテゴリを最新 の状態にする必要がある。データベースのイン デックスを再作成する前に、カテゴリツリーを保 存する。次に、新しい分類をロードする

各ページのカテゴリ

25

1 ページに表示するカテゴリの数を指定するド ロップダウンリスト。指定できる値は、25、50、 100、250、500、およびすべて

名前

選択したカテゴリ

編集のために選択したカテゴリの名前を表示する

説明

空白

選択しているカテゴリの説明を表示する

一致規則

空白

選択しているカテゴリに適用される一致規則を表 示する

更新

カテゴリの定義を更新する

子として追加

カテゴリを子として追加する

兄弟として追加

カテゴリをシブリングとして追加する

分類ルールエディタ

データベース用のカテゴリを設定したら、「新規」をクリックして、選択しているカテゴリのロボットのルールを設定または変更し、カテゴリにリソースを割り当てます。

表 F-23 カテゴリ分類ルールエディタの属性 

属性

デフォルト値

説明

ソース

作成者

有効な属性は次のとおり

  • 作成者
  • Author-EMail
  • Content-Charset
  • Content-Encoding
  • Content-Language
  • Content-Length
  • Content-Type
  • 説明
  • Expires
  • Full-Text
  • キーワード
  • Last-Modified
  • 部分的なテキスト
  • 電話番号
  • ReadACL
  • タイトル
  • URL
  • ホスト
  • プロトコル
  • IP
  • パス
  • タイプ

メソッド

is

「である (is)」、「を含む (contains)」、「で始 まる (begins with)」、「で終わる (ends with)」、「正規表現 (regular expression)」

基準

空白

ルールの条件を指定する

Classification

空白

ルールの条件と一致した場合に、その RD を分類するカテゴリ。カテゴリ名を入力す るか、「カテゴリの選択」ページでブラウズ する

レポート

「レポート」のセクションでは、検索サーバーを監視することができます。この操作の要約を表示することができます。要約には、検索したサイト、除外された URL と除外の理由、ロボットがアクセスした URL の詳細情報、エンドユーザーの興味の対象が含まれます。

「レポート」のトピックは、次のサブトピックに分れています。

開始位置

ロボットは、始動するたびにすべての有効なサイトを訪問します。

表 F-24 レポートの開始位置の属性

属性

デフォルト値

説明

有効

サイトの現在の値

はい、またはいいえ

「ロボット」、「サイト」ページで設定される

開始位置

選択された URL:80

選択された URL へのリンク

サイト定義

選択された URL

「ロボット/サイト」編集ページへリンク する

深さ

選択された検索レベル

「ロボット」「サイト」編集ページで設定さ れた 1-n の値。

除外された URL

「除外 URL」ページには、ロボットの実行結果が表示されます。URL が除外された理由のリストを表示するには、まず、調べるロボット実行を選択します。次に「選択内容の表示」をクリックし、「除外の理由」の 1 つを選択します。その理由で除外された URL のリストが表示されます。重複および警告によって除外された URL は消去されています。

表 F-25 レポートの除外された URL の属性

属性

デフォルト値

説明

ログ

最新の実行ログのリスト

利用可能なすべての実行ログすべてのリス ト

カウント

数字

除外された数、および除外理由のリスト

除外の理由

サイトが許可されなかった理由 のリスト。それぞれの理由は、 その理由で除外されたすべての URL の一覧にリンクされている

URL が除外された理由には、フィルタルー ル、ファイルが見つからない、サイトが許 可されない、プロトコルが許可されない、 エラー、重複などがある

ロボットの詳細レポート

「ロボットの詳細レポート」ページでは、ロボットが生成する各種レポートにアクセスできます。ドロップダウンリストからレポートを選択して情報を表示します。「更新」ボタンをクリックすると、最新の情報が表示されます。

表 F-26 ロボットの詳細レポートの属性

属性

デフォルト値

説明

ロボットの詳細レポー ト

バージョン

バージョン (Version)、DNS キャッシュダ ンプ (DNS Cache Dump)、パフォーマンス (Performance)、検出されたすべてのサー バー (Servers Found-All)、検出された RDM サーバー (Server Found-RDM )、現在 の構成状態 (Status-Current Configuration)、 データベース (内部) の状態 (Status-Database(internal))、Libnet の状態 (Status-Libnet)、モジュールの状態 (Status-Modules)、状態の概要 (Status-Overview)、抽出準備の完了した URL (URL s-ready for extraction)、イン デックス作成準備の完了した URL (URL s-ready for indexing)、フィルタリング待ち の URL (URL プール) (URL s-waiting for filtering (URL pool))、インデックス作成待 ちの URL (URL s-waiting for indexing)、全 レポート (all reports)。

ログファイル

ログファイルのエントリまたは特定の行を表示できます。ドロップダウンリストからログファイルを選択します。「表示」ボタンを選択し、表示する行数を指定します。

表 F-27 レポートのログファイル表示の属性

属性

デフォルト値

説明

このログファイルを表 示

除外された URL (filter)

除外された URL (filter)、RD マネージャ (rdmgr)、RDM サーバー (rdmsvr)、ロボッ トの活動 (robot)、検索エンジン (searchengine)、ユーザークエリ (rdm)

行数

25

ログファイルから表示する最新のエントリ 数を指定する

頻度の高い検索

「頻度の高い検索」ページでは、ユーザーが何を検索したかを確認できます。レポートの先頭には、最も頻度の高い検索が表示されます。

表 F-28 頻度の高い検索の属性

属性

デフォルト値

説明

ブラウザの閲覧は対象 外

False (チェックボックスがオフ)

False (チェックボックスがオフ) の場合は、 ユーザーが参照したカテゴリを含める。 True (チェックボックスがオン) の場合は、 参照の統計情報を除外する



前へ      目次      索引      次へ     


Copyright 2003 Sun Microsystems, Inc. All rights reserved.