Sun Java System Portal Server 7.2 管理ガイド

変更可能なプロパティー

robot.conf ファイルは、filter.conf にある適切なフィルタにロボットを指定するなど、ロボット用の多くのオプションを定義します。旧バージョンとの下位互換性のために、robot.conf に開始ポイント URL を含めることもできます。

管理コンソールを使用すれば、ほとんどのプロパティーを設定できるので、通常は robot.conf ファイルを編集する必要はありません。ただし、上級ユーザーはこのファイルを手動で編集することにより、管理コンソールを介してでは設定できないプロパティーを設定することができます。このファイルの例については、robot.confファイルの例」を参照してください。

表 19–4 は、robot.conf ファイルでユーザーが変更可能なプロパティーを示しています。

表 19–4 ユーザーが変更できるプロパティー

プロパティー 

説明 

例 

auto-proxy

ロボットのプロキシ設定を指定します。これは、プロキシサーバー、またはプロキシを自動的に設定する Java スクリプトファイルです。 

auto-proxy="http://proxy_server/proxy.pac"

bindir

ロボットが bin ディレクトリを PATH 環境に追加するかどうかを指定します。これは cmd-hook プロパティーが指定するプログラムなど、ユーザーがロボットで外部プログラムを実行するための特別な PATH です。

bindir=path

cmd-hook

ロボットが実行を完了するたびに実行される外部完了スクリプトを指定します。これは、コマンド名の完全パスで指定する必要があります。ロボットは /var/opt/SUNWportal/ ディレクトリからこのスクリプトを実行します。

デフォルトはありません。 

コマンドを実行するには、最低 1 つの RD が登録されている必要があります。 

 

cmd-hook=”command-string”

command-port

管理インタフェースまたはロボットコントロールパネルのような、ほかのプログラムからコマンドを受け入れるために、ロボットが待機するポート番号を指定します。 

セキュリティー上の理由から、remote-accessyes に設定されていない場合、ロボットはローカルホストからのコマンドだけを受け入れます。

command-port=port_number

connect-timeout

ネットワークが接続要求に応答する最大許容時間を指定します。 

デフォルトは 120 秒です。

command-timeout=seconds

convert-timeout

ドキュメント変換に許可される最大時間を指定します。 

デフォルトは 600 秒です。

convert-timeout=seconds

depth

ロボットが調べる開始ポイント URL からのリンク数を指定します。このプロパティーは、深さを指定しない開始ポイント URL のデフォルト値を設定します。 

デフォルトは 10 です。

マイナス 1 の値 (depth=-1) は、リンクの深さが無限であることを表します。

depth=integer

email

ロボットを実行するユーザーの電子メールアドレスを指定します。 

Web 管理者とサイトでロボットを実行するユーザーとが連絡できるように、電子メールアドレスは HTTP 要求ヘッダーで user-agent とともに送信されます。 

デフォルトは user@domain です。

email=user@hostname

enable-ip

作成する各 RD の URL に IP アドレスを生成します。 

デフォルトは true です。

enable-ip=[true | yes | false | no]

enable-rdm-probe

サーバーが RDM をサポートするかどうかを確認します。ロボットはこのプロパティーを使用して、検出する各サーバーに照会するかどうかを決定します。サーバーが RDM をサポートする場合は、サーバーは独自のリソース記述サーバーの役割を果たすことができるため、ロボットはこのサーバーのリソースを列挙しません。 

デフォルトは false です。

enable-rdm-probe=[true | false | yes | no]

enable-robots-txt

ロボットがアクセスする各サイトで、robots.txt ファイルが使用できる場合、このファイルをロボットが検査する必要があるかどうかを指定します。

デフォルトは yes です。

enable-robots-txt=[true | false | yes | no]

engine-concurrent

ロボットが使用する事前作成のスレッド数を指定します。 

デフォルトは 10 です。

管理コンソールを使用して、このプロパティーを対話形式で設定することはできません。 

engine-concurrent=[1..100]

enumeration-filter

リソースを列挙すべきかどうかを確認する場合に、ロボットが使用する列挙フィルタを指定します。値は filter.conf ファイルで定義されるフィルタ名にする必要があります。

デフォルトは enumeration-default です。

管理コンソールを使用して、このプロパティーを対話形式で設定することはできません。 

enumeration-filter=enumfiltername

generation-filter

リソース用にリソース記述を生成する必要があるかどうかを確認する場合に、ロボットが使用する生成フィルタを指定します。値は filter.conf ファイルで定義されるフィルタ名にする必要があります。

デフォルトは generation-default です。

管理コンソールを使用して、このプロパティーを対話形式で設定することはできません。 

generation-filter=genfiltername

index-after-ngenerated

検索サーバー用にバッチ処理する前に、ロボットが RD を収集する時間を分単位で指定します。 

デフォルトは 30 分です。 


index-after-ngenerated=30

loglevel

ロギングのレベルを指定します。loglevel の値は次のように指定されます。

  • レベル 0: 重大なエラー以外は記録しません

  • レベル 1: RD 生成も記録します (デフォルト)

  • レベル 2: 検索状況も記録します

  • レベル 3: フィルタリング状況も記録します

  • レベル 4: 生成状況も記録します

  • レベル 5: 検索の進行状況も記録します

    デフォルト値は 1 です。


loglevel=[0...100]

max-connections

ロボットが実行できる並行検索の最大数を指定します。 

デフォルトは 8 です。


max-connections=[1..100]

max-filesize-kb

ロボットが検索するファイルの最大ファイルサイズを K バイト単位で指定します。 


max-filesize-kb=1024

max-memory-per-url / max-memory

各 URL が使用する最大メモリーをバイト単位で指定します。URL がより多くのメモリーを必要とする場合、RD はディスクに保存されます。 

デフォルトは 64k です。

管理コンソールを使用して、このプロパティーを対話形式で設定することはできません。 


max-memory-per-url=n_bytes

max-working

ロボット稼動セットのサイズ、すなわちロボットが一度に処理できる URL の最大数を指定します。 

管理コンソールを使用して、このプロパティーを対話形式で設定することはできません。 


max-working=1024

onCompletion

実行完了後のロボットの動作を決定します。ロボットはアイドルモードになるか、ループバック、再起動、または終了することができます。 

デフォルトは idle です。

このプロパティーは cmd-hook プロパティーとともに動作します。実行後のロボットは、onCompletion アクションの次に、cmd-hook プログラムを実行します。


OnCompletion=[idle | loop | quit]

password

httpd 認証および ftp 接続に使用される password を指定します。


password=string

referer

Web ページにアクセスする際にロボットを Referer として識別するように設定されている場合、HTTP 要求に送信されるプロパティーを指定します。 


referer=string

register-user

検索サーバーデータベースに RD を登録するために使用されるユーザー名を指定します。 

このプロパティーは、検索サーバー管理インタフェースから対話形式で設定することはできません。 


register-user=string

register-password

検索サーバーデータベースに RD を登録するために使用されるパスワードを指定します。 

このプロパティーは、管理コンソールから対話形式で設定することはできません。 


register-password=string

remote-access

ロボットが、リモートホストからのコマンドを受け入れることができるどうかを指定します。 

デフォルトは false です。


remote-access=[true | false | yes | no]

robot-state-dir

ロボットが状態を保存するディレクトリを指定します。この作業ディレクトリで、ロボットは収集された RD の数などを記録できます。 


robot-state-dir="/var/opt/SUNWportal/
searchservers/<searchserverid>/config/r
obot"

server-delay

同じ Web サイトに次にアクセスするまでの時間間隔を指定します。この時間を指定することで、ロボットが頻繁に同じサイトにアクセスするのを防止できます。デフォルトは 0 秒です。 


server-delay=delay_in_seconds

site-max-connections

ロボットが任意の 1 つのサイトに対して行う同時接続の最大数を示します。 

デフォルトは 2 です。


site-max-connections=[1..100]

smart-host-heuristics

ロボットが正規の DNS ホスト名を巡回するサイトを変更できます。たとえば、www123.siroe.comwww.siroe.com に変更されます。

デフォルトは false です。


smart-host-heuristics=[true | false]

tmpdir

ロボットが一時ファイルを作成する場所を指定します。 

環境変数 TMPDIR を設定する際に、この変数を使用します。


tmpdir=path

user-agent

http-request 内の電子メールアドレスとともにサーバーに送信されるプロパティーを指定します。


user-agent=SunONERobot/6.2

username

ロボットを実行するユーザーのユーザー名を指定します。これは、 httpd 認証および ftp 接続で使用されます。

デフォルトは anonymous です。


username=string