WebサーバーでHTTP NTLM認証を使用してWebサイトへのアクセスを制限している場合は、認証の資格証明を指定することによって、パスワードで保護されているページにWeb Crawlerがアクセスできるようになります。HTTPClientによって使用されるNTLM認証用の資格証明はhttp.auth.ntlmプロパティで設定します。
注意: Web Crawlerは、NTLM認証スキームのバージョン1のみをサポートしています。
資格証明は次のフォーマットで指定する必要があります。
USERNAME1~~~PASSWORD1~~~HOST1~~~PORT1~~~REALM1~~~DOMAIN1|||USERNAME2~~~...
ここで、
- USERNAMEはサーバーに送信されるユーザーIDです。
- PASSWORDはユーザーIDのパスワードです。
- HOSTは、資格証明が適用される特定のホスト名です(つまりクロール対象のホストです)。ANY_HOST指定子は使用できないことに注意してください。
- PORTには、特定のホストのポートまたはANY_PORTを指定します。
- REALMには、ホスト上の特定のレルム名またはANY_REALMを指定します。
- DOMAINは、ドメイン名またはIPアドレスです。
値の区切り記号として、3つの連続したチルダ(
~~~)を使用する必要があります。