メタデータ段階ではロボットはリソースの URL を検出しますが、リソースのコンテンツはダウンロードしていません。このため、filter.conf ファイルなどのほかのソースから派生するデータと、URL についての情報が使用可能です。ただし、この段階では、リソースのコンテンツについての情報は使用できません。
表 19–2 メタデータ段階で RAF で使用できるソース
ソース |
説明 |
例 |
---|---|---|
csid |
カタログサーバー ID |
x-catalog//budgie.siroe.com:8086/alexandria |
depth |
開始点からトラバースされたリンク数 |
10 |
enumeration filter |
列挙フィルタの名前 |
enumeration1 |
generation filter |
生成フィルタの名前 |
generation1 |
host |
URL のホスト部分 |
home.siroe.com |
IP |
ホストの数値バージョン |
198.95.249.6 |
protocol |
URL のアクセス部分 |
http、https、ftp、file |
path |
URL のパス部分 |
/、/index.html、/documents/listing.html |
URL |
完全な URL |
http://developer.siroe.com/docs/manuals/ |