在“元数据”阶段,robot 会遇到资源的 URL,但它还没有下载资源的内容。这样,关于 URL 以及源自其他源(例如 filter.conf 文件)的数据的信息均可用。不过,在此阶段,关于资源内容的信息不可用。
表 19–2 元数据阶段 RAF 的可用源
资源 |
描述 |
示例 |
---|---|---|
csid |
目录服务器 ID |
x-catalog//budgie.siroe.com:8086/alexandria |
depth |
从起始点开始遍历的链接数 |
10 |
enumeration filter |
枚举过滤器的名称 |
enumeration1 |
generation filter |
生成过滤器的名称 |
generation1 |
host |
URL 的主机部分 |
home.siroe.com |
IP |
主机的数字形式 |
198.95.249.6 |
协议 |
URL 的访问部分 |
http, https, ftp, file |
path |
URL 的路径部分 |
/, /index.html, /documents/listing.html |
URL |
完整的 URL |
http://developer.siroe.com/docs/manuals/ |