bu 实用程序用于更新高速缓存,它在两种模式下工作。在第一种模式下,该实用程序循环遍历高速缓存数据库并通过发送对每个 URL 的 HTTP 请求更新高速缓存中存在的所有 URL。在第二种模式下,它从给定 URL 开始,对从该 URL 到您指定的深度的 URL 的所有链接执行广度优先遍历,获取页面并将其置于高速缓存中。bu 是符合 RFC 标准的爬虫程序 (robot)。
bu -n hostname -p port -t time-lmt -f contact-address -s sleep-time -o object -r n -d conf-dir
例如:
bu -n phoenix -p 80 -t 3600 -f admin@phoenix.com -s 60 -o nova -r n -d server-root/proxy-serverid/config
其中,
hostname 是运行代理服务器的计算机的主机名。默认值为 localhost。
port 是运行代理服务器的端口。默认端口为 8080。
time-lmt 是实用程序运行的时间限制
contact-address 确定将在从 bu 发送来的 HTTP 请求中发送的联系地址。默认值为 worm@proxy-name。
sleep-time 是两次连续请求之间的休眠时间。默认值为 5 秒。
object 是在当前正在执行的 bu.conf 中指定的对象。
-r n 选项确定是否遵循 robot.txt 策略。默认值为 y。
conf-dir 是代理服务器实例的配置目录,它位于 server-root/proxy-serverid/config 目录中。