bu 公用程式可更新快取,其執行模式有兩種。在第一種模式中,它會反覆檢查快取資料庫,並透過為每個 URL 傳送 HTTP 請求來更新快取中現存的所有 URL。在第二種模式中,它會從指定的 URL 開始對從此 URL 至所指定層級的所有連結執行廣度優先遍歷,並將頁面擷取到快取中。bu 是與 RFC 相容的網頁抓取程式。
bu -n hostname -p port -t time-lmt -f contact-address -s sleep-time -o object -r n -d conf-dir
例如︰
bu -n phoenix -p 80 -t 3600 -f admin@phoenix.com -s 60 -o nova -r n -d server-root/proxy-serverid/config
其中
hostname 是執行代理伺服器的機器的主機名稱。預設值是 localhost。
port 是代理伺服器執行時所用的連接埠。預設連接埠是 8080。
time-lmt 是執行公用程式的時間限制
contact-address 決定將透過 bu 傳送的 HTTP 請求傳送的連絡位址。預設值是 worm@proxy-name。
sleep-time 是兩個連續請求之間的暫停時間。預設值是 5 秒。
object 是目前正在執行的 bu.conf 中指定的物件。
-r n 選項決定是否遵循 robot.txt 策略。預設值是 y。
conf-dir 是代理伺服器實例的配置目錄,它位於 server-root /proxy-serverid/config 目錄中。