本節說明以下管理網頁抓取程式的作業:
「Sun Java System Portal Server 7.2 Command-Line Reference」中的「psadmin start-robot」。
對於指令 psadmin start-robot,如果沒有可供網頁抓取程式抓取的已定義網站,則不會啟動搜尋網頁抓取程式。指令 psadmin start-robot 透過顯示「起始點:0 已定義」表示並無可用的網站。
網頁抓取程式會尋找資源並判定是否將其描述新增到資料庫中。而決定應訪問哪些伺服器以及應為這些伺服器的哪些部分編列索引,即所謂的網站定義。
從功能表列選取 [搜尋伺服器],然後選取搜尋伺服器。
在功能表列中選取 [網頁抓取程式],再選取 [網站]。
按一下 [管理網站] 下的 [新增],並為網站指定配置屬性。
如需關於屬性的詳細資訊,請參閱「Sun Java System Portal Server 7.2 Technical Reference」中的「Sites」。
按一下 [確定]。
從功能表列選取 [搜尋伺服器],然後選取搜尋伺服器。
在功能表列中選取 [網頁抓取程式],再選取 [網站]。
按一下您要修改的網站名稱。
出現 [編輯網站] 對話方塊。
依需要修改配置屬性。
如需關於屬性的詳細資訊,請參閱「Sun Java System Portal Server 7.2 Technical Reference」中的「Sites」
按一下 [確定] 以記錄變更。
網頁抓取程式抓取被選取用來編列索引的各種網站。您可透過定義抓取和編列索引作業特性,來控制網頁抓取程式抓取網站的方式。
從功能表列選取 [搜尋伺服器],然後選取搜尋伺服器。
按一下功能表列中的 [網頁抓取程式],再選取 [內容]。
依需要指定網頁抓取程式抓取及編列索引的屬性。
如需關於屬性的詳細資訊,請參閱「Sun Java System Portal Server 7.2 Technical Reference」中的「Sites」。
按一下 [儲存]。
模擬器會在一個或多個列出的網站中執行網頁抓取程式篩選的部份模擬。
從功能表列選取 [搜尋伺服器],然後選取搜尋伺服器。
按一下功能表列的 [網頁抓取程式],再選取 [公用程式]。
在 [新增新的 URL] 文字方塊中輸入要模擬的新網站 URL,並按一下 [新增]。
您也可以在 [現有網頁抓取程式網站] 下列出的現有網站上執行模擬器。
按一下 [執行模擬器]。
網站探查公用程式檢查如 DNS 別名、伺服器重新導向及虛擬伺服器等資訊。