Sun Java System Portal Server 7.2 管理指南

管理網頁抓取程式

本節說明以下管理網頁抓取程式的作業:

Procedure啟動網頁抓取程式

  1. 登入管理主控台

  2. 選擇功能表列中的 [搜尋伺服器]。選取伺服器清單中的搜尋伺服器。

  3. 按一下功能表列中的 [網頁抓取程式],再選取功能表中的 [狀態與控制]。

  4. 按一下 [啟動]。

相當於 psadmin 指令

「Sun Java System Portal Server 7.2 Command-Line Reference」中的「psadmin start-robot」


備註 –

對於指令 psadmin start-robot,如果沒有可供網頁抓取程式抓取的已定義網站,則不會啟動搜尋網頁抓取程式。指令 psadmin start-robot 透過顯示「起始點:0 已定義」表示並無可用的網站。


Procedure清除網頁抓取程式資料庫

  1. 登入管理主控台

  2. 從功能表列選取 [搜尋伺服器],然後選取搜尋伺服器。

  3. 選取功能表列中的 [網頁抓取程式],再選取 [狀態與控制]。

  4. 按一下 [清除網頁抓取程式資料庫]。

Procedure建立網站定義

網頁抓取程式會尋找資源並判定是否將其描述新增到資料庫中。而決定應訪問哪些伺服器以及應為這些伺服器的哪些部分編列索引,即所謂的網站定義

  1. 登入管理主控台

  2. 從功能表列選取 [搜尋伺服器],然後選取搜尋伺服器。

  3. 在功能表列中選取 [網頁抓取程式],再選取 [網站]。

  4. 按一下 [管理網站] 下的 [新增],並為網站指定配置屬性。

    如需關於屬性的詳細資訊,請參閱「Sun Java System Portal Server 7.2 Technical Reference」中的「Sites」

  5. 按一下 [確定]。

Procedure編輯網站定義

  1. 登入管理主控台

  2. 從功能表列選取 [搜尋伺服器],然後選取搜尋伺服器。

  3. 在功能表列中選取 [網頁抓取程式],再選取 [網站]。

  4. 按一下您要修改的網站名稱。

    出現 [編輯網站] 對話方塊。

  5. 依需要修改配置屬性。

    如需關於屬性的詳細資訊,請參閱「Sun Java System Portal Server 7.2 Technical Reference」中的「Sites」

  6. 按一下 [確定] 以記錄變更。

Procedure控制網頁抓取程式的抓取與編列索引

網頁抓取程式抓取被選取用來編列索引的各種網站。您可透過定義抓取和編列索引作業特性,來控制網頁抓取程式抓取網站的方式。

  1. 登入管理主控台

  2. 從功能表列選取 [搜尋伺服器],然後選取搜尋伺服器。

  3. 按一下功能表列中的 [網頁抓取程式],再選取 [內容]。

  4. 依需要指定網頁抓取程式抓取及編列索引的屬性。

    如需關於屬性的詳細資訊,請參閱「Sun Java System Portal Server 7.2 Technical Reference」中的「Sites」

  5. 按一下 [儲存]。

Procedure執行模擬器

模擬器會在一個或多個列出的網站中執行網頁抓取程式篩選的部份模擬。 

  1. 登入管理主控台

  2. 從功能表列選取 [搜尋伺服器],然後選取搜尋伺服器。

  3. 按一下功能表列的 [網頁抓取程式],再選取 [公用程式]。

  4. 在 [新增新的 URL] 文字方塊中輸入要模擬的新網站 URL,並按一下 [新增]。

    您也可以在 [現有網頁抓取程式網站] 下列出的現有網站上執行模擬器。

  5. 按一下 [執行模擬器]。

Procedure執行網站探查公用程式

網站探查公用程式檢查如 DNS 別名、伺服器重新導向及虛擬伺服器等資訊。

  1. 登入管理主控台

  2. 從功能表列選取 [搜尋伺服器],然後選取搜尋伺服器。

  3. 按一下功能表列的 [網頁抓取程式],再選取 [公用程式]。

  4. 輸入要探查網站的 URL。

  5. (可選擇) 如果您要探查傳回 DNS 資訊,請選擇 [網站探查] 下的 [顯示進階 DNS 資訊]。

  6. 按一下 [執行網站探查]。