Sun Java System Portal Server 7.2 管理指南

資料庫簡介

搜尋伺服器將其資源描述儲存於資料庫中。搜尋資料庫是一種文件集合索引。係由索引器 (指令 rdmgr,或搜尋伺服器本身) 建立。例如,預設會設定網頁抓取程式抓取網站,並將其找到的所有一切編列索引至使用者可在其中搜尋資料的預設搜尋資料庫。也可將資料或索引儲存至其他資料庫。

以下舉出您在管理資料庫時可能需執行的一些配置及維護作業:

匯入至資料庫

一般而言,搜尋資料庫中的項目來自網頁抓取程式。您也可以匯入來自其他 Portal Server 搜尋伺服器、iPlanet Web Server、NetscapeTM Enterprise Server 或其他來源所產生資料庫的現有項目資料庫。匯入現有的 RD 資料庫而非傳送網頁抓取程式以建立 RD 資料庫,可幫助減少網路傳輸量。這樣會將該作業分成數個小部份執行,從而也可以更加快速地完成大型的索引作業。如果中央資料庫其實體遠離編列索引的伺服器,那麼在本端產生 RD 並定期將遠端資料庫匯入中央資料庫是很有幫助的。

搜尋伺服器使用匯入代理程式從其他伺服器或資料庫匯入 RD。匯入代理程式係一項程序,即從外部來源擷取許多的 RD,再將該等資訊合併到本端資料庫中。

在匯入資料庫前,必須先建立匯入代理程式。代理程式一旦建立完成後,即可立刻開始進行匯入程序,或是排定定期執行匯入程序的時間。

編輯資料庫模式

模式決定您的搜尋伺服器針對各項資源所維護的資訊及其格式。您的模式設計會決定影響索引可用性的兩大因素:

模式是指資料庫中的資源描述之主資料結構。如何定義該資料結構的欄位並編列索引,將會影響到使用者存取資源的程度。

模式與搜尋伺服器及其網頁抓取程式所使用的檔案之結構息息相關。您應該僅使用管理主控台中的模式工具變更資料結構。絕對不要直接編輯模式檔。

您可以編輯搜尋伺服器的資料庫模式,在其中加入新的模式屬性、修改模式屬性或刪除屬性。

模式具有下列屬性:

定義模式別名

您可能會發現用於資料庫模式之欄位的名稱之間有不一致的情況。當您將資源描述從某台伺服器匯入另一台伺服器時,您無法保證這兩台伺服器始終在各自的模式中為項目使用相同的名稱。同樣,當網頁抓取程式將文件中的 HTML <meta> 標記轉換到模式欄位時,名稱由文件控制。

搜尋伺服器可讓您針對模式屬性定義模式別名,使這些外部模式名稱對映到您資料庫欄位的有效名稱。

檢視資料庫分析

搜尋伺服器可產生報告,提供有關已編列索引的網站數以及資料庫中各個網站之資源數目等資訊。

重新編列資料庫索引

如果您已編輯模式以新增或移除已編列索引的欄位,或者由於磁碟錯誤造成索引檔毀壞,則可能需要為搜尋伺服器重新編列資源描述資料庫索引。如果因任何其他原因而使得資料庫內容與其索引之間發生不一致,也可能需要重新編列索引。例如,在編列索引時系統發生故障。

重新編列大型資料庫索引可能需要數小時來完成。重新編列資料庫索引需要的時間和資料庫的記錄數有關。如果您擁有大型資料庫,請在伺服器閒置時重新編列索引。

終止資料庫

移除過期的資料描述即為終止資料庫。只有當您執行終止時,才會移除資源描述。過期的資料描述會被刪除,但資料庫大小不會減少。

過期日期是資源描述的屬性之一。您的網頁抓取程式可透過 HTML <meta> 標記或資源伺服器提供的資訊來設定過期日期。依預設,資源描述自建立日起三個月後過期,除非資源另有指定不同的過期日期。您應讓搜尋伺服器定期清除資料庫中過期的資源描述。

清除資料庫

清除功能可用來移除資料庫的內容。用於索引的磁碟空間將被回復,但不會回復主資料庫所使用的磁碟空間。相反,當新資料加入資料庫時會重新使用該空間。

分割資料庫

搜尋伺服器可讓您將構成每個搜尋資料庫的實體檔案放置在多個磁碟、檔案系統、目錄或分割區上。透過將資料庫散佈在不同的實體或邏輯裝置中,您可建立超過單一裝置容量的大型資料庫。

依預設,搜尋伺服器設定資料庫僅使用一個目錄。指令行介面可供您針對資料庫分割區執行兩種操作:

搜尋伺服器不會檢查各分割區是否尚有剩餘空間。您必須自行維護足夠的空間供資料庫使用。

您可以新增資料庫分割區,總數最多可達 15 個。


備註 –

一旦增加分割區數目,未來要減少數目,必須先刪除整個資料庫。

然而,只要您還有足夠的磁碟空間,不建議分割資料庫。


要變更任何資料庫分割區的實際位置,請指定新位置的名稱。同樣的,您也可以將現有的分割區重新命名。使用 rdmgr 指令進行分割區操作。如需 psadmin 指令的資訊,請參閱「 Sun Java System Portal Server 7.2 Command Line Reference」。