本章說明如何配置和管理 Sun JavaTM System Portal Server 搜尋伺服器。
本章包含以下章節:
Portal Server 搜尋伺服器是一種分類法和資料庫服務,其設計為支援與常見網際網路搜尋伺服器 (如 Google 和 Alta Vista) 類似的搜尋和瀏覽介面。搜尋伺服器包括可以探索、轉換及概述文件資源的網頁抓取程式。Portal Server 桌面包括以 JavaServer PagesTM (JSPTM) 為基礎的搜尋使用者介面。搜尋伺服器包括可編輯配置的管理工具,和可管理系統的指令行工具。配置設定可透過 Portal Server 管理主控台定義和存放。
管理主控台可供管理員配置大多數搜尋伺服器選項,但不能執行可透過指令行介面使用的所有管理功能。
使用者可查詢搜尋伺服器的資料庫,以找到資源。每個資料庫中的各個項目稱作資源描述 (Resource Description, RD)。資源描述提供單一資源的摘要資訊。資料庫模式決定每個資源描述的欄位。
搜尋伺服器是以開放的網際網路標準 (如資源描述訊息 (Resource Description Messages, RDM) 和摘要物件互換格式 (Summary Object Interchange Format, SOIF)) 為基礎,以確保搜尋伺服器可在跨平台企業環境中作業。
使用者有兩種方式可與搜尋系統互動。使用者可鍵入直接查詢以搜尋資料庫,或是使用您設計的一組種類來瀏覽整個資料庫內容。種類的階層結構有時稱為分類法。資源分類好比是為資料庫建立一個目錄。
瀏覽是搜尋系統的選用功能。也就是說,不一定要使用依種類瀏覽的功能,依然能夠擁有相當好用的搜尋系統。您需要判斷加入使用者可瀏覽的種類對於索引使用者來說是否有用;若有用,則判斷應建立哪些種類。
搜尋資料庫中的資源被指派到各個種類以減少複雜性。如果資料庫中有大量的項目,將相關的項目分組在一起是很有用的。這麼做可讓使用者迅速找出特定類型的項目、在類似項目之間進行比較,而從中選擇所要的項目。
這種分類方式在產品及服務索引中十分常見。服飾種類會分男裝、女裝及童裝服飾,每一大類又可細分為外套、襯衫、鞋子以及其他項目。辦公室用品種類則可區分為傢具、文具用品、電腦及軟體等。廣告目錄即根據產品及服務的種類編排而成。
印刷品索引的分門別類原則亦適用於線上索引。其用意是讓使用者易於找出特定類型的資源,以便從中選擇自己所要的資訊。無論您設計的索引範圍大或小,設定種類時都應以可用性為首要考量。您必須瞭解使用者如何使用這些種類。例如您為一家在三個不同地區設有辦事處的公司設計索引,此時您可能會以各家分公司作為頂層種類。如果使用者更注重跨地緣關係的職能部門,則依據企業部門進行資源分類較為適宜。
種類一旦定義,就必須設定規則將資源指派到各個種類。這些規則稱作分類規則。如果未定義適當的分類規則,使用者將無法透過瀏覽種類找到資源。固然應避免錯誤歸類資源,但也要避免漏掉要歸類的文件。
Sun Java System Portal Server 可以支援一個或多個搜尋伺服器。
安裝 Portal Server 時,會建立預設搜尋伺服器 (search1)。您也可以使用 [建立搜尋伺服器] 精靈建立新的搜尋伺服器。
「Sun Java System Portal Server 7.2 Command-Line Reference」中的「psadmin create-search-server」。
「Sun Java System Portal Server 7.2 Command-Line Reference」中的「psadmin delete-search-server」
搜尋伺服器將其資源描述儲存於資料庫中。搜尋資料庫是一種文件集合索引。係由索引器 (指令 rdmgr,或搜尋伺服器本身) 建立。例如,預設會設定網頁抓取程式抓取網站,並將其找到的所有一切編列索引至使用者可在其中搜尋資料的預設搜尋資料庫。也可將資料或索引儲存至其他資料庫。
以下舉出您在管理資料庫時可能需執行的一些配置及維護作業:
一般而言,搜尋資料庫中的項目來自網頁抓取程式。您也可以匯入來自其他 Portal Server 搜尋伺服器、iPlanet Web Server、NetscapeTM Enterprise Server 或其他來源所產生資料庫的現有項目資料庫。匯入現有的 RD 資料庫而非傳送網頁抓取程式以建立 RD 資料庫,可幫助減少網路傳輸量。這樣會將該作業分成數個小部份執行,從而也可以更加快速地完成大型的索引作業。如果中央資料庫其實體遠離編列索引的伺服器,那麼在本端產生 RD 並定期將遠端資料庫匯入中央資料庫是很有幫助的。
搜尋伺服器使用匯入代理程式從其他伺服器或資料庫匯入 RD。匯入代理程式係一項程序,即從外部來源擷取許多的 RD,再將該等資訊合併到本端資料庫中。
在匯入資料庫前,必須先建立匯入代理程式。代理程式一旦建立完成後,即可立刻開始進行匯入程序,或是排定定期執行匯入程序的時間。
模式決定您的搜尋伺服器針對各項資源所維護的資訊及其格式。您的模式設計會決定影響索引可用性的兩大因素:
供使用者搜尋資源的方式
供使用者檢視資源資訊的方式
模式是指資料庫中的資源描述之主資料結構。如何定義該資料結構的欄位並編列索引,將會影響到使用者存取資源的程度。
模式與搜尋伺服器及其網頁抓取程式所使用的檔案之結構息息相關。您應該僅使用管理主控台中的模式工具變更資料結構。絕對不要直接編輯模式檔。
您可以編輯搜尋伺服器的資料庫模式,在其中加入新的模式屬性、修改模式屬性或刪除屬性。
模式具有下列屬性:
可編輯 – 勾選後,則屬性會顯示在資源描述編輯器中,您可以變更其值。
可編列索引 – 此屬性表示使用者可搜尋此特定欄位中的值。可編列索引欄位也可出現在 [進階搜尋] 畫面的快顯功能表中。
描述 – 此屬性是用於描述模式的文字字串。可當作註釋或附註使用。
別名 – 此屬性可供您定義別名,以便將匯入的資料庫模式名稱轉換成您自己的模式。
計分乘數 – 為特定元素計分的加權欄位。有效值為任何正值。
資料類型 – 定義資料類型。
您可能會發現用於資料庫模式之欄位的名稱之間有不一致的情況。當您將資源描述從某台伺服器匯入另一台伺服器時,您無法保證這兩台伺服器始終在各自的模式中為項目使用相同的名稱。同樣,當網頁抓取程式將文件中的 HTML <meta> 標記轉換到模式欄位時,名稱由文件控制。
搜尋伺服器可讓您針對模式屬性定義模式別名,使這些外部模式名稱對映到您資料庫欄位的有效名稱。
搜尋伺服器可產生報告,提供有關已編列索引的網站數以及資料庫中各個網站之資源數目等資訊。
如果您已編輯模式以新增或移除已編列索引的欄位,或者由於磁碟錯誤造成索引檔毀壞,則可能需要為搜尋伺服器重新編列資源描述資料庫索引。如果因任何其他原因而使得資料庫內容與其索引之間發生不一致,也可能需要重新編列索引。例如,在編列索引時系統發生故障。
重新編列大型資料庫索引可能需要數小時來完成。重新編列資料庫索引需要的時間和資料庫的記錄數有關。如果您擁有大型資料庫,請在伺服器閒置時重新編列索引。
移除過期的資料描述即為終止資料庫。只有當您執行終止時,才會移除資源描述。過期的資料描述會被刪除,但資料庫大小不會減少。
過期日期是資源描述的屬性之一。您的網頁抓取程式可透過 HTML <meta> 標記或資源伺服器提供的資訊來設定過期日期。依預設,資源描述自建立日起三個月後過期,除非資源另有指定不同的過期日期。您應讓搜尋伺服器定期清除資料庫中過期的資源描述。
清除功能可用來移除資料庫的內容。用於索引的磁碟空間將被回復,但不會回復主資料庫所使用的磁碟空間。相反,當新資料加入資料庫時會重新使用該空間。
搜尋伺服器可讓您將構成每個搜尋資料庫的實體檔案放置在多個磁碟、檔案系統、目錄或分割區上。透過將資料庫散佈在不同的實體或邏輯裝置中,您可建立超過單一裝置容量的大型資料庫。
依預設,搜尋伺服器設定資料庫僅使用一個目錄。指令行介面可供您針對資料庫分割區執行兩種操作:
新增分割區
移動分割區
搜尋伺服器不會檢查各分割區是否尚有剩餘空間。您必須自行維護足夠的空間供資料庫使用。
您可以新增資料庫分割區,總數最多可達 15 個。
一旦增加分割區數目,未來要減少數目,必須先刪除整個資料庫。
然而,只要您還有足夠的磁碟空間,不建議分割資料庫。
要變更任何資料庫分割區的實際位置,請指定新位置的名稱。同樣的,您也可以將現有的分割區重新命名。使用 rdmgr 指令進行分割區操作。如需 psadmin 指令的資訊,請參閱「 Sun Java System Portal Server 7.2 Command Line Reference」。
使用以下說明管理資料庫:
「Sun Java System Portal Server 7.2 Command-Line Reference」中的「psadmin create-search-database」
選取 [搜尋伺服器] 標籤,然後選取一個搜尋伺服器。
按一下功能表列中的 [資料庫],然後選取 [匯入代理程式]。
按一下 [新增] 以啟動精靈。
指定匯入代理程式屬性。
如需關於屬性的詳細資訊,請參閱「Sun Java System Portal Server 7.2 Technical Reference」中的「Import Agents」
按一下 [完成]。
「Sun Java System Portal Server 7.2 Command-Line Reference」中的「psadmin create-search-importagent」
選取 [搜尋伺服器] 標籤,然後選取一個搜尋伺服器。
按一下 [資料庫],然後選取功能表列中的 [管理]。
選取一個資料庫,並按一下 [管理資源描述]。
按一下 [新增],並指定屬性。
如需關於屬性的詳細資訊,請參閱「Sun Java System Portal Server 7.2 Technical Reference」中的「Schema」
按一下 [確定]。
選取 [搜尋伺服器] 標籤,然後選取一個搜尋伺服器。
按一下 [資料庫],然後選取功能表列中的 [管理]。
選取一個資料庫,並按一下 [管理資源描述]。
選取 [資源描述] 以執行以下其中一個動作:
編輯
編輯全部
刪除
如需關於屬性的詳細資訊,請參閱「Sun Java System Portal Server 7.2 Technical Reference」中的「Schema」
按一下 [儲存]。
搜尋伺服器提供多種報告,以讓您監視搜尋作業。
可以使用下列作業來管理種類:
從標籤中選取 [搜尋伺服器],然後選取搜尋伺服器。
在功能表列中選取 [種類],然後選取 [瀏覽/搜尋]。
按一下 [新增]。
出現 [新增搜尋種類] 對話方塊。
視需要指定屬性。
如需關於屬性的詳細資訊,請參閱「Sun Java System Portal Server 7.2 Technical Reference」中的「Manage Categories」
按一下 [確定]。
選取 [搜尋伺服器] 標籤,然後選取一個搜尋伺服器。
在功能表列中按一下 [種類],然後選取 [瀏覽/搜尋]。
選取一個種類,然後按一下 [編輯] 以顯示 [編輯種類] 頁面。
如需關於屬性的詳細資訊,請參閱「Sun Java System Portal Server 7.2 Technical Reference」中的「Manage Categories」
按一下 [搜尋伺服器] 標籤,然後選取一個搜尋伺服器。
在功能表列中按一下 [種類],然後選取 [Autoclassify]。
依需要修改屬性。
如需關於屬性的詳細資訊,請參閱「Sun Java System Portal Server 7.2 Technical Reference」
按一下 [儲存]。