Sun Java System Portal Server 7.1 管理指南

数据库概述

搜索服务器在数据库中存储资源的描述。搜索数据库是一个文档集合索引。由索引器(rdmgr 命令或搜索服务器本身)创建。例如,默认情况下,robot 可以设置为搜索 Web 站点,并将其找到的内容在“默认”搜索数据库(用户可在其中搜索数据)中建立索引。数据和索引也可存储到其他数据库。

以下是管理数据库时可能需要执行的一些配置和维护任务:

导入数据库

通常情况下,搜索数据库中的项目来自 robot。也可以从其他 Portal Server 搜索服务器、iPlanet Web Server 或 NetscapeTM Enterprise Server 或者由其他源生成的数据库导入现有项目数据库。导入现有数据库的 RD 而非发送 robot 来重新创建,这将有助于减少网络通信流量。这种做法还可将工作量分成多个较小的部分,从而能够更迅速地完成大量的索引创建工作。如果中央数据库与建立索引的服务器物理距离较远,那么在本地生成 RD 并定期将远程数据库导入中央数据库是很有帮助的。

搜索服务器使用导入代理从其他服务器或从数据库导入 RD。导入代理是一个进程,它从外部源中检索若干 RD,并将这些信息合并到本地数据库中。

在导入数据库前,必须先创建导入代理。创建代理后,可以立即启动导入进程或者安排定期运行导入进程的时间。

编辑数据库模式

模式决定搜索服务器保持每一资源的何种信息以及保持信息的形式。模式的设计决定影响索引可用性的两个因素:

对于数据库中的“资源描述”,这种模式是一种主数据结构。根据使用这种数据结构定义字段和为字段创建索引的方式,用户将具有不同的资源访问级别。

模式与搜索服务器及其 robot 使用的文件的结构紧密联系。应只使用管理控制台中的模式工具更改此数据结构。一定不要直接编辑模式文件。

您可以编辑搜索服务器的数据库模式,来添加新模式属性、修改模式属性或删除这些属性。

此模式包括下列属性:

定义模式别名

您可能会发现数据库模式中使用的字段名称之间存在差异。当您将“资源描述”从一个服务器导入另一个服务器时,您无法始终保证这两个服务器对各自模式中的项目使用相同的名称。同样,当 robot 将某个文档中的 HTML <meta> 标记转换成模式字段时,该文档对这些名称进行控制。

搜索服务器允许您为模式属性定义模式别名,以便将这些外部模式名映射到数据库中的有效字段名。

查看数据库分析

搜索服务器会提供报告,报告包含有关已建立索引的站点数量以及数据库中每个站点的资源数量的信息。

重建数据库索引

如果您已经编辑了模式来添加或删除已建立索引的字段,或由于磁盘错误破坏了索引文件,则可能需要为搜索服务器重新建立“资源描述”数据库索引。如果由于任何其他原因导致数据库内容及其索引之间出现不一致,也可能需要重建索引。例如,在建立索引时发生系统故障。

重建大型数据库的索引可能需要几个小时。重建数据库索引所需的时间与数据库中的记录数有关。如果是大型数据库,应在服务器处于非需求高峰时重建索引。

终止数据库

删除过时的“资源描述”即为终止数据库。当运行到期程序时,才删除“资源描述”。到期的“资源描述”将被删除,但数据库大小不会减少。

“资源描述”的属性之一是到期日期。Robot 可以通过 HTML <meta> 标记或通过资源服务器提供的信息来设置到期日期。除非资源指定了不同的到期日期,否则“资源描述”的到期日期默认为自创建之日起三个月后。搜索服务器应从数据库中定期清除到期的“资源描述”。

清除数据库

清除操作允许您删除数据库的内容。索引使用的磁盘空间将被恢复,但主数据库使用的磁盘空间不会被恢复。而是在将新数据添加到数据库中时重新使用。

将数据库分区

搜索服务器允许您将组成每个搜索数据库的物理文件放到多个磁盘、文件系统、目录或分区中。通过将数据库分布到不同的物理或逻辑设备上,就可以创建一个比能在单个设备上创建的数据库更大的数据库。

默认情况下,搜索服务器将数据库设置为仅使用一个目录。命令行界面允许您对数据库分区执行两种操作:

搜索服务器不执行任何检查操作来确保单个分区有剩余空间。而是由您负责为数据库保持足够的可用空间。

添加新数据库分区的最大总数为 15 个。


注 –

增加分区数后,如果以后想减少此数目,则必须删除整个数据库。

不过,只要您有足够的磁盘空间,我们就不推荐使用分区。


要更改任意数据库分区的物理位置,可指定新位置的名称。同样,可以重新命名现有分区。使用 rdmgr 命令来处理分区。有关 psadmin 命令的信息,参见《Sun Java System Portal Server 7.1 Command Line Reference》