Sun Java System Portal Server 7.1 관리 설명서

11장 검색 서버 관리

이 장에서는 Sun JavaTM System Portal Server 검색 서버를 구성하고 관리하는 방법을 설명합니다.

이번 장은 다음 절로 구성됩니다.

검색 서버에 대한 이해

Portal Server 검색 서버는 Google, Alta Vista 등과 같이 널리 사용되는 인터넷 검색 서버와 유사한 검색 및 찾아보기 인터페이스를 지원하기 위해 설계된 분류법 및 데이터베이스 서비스입니다. 검색 서버에는 문서 자원을 발견, 변환 및 요약하는 데 사용하는 로봇이 포함되어 있습니다. Portal Server 데스크탑에는 JSPTM(JavaServer PagesTM)를 바탕으로 한 검색 사용자 인터페이스가 포함되어 있습니다. 검색 서버에는 구성 편집을 위한 관리 도구와 시스템 관리를 위한 명령줄 도구가 포함되어 있습니다. 구성 설정은 Portal Server 관리 콘솔을 통해 정의 및 저장할 수 있습니다.


주 –

관리자는 관리 콘솔에서 대부분의 검색 서버 옵션을 구성할 수 있지만 관리 콘솔이 명령줄 인터페이스를 통해 사용할 수 있는 모든 관리 기능을 수행하지는 않습니다.


검색 데이터베이스

사용자는 자원을 찾기 위해 검색 서버의 데이터베이스를 쿼리합니다. 각 데이터베이스의 개별 항목을 자원 설명(RD)이라고 합니다. 자원 설명은 단일 자원에 대한 요약 정보를 제공합니다. 데이터베이스 스키마는 각 자원 설명의 필드를 결정합니다.

검색 서버는 RDM(Resource Description Messages) 및 SOIF(Summary Object Interchange Format)와 같은 개방형 인터넷 표준을 바탕으로 하므로 여러 플랫폼에 걸친 기업 환경에서 작동할 수 있습니다.

데이터베이스 분류법 범주

사용자는 두 가지 방법으로 검색 시스템과 상호 작용합니다. 직접 쿼리를 입력하여 데이터베이스를 검색하거나 사용자가 설계한 범주 집합을 사용하여 데이터베이스 컨텐트를 찾아볼 수 있습니다. 범주의 계층을 분류법이라고도 합니다. 자원을 범주화하는 것은 데이터베이스의 목차를 만드는 것과 같습니다.

또한 찾아보기 기능은 검색 시스템의 선택 기능입니다. 즉, 범주별 찾아보기 기능이 없는 검색 시스템을 사용할 수 있습니다. 찾아보기 가능한 범주를 추가하는 것이 인덱스 사용자에게 유용할지를 결정한 다음 어떤 종류의 범주를 만들 것인지 결정해야 합니다.

검색 데이터베이스의 자원을 범주에 할당하면 복잡도가 줄어듭니다. 데이터베이스에 매우 많은 항목이 있는 경우 이를 관련 항목으로 그룹화하는 것이 도움이 됩니다. 이를 통해 사용자는 특정 유형의 항목을 신속하게 찾고 유사한 항목을 비교하고 필요한 항목을 선택할 수 있습니다.

이러한 분류는 제품 및 서비스 인덱스에서 일반적입니다. 의류 카탈로그는 남성복, 여성복, 아동복으로 구분되며 각각은 다시 코트, 셔츠, 신발 등으로 세분됩니다. 사무 용품 카탈로그는 문구, 컴퓨터 및 소프트웨어에서 가구를 분리시킬 수 있습니다. 또한 광고 디렉토리는 제품 및 서비스 범주별로 배치됩니다.

인쇄된 인덱스의 범주별 그룹화 원칙은 온라인 인덱스에도 적용됩니다. 이 개념은 사용자가 특정 유형의 자원을 쉽게 찾아 필요한 것을 선택하도록 하는 것입니다. 설계한 인덱스 범위와 상관 없이 범주를 설정할 때의 주안점은 사용 편의성에 두어야 합니다. 즉, 사용자가 해당 범주를 어떻게 사용할 것인가를 알아야 합니다. 예를 들어 각각 다른 장소에 3개의 사무실이 있는 회사의 인덱스를 설계하는 경우 3개 사무실 각각에 해당하는 최상위 범주를 만들어야 합니다. 사용자가 지리적인 경계를 넘어 업무 부서에 더 관심이 있는 경우 자원을 회사의 부서별로 분류하는 것이 타당할 것입니다.

범주를 정의한 후에는 자원을 범주에 할당하기 위한 규칙을 설정해야 합니다. 이러한 규칙을 분류 규칙이라고 합니다. 분류 규칙을 올바로 정의하지 않으면 사용자가 범주 찾아보기로 자원을 찾을 수 없게 됩니다. 자원을 잘못 분류하는 것도 피해야 하지만 문서를 분류하지 않는 실수도 조심해야 합니다.

검색 서버 관리

Sun Java System Portal Server는 하나 이상의 검색 서버를 지원할 수 있습니다.

Procedure검색 서버를 만들려면

Portal Server 설치 중에 기본 검색 서버(search1)가 생성됩니다. 또한 검색 서버 만들기 마법사를 사용하여 새 검색 서버를 만들 수 있습니다.

시작하기 전에

사용하는 웹 컨테이너 인스턴스에 대한 구성 정보를 알아야 합니다.

  1. Portal Server 관리 콘솔에 로그인합니다.

  2. 메뉴 표시줄에서 [검색 서버], [새로 만들기]를 차례로 선택합니다.

    새 검색 서버 마법사가 나타납니다.

  3. 지침에 따라 수행한 다음 [마침]을 눌러 지정된 검색 서버를 만듭니다.

같은 기능의 psadmin 명령

psadmin create-search-server.

Procedure검색 서버를 삭제하려면

  1. Portal Server 관리 콘솔에 로그인합니다.

  2. 메뉴 표시줄에서 [검색 서버]를 선택합니다.

  3. 검색 서버를 선택한 다음 [삭제]를 누릅니다.

같은 기능의 psadmin 명령

psadmin delete-search-server

데이터베이스 개요

검색 서버는 자원 설명을 데이터베이스에 저장합니다. 검색 데이터베이스는 문서 컬렉션 인덱스이며인덱서(rdmgr 명령 또는 검색 서버 자체)에서 생성됩니다. 예를 들어, 기본적으로 웹 사이트를 탐색하도록 로봇을 설정할 수 있으며 로봇은 찾은 모든 웹 사이트를 사용자가 데이터를 검색할 수 있는 기본 검색 데이터베이스로 인덱싱합니다. 다른 데이터베이스에 대한 데이터나 인덱스 역시 마찬가지입니다.

다음은 데이터베이스를 관리하기 위해 수행해야 하는 몇 가지 구성 및 유지 관리 작업입니다.

데이터베이스로 가져오기

일반적으로 검색 데이터베이스의 항목은 로봇에서 제공됩니다. 다른 Portal Server 검색 서버에서, iPlanet Web Server나 NetscapeTM Enterprise Server에서, 또는 다른 소스로부터 생성된 데이터베이스에서 기존 항목의 데이터베이스를 가져올 수도 있습니다. 로봇을 보내 새로 만드는 대신 기존 RD 데이터베이스를 가져오는 것이 네트워크 트래픽의 양을 줄이는 데 도움이 됩니다. 이렇게 하면 대규모 인덱싱 작업을 작게 나누어 더욱 신속하게 완료할 수 있습니다. 중앙 데이터베이스가 인덱싱할 서버에서 물리적으로 멀리 떨어져 있는 경우에는 RD를 로컬로 생성하고 정기적으로 원격 데이터베이스를 중앙 데이터베이스로 가져오는 것이 도움이 될 수 있습니다.

검색 서버는 가져오기 에이전트를 사용하여 다른 서버나 데이터베이스에서 RD를 가져옵니다. 가져오기 에이전트는 외부 소스로부터 다수의 RD를 검색하여 이 정보를 로컬 데이터베이스로 병합하는 프로세스입니다.

데이터베이스를 가져오려면 먼저 가져오기 에이전트를 만들어야 합니다. 에이전트를 만든 후에는 즉시 가져오기 프로세스를 시작하거나 정기적으로 가져오기 프로세스를 실행하도록 일정을 수립할 수 있습니다.

데이터베이스 스키마 편집

스키마는 검색 서버가 각 자원에서 관리할 정보와 그 형태를 결정합니다. 스키마의 설계는 인덱스 사용에 영향을 주는 두 가지 요소를 결정합니다.

스키마는 데이터베이스에 있는 자원 설명의 마스터 데이터 구조입니다. 이 데이터 구조에서 필드를 정의하고 인덱싱하는 방식에 따라 사용자가 자원에 액세스하는 수준이 달라집니다.

스키마는 검색 서버와 로봇이 사용하는 파일 구조와 밀접하게 연관되어 있습니다. 관리 콘솔의 스키마 도구를 사용하여 데이터 구조만 변경해야 하며절대 스키마 파일을 직접 편집해서는 안 됩니다.

검색 서버의 데이터베이스 스키마를 편집하여 새 스키마 속성을 추가하거나 기존 스키마 속성을 수정하거나 속성을 삭제할 수 있습니다.

스키마에는 다음과 같은 속성이 있습니다.

스키마 별칭 정의

데이터베이스 스키마의 필드에 사용되는 이름 사이에 불일치가 생길 수 있습니다. 한 서버에서 다른 서버로 자원 설명을 가져오는 경우 두 서버가 스키마 항목에 동일한 이름을 사용한다고 항상 보장할 수는 없습니다. 마찬가지로 로봇이 문서의 HTML <meta> 태그를 스키마 필드로 변환할 때 문서가 이름을 제어합니다.

검색 서버를 사용하면 스키마 속성에 대해 스키마 별칭을 정의하여 이러한 외부 스키마 이름을 데이터베이스의 필드에 대해 유효한 이름으로 매핑할 수 있습니다.

데이터베이스 분석 보기

검색 서버는 각 데이터베이스에서 인덱싱한 사이트 수와 자원의 수에 대한 정보가 있는 보고서를 제공합니다.

데이터베이스 다시 인덱싱

인덱싱된 필드를 추가하거나 제거하기 위해 스키마를 편집했거나 디스크 오류로 인덱스 파일이 손상된 경우 검색 서버에 대한 자원 설명 데이터베이스를 다시 인덱싱해야 할 수 있습니다. 또한 어떤 다른 이유로 데이터베이스 컨텐트와 인덱스 사이에 불일치가 있는 경우 다시 인덱싱해야 합니다. 예를 들면, 인덱싱하는 동안 시스템 장애가 발생한 경우가 있을 수 있습니다.

대규모 데이터베이스를 다시 인덱싱하면 여러 시간이 걸릴 수 있습니다. 데이터베이스를 다시 인덱싱하는 데 필요한 시간은 데이터베이스의 레코드 수에 따라 달라집니다. 대규모 데이터베이스인 경우에는 서버 사용량이 적을 때 다시 인덱싱을 수행합니다.

데이터베이스 만료

날짜가 지난 자원 설명을 제거하는 것이 데이터베이스 만료 작업입니다. 자원 설명은 만료 작업을 실행할 때만 제거됩니다. 만료된 자원 설명이 삭제되지만 데이터베이스 크기는 줄어들지 않습니다.

자원 설명의 한 속성은 만료 날짜입니다. 로봇은 HTML <meta> 태그로부터 또는 자원 서버에서 제공한 정보로부터 만료 날짜를 설정할 수 있습니다. 기본적으로 자원 설명은 자원에서 다른 만료 날짜를 지정하지 않은 경우 만들어지고 나서 3개월 후에 만료됩니다. 검색 서버는 데이터베이스에서 만료된 자원 설명을 정기적으로 제거해야 합니다.

데이터베이스 제거

제거 작업을 통해 데이터베이스의 컨텐트를 제거할 수 있습니다. 인덱스에 사용된 디스크 공간이 복구되지만 주 데이터베이스에 사용하는 디스크 공간은 복구되지 않고데이터베이스에 추가되는 새 데이터에 다시 사용됩니다.

데이터베이스 파티션 분할

검색 서버를 사용하면 각 검색 데이터베이스를 구성하는 물리적 파일을 여러 디스크, 파일 시스템, 디렉토리 또는 파티션에 배치할 수 있습니다. 데이터베이스를 여러 물리적 또는 논리적 장치에 걸쳐 분산시키면 단일 장치의 수용 능력보다 큰 데이터베이스를 만들 수 있습니다.

기본적으로 검색 서버는 한 디렉토리만 사용하도록 데이터베이스를 설정합니다. 명령줄 인터페이스를 사용하면 데이터베이스 파티션에서 두 가지 작업을 수행할 수 있습니다.

검색 서버는 개별 파티션에 남은 공간이 있는지 확인하는 어떠한 검사도 수행하지 않습니다. 따라서 데이터베이스를 위한 적절한 여유 공간을 유지 관리하는 것은 사용자의 책임입니다.

최대 15개 파티션까지 새 데이터베이스 파티션을 추가할 수 있습니다.


주 –

한 번 파티션 수를 증가시키면 나중에 이 수를 줄이기 위해 전체 데이터베이스를 삭제해야 합니다.

그러나 충분한 디스크 공간이 있다면 파티션을 사용하지 않는 것이 좋습니다.


데이터베이스 파티션의 물리적 위치를 변경하려면 새 위치의 이름을 지정합니다. 마찬가지로 기존 파티션의 이름을 변경할 수 있습니다. rdmgr 명령을 사용하여 파티션을 조작합니다. psadmin 명령에 대한 자세한 내용은 Sun Java System Portal Server 7.1 Command Line Reference를 참조하십시오.

데이터베이스 관리

다음 지침에 따라 데이터베이스를 관리합니다.

Procedure데이터베이스를 만들려면

  1. Portal Server 관리 콘솔에 로그인합니다.

  2. [검색 서버] 탭을 선택한 다음 검색 서버를 선택합니다.

  3. 메뉴 표시줄에서 [데이터베이스], [관리]를 차례로 누릅니다.

  4. [새로 만들기]를 누릅니다.

    새 데이터베이스 페이지가 표시됩니다.

  5. 새 데이터베이스 이름을 입력하고 [확인]을 누릅니다.

같은 기능의 psadmin 명령

psadmin create-search-database

Procedure가져오기 에이전트를 만들려면

  1. Portal Server 관리 콘솔에 로그인합니다.

  2. [검색 서버] 탭을 선택한 다음 검색 서버를 선택합니다.

  3. 메뉴 표시줄에서 [데이터베이스], [가져오기 에이전트]를 차례로 누릅니다.

  4. [새로 만들기]를 눌러 마법사를 시작합니다.

  5. 가져오기 에이전트 속성을 지정합니다.

    속성에 대한 자세한 내용은 Sun Java System Portal Server 7.1 Technical ReferenceImport Agents를 참조하십시오.

  6. [마침]을 누릅니다.

같은 기능의 psadmin 명령

psadmin create-search-importagent

Procedure자원 설명을 만들려면

  1. Portal Server 관리 콘솔에 로그인합니다.

  2. [검색 서버] 탭을 선택한 다음 검색 서버를 선택합니다.

  3. 메뉴 표시줄에서 [데이터베이스], [관리]를 차례로 누릅니다.

  4. 데이터베이스를 선택하고 [자원 설명 관리]를 누릅니다.

  5. [새로 만들기]를 누르고 속성을 지정합니다.

    속성에 대한 자세한 내용은 Sun Java System Portal Server 7.1 Technical ReferenceSchema를 참조하십시오.

  6. [확인]을 누릅니다.

Procedure자원 설명을 관리하려면

  1. Portal Server 관리 콘솔에 로그인합니다.

  2. [검색 서버] 탭을 선택한 다음 검색 서버를 선택합니다.

  3. 메뉴 표시줄에서 [데이터베이스], [관리]를 차례로 누릅니다.

  4. 데이터베이스를 선택하고 [자원 설명 관리]를 누릅니다.

  5. [자원 설명]을 선택하여 다음 작업 중 하나를 수행합니다.

    • 편집

    • 모두 편집

    • 삭제

    속성에 대한 자세한 내용은 Sun Java System Portal Server 7.1 Technical ReferenceSchema를 참조하십시오.

  6. [저장]을 누릅니다.

같은 기능의 psadmin 명령

psadmin modify-search-resourcedescription

보고서 관리

검색 서버는 검색 활동을 모니터링할 수 있도록 다양한 보고서를 제공합니다.

Procedure보고서를 보려면

  1. Portal Server 관리 콘솔에 로그인합니다.

  2. [검색 서버] 탭을 선택한 다음 검색 서버를 선택합니다.

  3. 메뉴 표시줄에서 [보고서]를 누릅니다.

  4. 메뉴 표시줄에서 링크를 눌러 특정 보고서를 봅니다.

    다음과 같은 옵션을 사용할 수 있습니다.

    • 로그

    • 고급 로봇 보고서

    • 인기 있는 검색

    • 제외된 URL

범주 관리

다음과 같은 범주 관리 작업을 사용할 수 있습니다.

Procedure범주를 만들려면

  1. Portal Server 관리 콘솔에 로그인합니다.

  2. 탭에서 [검색 서버]를 선택한 다음 검색 서버를 선택합니다.

  3. 메뉴 표시줄에서 [범주], [찾아보기/검색]을 차례로 선택합니다.

  4. [새로 만들기]를 누릅니다.

    [새 검색 범주 만들기] 대화 상자가 나타납니다.

  5. 필요에 따라 속성을 지정합니다.

    속성에 대한 자세한 내용은 Sun Java System Portal Server 7.1 Technical ReferenceManage Categories를 참조하십시오.

  6. [확인]을 누릅니다.

Procedure범주를 편집하려면

  1. Portal Server 관리 콘솔에 로그인합니다.

  2. [검색 서버] 탭을 선택한 다음 검색 서버를 선택합니다.

  3. 메뉴 표시줄에서 [범주], [찾아보기/검색]을 차례로 누릅니다.

  4. 범주를 선택하고 [편집]을 눌러 범주 편집 페이지를 표시합니다.

    속성에 대한 자세한 내용은 Sun Java System Portal Server 7.1 Technical ReferenceManage Categories를 참조하십시오.

Procedure자동 분류를 실행하려면

  1. Portal Server 관리 콘솔에 로그인합니다.

  2. [검색 서버] 탭을 선택한 다음 검색 서버를 선택합니다.

  3. 메뉴 표시줄에서 [범주], [자동 분류]를 차례로 누릅니다.

  4. [자동 분류 실행]을 누릅니다.

Procedure자동 분류 속성을 편집하려면

  1. Portal Server 관리 콘솔에 로그인합니다.

  2. [검색 서버] 탭을 누른 다음 검색 서버를 선택합니다.

  3. 메뉴 표시줄에서 [범주], [자동 분류]를 차례로 누릅니다.

  4. 필요에 따라 속성을 수정합니다.

    속성에 대한 자세한 내용은 Sun Java System Portal Server 7.1 Technical Reference를 참조하십시오.

  5. [저장]을 누릅니다.