ヘッダーをスキップ
Oracle Ultra Search管理者ガイド
11gリリース1(11.1)
E05790-02
  目次
目次
索引
索引

戻る
戻る
 
次へ
次へ
 

8 Oracle Ultra Search管理ツール

Oracle Ultra Search管理ツールを使用して、Oracle Ultra Searchインスタンスを管理できます。この章では、Oracle Ultra Search管理ツールの画面の概略を示します。次の項目が含まれます。

Oracle Ultra Search管理ツール

Oracle Ultra Search管理ツールは、J2EEに準拠したWebアプリケーションです。このツールを使用して、Oracle Ultra Searchインスタンスを管理できます。Oracle Ultra Search管理ツールを使用するには、データベース・ユーザー、Enterprise Managerスーパーユーザー、Portalユーザーまたはシングル・サインオン・ユーザーとして任意のブラウザからログオンします。


注意:

Oracle Ultra Search管理ツールおよびOracle Ultra Searchの問合せアプリケーションは、Oracle Ultra Search中間層の一部です。ただし、Oracle Ultra Search管理ツールは、Oracle Ultra Searchの問合せアプリケーションからは独立しています。したがって、セキュリティまたはスケーラビリティを強化するために、他のコンピュータで構築することができます。

管理ツールを使用して、次のことを実行できます。

クローラ・パラメータの設定

Oracle Ultra Searchクローラを構成するには、次の処理を行う必要があります。

  • クローラのログ・ファイル・ディレクトリなどのクローラ・パラメータを設定します。この作業を行うには、「クローラ」タブを使用します。

  • 認証やプロキシ・サーバーなどのWebアクセス・パラメータを設定します。この作業を行うには、「Webアクセス」タブを使用します。

  • データ・ソースを定義します。データ・ソースには、Webページ、データベース表、ファイル、電子メール・メーリング・リスト、Oracleソース(たとえばOracle Application Server Portalや連携したソース)またはユーザー定義のデータ・ソースがあります。クローラ・スケジュールには、1つ以上のデータ・ソースを割り当てることができます。データ・ソースを定義するには、「ソース」タブを使用します。ソースに対するパラメータ(Webソースに対するドメインの包含または除外など)、または表ソースに対する表示URLのテンプレートまたは列も設定できます。

  • 同期スケジュールを定義します。クローラは、同期スケジュールを使用して、Oracle Ultra Search索引と現行のデータ・ソースの内容を調整します。クロール・スケジュールを定義するには、「スケジュール」タブを使用します。

問合せオプションの設定

問合せオプションを使用して、ユーザーによる検索を制限します。検索をドキュメントの属性およびデータ・グループによって制限できます。

属性

検索属性は、表の列、ドキュメント属性および電子メールのヘッダーにマップできます。作成者や説明などの一部の属性は事前に定義されているため、構成する必要はありません。ただし、独自の属性をカスタマイズすることは可能です。問合せユーザーに公開するカスタム検索属性を設定するには、「属性」タブを使用します。

データ・グループ

データ・グループは、検索エンジンのユーザーに公開された論理エンティティです。問合せを入力すると、検索エンジンのユーザーは、検索対象となる1つ以上のデータ・グループを選択するように求められます。データ・グループは1つ以上のデータ・ソースで構成されます。データ・グループを定義するには、「問合せ」タブを使用します。

異なる言語でのオンライン・ヘルプ

Oracle Ultra Searchでは、様々な言語で表示可能な状況依存のオンライン・ヘルプが提供されます。言語設定は「ユーザー」タブで変更できます。

Oracle Ultra Searchへのログオン

Oracle Ultra Search管理ツールにログオンできるのは、次のユーザーです。

管理ツールにログオンするには、Webブラウザで次のURLの1つを指定してください。

インストール直後にインスタンスの作成と管理ができるのは、次のユーザーのみです。

これらの特別なユーザーとしてログオンした後は、他のユーザーに権限を付与し、Oracle Ultra Searchインスタンスを作成および管理できるように指定できます。Oracle Ultra Search管理ツールを使用すると、Oracle Ultra Searchに関連する権限の既存のユーザーへの付与や取消しが可能です。ユーザーの追加または削除には、シングル・サインオン・ユーザーの場合はOracle Internet Directory、ローカル・データベース・ユーザーの場合はOracle Enterprise Managerを使用します。


注意:

Oracle Ultra Search製品のデータベース・ディクショナリは、WKSYSスキーマにインストールされています。


関連項目:


シングル・サインオン・ユーザーとしてのインスタンスへのログオンと管理


注意:

シングル・サインオンは、Oracle Identity Managementインフラストラクチャがインストールされている場合のみ使用できます。

Oracle Ultra Searchへのログオン

シングル・サインオン・ユーザーが、Oracle Ultra Search管理ツールにログオンすると、まずシングル・サインオンのログイン画面が表示されます。シングル・サインオン・ユーザー名とパスワードを入力します。OracleAS Single Sign-Onによってユーザーが認証されると、管理権限のあるOracle Ultra Searchインスタンスのリストがユーザーに表示されます。

ユーザーにより、URLが異なります。次に例を示します。

  • シングル・サインオン・ユーザー:

    http://host:http_port/ultrasearch_admin_sso/index.jsp
    
  • Portalユーザー:

    http://host:http_port/pls/portal
    
  • Oracle Enterprise Managerのユーザー:

    http://host:em_port/
    

シングル・サインオン・ユーザーへの権限の付与

場合によっては、スーパーユーザー権限、またはOracle Ultra Searchインスタンスを管理する権限をシングル・サインオン・ユーザーに付与する必要があります。後述するように、Oracle Application Server Portalがホスト・モードまたは非ホスト・モードのどちらで実行されているかによって、このプロセスは異なります。


注意:

シングル・サインオン・ユーザーは、シングル・サインオン・ニックネームとサブスクライバ・ニックネームの組合せを持つOracle Ultra Searchによって一意に識別されます。

  • 非ホスト・モードで、シングル・サインオン・ユーザーに権限を付与する場合、サブスクライバ・ニックネームは必要ありません。これは、非ホスト・モードのOracle Application Server Portalにはサブスクライバが1つしかないためです。

  • ホスト・モードでは、シングル・サインオン・ユーザーに権限を付与する場合、サブスクライバ・ニックネームが必要です。これは、Oracle Application Server Portalに複数のサブスクライバが存在する可能性があるためです。同じシングル・サインオン・ニックネーム(PORTALなど)を持つ2人以上のユーザーは、サブスクライバ・ニックネームで区別される、個別のシングル・サインオン・ユーザーである可能性があります。ホスト・モードでPortalを実行する場合は、次の点にも注意してください。

    • デフォルトのサブスクライバ・ユーザーに権限を付与するときは、実際のニックネームが異なる場合(ORACLEなど)でも、サブスクライバ・ニックネームには常にDEFAULT COMPANYと指定してください。実際のニックネームは、Oracle Ultra Searchでは認識されません。

    • デフォルトのサブスクライバ・ユーザーとしてOracleAS Single Sign-Onにログインする場合は、サブスクライバ・ニックネームを空白にしておきます。実際のサブスクライバ・ニックネームのかわりにDEFAULT COMPANYと入力することもできます。たとえば、ORACLEと入力すると、Oracle Ultra Searchで認識されます。


    注意:

    インストール後はいつでも、Oracle Application Server Portalスクリプトを実行して、実行モードを非ホスト・モードからホスト・モードに変更できます。この変更を行うと、Oracle Application Server PortalスクリプトはOracle Ultra Searchスクリプトを呼び出して、Oracle Ultra Searchに非ホスト・モードからホスト・モードへの変更を通知します。


    関連項目:

    「Hosting Developer's Guide」(http://www.oracle.com/technology

「インスタンス」タブ

Oracle Ultra Search管理ツールに正常にログオンすると、「インスタンス」タブにユーザー自身が表示されています。このページでローカル・データベース内のすべてのOracle Ultra Searchインスタンスを管理します。ページの左上部には、インスタンスを作成、選択、編集および削除するためのタブがあります。

クロールおよび索引付けの構成に管理ツールを使用する前に、Oracle Ultra Searchインスタンスを作成する必要があります。Oracle Ultra Searchインスタンスは名前で識別され、独自のクロール・スケジュールおよび索引を持ちます。Oracle Ultra Searchインスタンスを作成できるのは、スーパーユーザー権限を付与されているユーザーのみです。

インスタンスの作成

インスタンスを作成するには、「作成」をクリックします。標準インスタンスまたは読取り専用のスナップショット・インスタンスを作成できます。新しいインスタンスを作成できるのは、スーパーユーザー権限を持つユーザーのみです。


注意:

異なるOracle Ultra Searchインスタンス内で同じデータ・ソースを定義すると、ロギング可能な表データ・ソース、電子メール・データ・ソースおよび一部のユーザー定義データ・ソースでクロールの競合が発生する可能性があります。

標準インスタンスの作成

インスタンスを作成する手順は、次のとおりです。

  1. データベース・ユーザーを準備します。

    各Oracle Ultra Searchインスタンスは、WKUSERロールを持つデータベース・ユーザーとスキーマに基づいています。

    Oracle Ultra Searchインスタンスの格納用に作成するデータベース・ユーザーには、専用の自己完結型表領域を割り当てる必要があります。このインスタンスのスナップショット・インスタンスを作成する計画がある場合、これは重要です。これを行うには、新しい表領域を作成します。次に、デフォルト表領域が今作成した表領域である新規データベース・ユーザーを作成します。


    関連項目:


  2. Oracle Ultra Search管理ツールでのインスタンスの作成手順に従います。

    インスタンスを作成するメイン・ページから「インスタンスの作成」をクリックして、次の情報を指定します。

    • インスタンス名

    • データベース・スキーマ: これはステップ1のユーザー名です。

    • スキーマ・パスワード。

    次のオプション索引設定も入力できます。

    • レクサー

      索引付けに使用するレクサー名を指定します。レクサーは、言語にあわせてテキストをトークンに分割します。このトークンは、通常は単語です。デフォルト・レクサーはwksys.wk_lexerで、wk0pref.sqlファイルに定義されています。インスタンスの作成後にレクサーを変更することはできません。

    • ストップリスト

      索引付けで使用するストップリスト名を指定します。デフォルト・ストップリストはwksys.wk_stoplistで、wk0pref.sqlファイルに定義されています。インスタンスを作成した後、ストップリストは変更しないでください。

    • 記憶域

      インスタンスの索引に対する記憶域プリファレンスの名前を指定します。デフォルト記憶域プリファレンスはwksys.wk_storageで、wk0pref.sqlファイルに定義されています。インスタンスの作成後は、記憶域プリファレンスを変更できません。


    関連項目:

    • レクサー、ストップリストおよび記憶域を作成および変更する方法は、『Oracle Textリファレンス』を参照してください。

    • 「ストップリストの管理」


スナップショット・インスタンスの作成

スナップショット・インスタンスは、インスタンスのコピーです。標準インスタンスとは異なり、スナップショット・インスタンスは読取り専用で、その索引は検索ドメインと同期化されません。マスター・インスタンスが検索ドメインと再同期されると、スナップショット・インスタンスは古くなります。その時点でスナップショットを削除し、新しいスナップショットを作成する必要があります。


注意:

スナップショットとそのマスター・インスタンスを同じデータベース内に存在させることはできません。

スナップショット・インスタンスは、次の場合に役立ちます。

  • 問合せ処理

    2つのOracle Ultra Searchインスタンスで、同じ検索ドメインに関する問合せに回答できます。したがって、一定期間内では、1つのインスタンスがドメインに関する問合せに回答するより、2つのインスタンスの方がより多く回答できます。スナップショット・インスタンスはクロールと索引付けに関係しないため、スナップショット・インスタンスの作成は高速でコストがかかりません。したがって、スナップショット・インスタンスによってスケーラビリティを改善することができます。

  • バックアップ

    マスター・インスタンスが破損した場合は、インスタンス・モードを更新可能に編集することによって、そのスナップショットを標準インスタンスに変換できます。スナップショットとそのマスター・インスタンスは同じデータベース上に存在させることができないため、スナップショット・インスタンスを更新可能に変更できるのは、破損したマスター・インスタンスを置換する場合のみです。

スナップショット・インスタンスは、マスター・インスタンスからの認証を継承していません。したがって、スナップショット・インスタンスを更新可能にする場合は、検索ドメインのクロールに必要な認証情報を再度入力する必要があります。

スナップショット・インスタンスを作成する手順は、次のとおりです。

  1. データベース・ユーザーを準備します。

    標準インスタンスと同様に、スナップショット・インスタンスにはデータベース・ユーザーが必要です。このユーザーにはWKUSERロールを付与する必要があります。

  2. マスター・インスタンスからデータをコピーします。

    このコピーは、表領域名の変更ができないトランスポータブル表領域メカニズムを使用して行います。したがって、スナップショット・インスタンスは、そのマスター・インスタンスと同じデータベース上には作成できません。

    マスター・インスタンス・データすべてが含まれている表領域または一連の表領域を識別します。次に、その表領域をコピーし、ステップ1のデータベース・ユーザーに接続します。

  3. Oracle Ultra Search管理ツールでのスナップショット・インスタンスの作成方法に従います。

    インスタンスを作成するメイン・ページから「読取り専用スナップショット・インスタンスの作成」をクリックして、次の情報を指定します。

    • スナップショット・インスタンス名。

    • スナップショット・スキーマ名: これは手順1のデータベース・ユーザー名です。

    • スナップショット・スキーマ・パスワード。

    • データベース・リンク: これはマスター・インスタンスが稼働しているデータベースへのデータベース・リンク名です。

    • マスター・インスタンス名。

  4. セキュアな検索を実行するために、スナップショットを有効にします。

    スナップショットのマスター・インスタンスがセキュアな検索に対応しており、スナップショットを作成している宛先のデータベースが、セキュアな検索に対応したインスタンスをサポートしている場合は、スナップショットを作成している宛先のデータベースで、PL/SQLプロシージャも実行する必要があります。

    このプロシージャを実行すると、宛先データベースのアクセス制御リスト(ACL)のIDが変換され、IDが有効になります。WKSYSユーザーとしてデータベースにログオンします。次のようにして、プロシージャを起動します。

    exec WK_ADM.USE_INSTANCE('instance_name');
    exec WK_ADM.TRANSLATE_ACL_IDS();
    

    instance_nameは、スナップショット・インスタンスの名前です。

この文が、エラーなしで正常に完了することを確認します。


関連項目:

  • WKSYSパスワードの変更方法およびOracle Ultra Searchのデータベース・ユーザーの構成手順は、第5章「Oracle Ultra Searchのインストール後の情報」を参照してください。

  • トランスポータブル表領域の使用方法の詳細は、『Oracle Database管理者ガイド』を参照してください。


インスタンスの選択

複数のOracle Ultra Searchインスタンスを保持できます。たとえば、マーケティング、人事管理および開発の各ポータル用に個別のOracle Ultra Searchインスタンスを保持できます。管理ツールでは、インスタンス固有の変更を行う前に、インスタンスを指定する必要があります。

インスタンスを選択する手順は、次のとおりです。

  1. 「インスタンス」タブ「選択」をクリックします。

  2. プルダウン・メニューからインスタンスを選択します。

  3. 「適用」をクリックします。


注意:

インスタンスはデータを共有しません。データ・ソース、スケジュールおよび索引は、各インスタンスに対して固有です。

インスタンスの削除

インスタンスを削除する手順は、次のとおりです。

  1. 「インスタンス」タブ「削除」をクリックします。

  2. プルダウン・メニューからインスタンスを選択します。

  3. 「適用」をクリックします。


注意:

Oracle Ultra Searchインスタンスを削除するには、ユーザーにスーパーユーザー権限が付与されている必要があります。

インスタンスの編集

インスタンスを編集するには、「インスタンス」タブ「編集」を選択します。

(インスタンスを更新可能にする)インスタンス・モードやインスタンス・パスワードを変更できます。

インスタンス・モード

インスタンス・モードは、更新可能または読取り専用に変更できます。更新可能なインスタンスは、それ自体で設定スケジュールの検索ドメインと同期を行いますが、読取り専用のインスタンス(スナップショット・インスタンス)は同期を行いません。インスタンス・モードを設定するには、対応するボックスを選択して「適用」をクリックします。

スキーマ・パスワード

Oracle Ultra Searchインスタンスは、常駐しているデータベース・ユーザーのパスワードを認識している必要があります。インスタンスは、この情報をデータベースから直接取得できません。インスタンス作成時に、Oracleがデータベース・ユーザーのパスワードを指定し、この情報をインスタンスがキャッシュします。

このデータベース・ユーザー・パスワードを変更した場合は、インスタンスがキャッシュしているパスワードを更新する必要があります。これを行うには、新規パスワードを入力して「適用」をクリックします。データベースと照合して検証された新規パスワードは、キャッシュされたパスワードを置換します。

「クローラ」タブ

Oracle Ultra Searchクローラは、スレッドを起動して、Webサイトやデータベース表、電子メール・アーカイブなど、定義済のデータ・ソースをクロールするJavaアプリケーションです。クロールは、「スケジュール」タブに定義されているとおりに、スケジューリングされた間隔で定期的に行われます。

「クローラ」タブでは、次のような様々なクローラ設定を構成できます。

設定の構成

クローラ・スレッド

実行時に起動されるクローラ・スレッドの数を指定します。

プロセッサ数

Oracle Ultra Searchクローラを実行するサーバーに存在するCPUの数を指定します。この設定によって、システムで使用するドキュメント変換スレッドの最適な数が決まります。ドキュメント変換スレッドは、複数形式のドキュメントをHTMLドキュメントに変換し、適切な索引付けを行います。

自動言語検出

Oracle Ultra Searchクローラで検索したすべてのドキュメントに、言語が指定されているわけではありません。言語の指定がないドキュメントについては、Oracle Ultra Searchクローラが自動的に言語を検出します。この機能を有効にする場合は、「はい」をクリックします。

言語認識機能は、様々な言語(デンマーク語、オランダ語、英語、フランス語、ドイツ語、イタリア語、ポルトガル語、スペイン語など)によるドキュメントのトライグラム・データを使用して統計的に言語を判断します。指定のドキュメントはいずれの言語にも属さないという仮説から開始し、最終的には、特定言語に対するこの仮説の誤りを可能な範囲で証明します。この機能は、Latin-1アルファベットおよび文字のUnicode範囲が確定している言語(中国語、日本語、韓国語など)で作動します。

クローラは、言語コードが表データ・ソースである場合は、HTTPヘッダー・コンテンツ言語またはLANGUAGE列をチェックすることによって、言語コードを判断します。言語を判断できない場合は、次の措置が講じられます。

  1. 言語認識機能が使用可能でない場合や言語コードを判断できない場合は、デフォルト言語コードが使用されます。

  2. 言語認識機能が使用可能な場合は、その出力が使用されます。

この言語コードは、WK$URL表とWK$DOC表のLANG列に移入されます。Oracle Ultra Searchで使用されるレクサーは、マルチレクサーのみです。すべてのドキュメントURLは、WK$DOC(索引付け関連)およびWK$URL(クロール関連)に格納されます。

デフォルト言語

自動言語検出が使用できない場合やWebドキュメントに言語の指定がない場合、クローラはWebページがデフォルトの言語で書かれているものと認識します。ドキュメントの索引付け方法は言語によって決定されるため、この設定は重要です。


注意:

このデフォルト言語は、クローラがドキュメント言語をクロール時に判断できなかった場合にのみ使用されます。言語設定は「ユーザー」タブで行います。

クローラまたはデータ・ソースに対してデフォルト言語を選択できます。索引付けと問合せ用のデフォルト言語として、次の言語がサポートされています。

  • ポーランド語

  • 中国語

  • ハンガリー語

  • ノルウェー語

  • ルーマニア語

  • フィンランド語

  • 日本語

  • スペイン語

  • スロバキア語

  • 英語

  • トルコ語

  • デンマーク語

  • スウェーデン語

  • ロシア語

  • ドイツ語

  • 韓国語

  • オランダ語

  • イタリア語

  • ギリシャ語

  • ポルトガル語

  • チェコ語

  • ヘブライ語

  • フランス語

  • アラビア語

クロールの深さ

Webドキュメントには、他のWebドキュメントへのリンクが含まれている場合があり、他のWebドキュメントには、さらに多くのリンクが含まれている場合があります。この設定によって、クローラがたどるネストされたリンクの最大数を指定できます。


関連項目:

クロールの深さの重要性については、「Webクロール・プロセスのチューニング」を参照してください。

クローラ・タイムアウトしきい値

クローラのタイムアウトしきい値を秒単位で指定します。クローラ・タイムアウトしきい値は、クローラがWebページにアクセスできないときに、強制的にタイムアウトするために使用されます。

デフォルト・キャラクタ・セット

デフォルト・キャラクタ・セットを指定します。HTMLドキュメントにキャラクタ・セットが指定されていない場合、クローラはこの設定を使用します。

キャッシュ・ディレクトリ

キャッシュ・ディレクトリの絶対パスを指定してください。クロール時に、ドキュメントはキャッシュ・ディレクトリに格納されます。事前に設定されたサイズに達するたびに、クロールが停止し、索引付けが始まります。

機密情報をクロールしている場合は、キャッシュ・ディレクトリに適切なファイル・システムの読取り権限を設定してください。

索引付けが完了した後に、キャッシュを消去するかどうかを選択できます。

クローラのロギング

次の項目を指定します。

  • 詳細のレベル: すべて、またはサマリーのみ

  • クローラ・ログ・ファイル・ディレクトリ

  • クローラ・ログ・ファイル言語

ログ・ファイル・ディレクトリには、クローラ・ログ・ファイルが格納されます。ログ・ファイルには、特定のスケジュールに対応したクローラのアクティビティ、警告およびエラー・メッセージがすべて記録されます。ログ・ファイルには、起動時、実行時およびシャットダウン時に記録されたメッセージが含まれます。多数のドキュメントをクロールする場合は、すべてを記録するとログ・ファイルのサイズが非常に大きくなります。ただし、詳細なアクティビティを各スケジュールのログ・ファイルに出力するようにクローラを構成することが有効な場合があります。クローラ・ログ・ファイル言語とは、クローラがログ・ファイルの生成に使用する言語です。

クローラは、複数のバージョンのログ・ファイルを保持します。ログ・ファイル名の形式は、次のとおりです。

iinstance_iddsdata_source_id.MMDDhhmm.log

ここで、MMは月、DDは日付、hhは起動時間(24時間形式)、mmは分です。たとえば、インスタンス3のデータ・ソース23のスケジュールが7月8日午後10時に起動される場合、ログ・ファイル名はi3ds23.07082200.logになります。起動された一連のスケジュールのログ・ファイルには、それぞれ一意の名前が付けられます。データ・ソースの合計ログ・ファイル数がシステムで指定された制限に達すると、最も古いログ・ファイルが削除されます。ログ・ファイルの数はスケジューラのプロパティで、そのスケジューラに割り当てられたすべてのデータ・ソースに適用されます。


注意:

非Windowsシステム上でクローラ・ログ・フィアル・ディレクトリまたはキャッシュ・ディレクトリを変更する場合、ディレクトリ権限が700に設定されていることを確認します。Oracleソフトウェアをインストールした人のみが、このディレクトリへのアクセスを許可されます。

データベース接続文字列

データベース接続文字列は、データベースに接続する場合に、リモート・クローラで使用される標準JDBC接続文字列です。接続文字列は、[host]:[port]:[sid]の形式またはTNSキーワード値の構文の形式で指定できます。次に例を示します。

"(DESCRIPTION=(ADDRESS=(PROTOCOL=tcp)(HOST=...)(PORT=1521)...))"

関連項目:

『Oracle Database JDBC開発者ガイドおよびリファレンス』

JDBC接続文字列を別の形式(LDAP形式など)に更新できます。ただし、JDBC接続文字列が別のデータベースを指すように変更することはできません。JDBC接続文字列は、中間層が指すデータベースに設定する必要があります。つまり、中間層とJDBCは同じデータベースを指す必要があります。

Real Application Clusters環境では、TNSキーワード - 値の構文を使用する必要があります。この構文により、システムのすべてのノードに接続できます。次に例を示します。

 "(DESCRIPTION=(LOAD_BALANCE=yes)(ADDRESS=(PROTOCOL=TCP)(HOST=cls02a)(PORT=3001))
(ADDRESS=(PROTOCOL=TCP)(HOST=cls02b)(PORT=3001)))(CONNECT_DATA=(SERVICE_NAME=sales.us.acme.com)))"

リモート・クローラ・プロファイル

このページを使用して、リモート・クローラ・プロファイルを表示および編集します。

リモート・クローラ・プロファイルには、Oracle Ultra Searchデータベース以外のリモート・コンピュータでOracle Ultra Searchクローラを実行するために必要なすべてのパラメータが含まれます。リモート・クローラを登録するには、PL/SQL API wk_crw.register_remote_crawlerを使用する必要があります。リモート・クロールは、RMIベースまたはJDBCベースのいずれかを選択できます。

リモート・クローラを構成するには、「編集」をクリックします。リモート・クローラ用に変更できる構成パラメータの一覧を次に示します。

  • キャッシュ・ファイル・アクセス・モード。リモート・クローラがキャッシュ・ファイルを処理する方法には、次の2つのオプションがあります。

    • JDBC接続経由。

      この場合、リモート・クローラはクローラのJDBC接続を使用してキャッシュ・ファイルをサーバー・キャッシュ・ディレクトリに送信します。

    • マウントされているファイル・システム経由。

      このオプションを選択すると、キャッシュ・ファイルはリモート・クローラ・キャッシュ・ディレクトリに保存されます。リモート・クローラ・キャッシュ・ディレクトリは、サーバー側のクローラ・キャッシュ・ディレクトリ(「クローラ」→「設定」タブで指定)にマウントする必要があります。マウントしないと、ドキュメントの索引付けは実行されません。


    関連項目:

    JDBC接続でのクロールの詳細は、「リモート・クロールの使用方法」を参照してください。

  • キャッシュ・ディレクトリの位置(絶対パス)。

  • クローラ・ログ・ファイル・ディレクトリ。

  • メール・アーカイブ・パス。

  • クローラ・スレッド数。

  • プロセッサ数。

  • 初期Javaヒープ・サイズ(MB単位)。

  • 最大Javaヒープ・サイズ(MB単位)。

  • Java CLASSPATH。

クローラ統計

このページを使用して、次のクローラ統計を参照します。

クローラ・アクティビティのサマリー

クローラ・アクティビティに関する一般的なサマリーが提供されます。

  • クローラ統計の集計

  • 索引付けされたドキュメントの総数

  • データ・ソース・タイプによるクローラ統計

詳細なクローラ統計

次の統計が含まれます。

  • クロールと索引付けが行われたホストのリスト

  • 深さごとのドキュメントの分布

  • ドキュメント・タイプごとのドキュメントの分布

  • データ・ソース・タイプごとのドキュメントの分布

クローラの進行状況

過去の週についてクローラの進行状況が表示されます。現在の時刻までの1週間に索引付けされたドキュメント総数が表示されます。時間列は現在の時刻に最も近い時間に丸められます。

問題のあるURL

クロール・プロセス中に発生したエラーがリストされます。エラーが発生したURLの数も表示されます。

「Webアクセス」タブ

ファイアウォールの外にあるWebページにクローラがアクセスするには、「プロキシ」ページでプロキシを登録する必要があります。プロキシ認証が必要な場合は、「認証」ページでプロキシ認証情報を入力する必要があります。

プロキシ

組織のファイアウォール外にあるWebページが検索領域に含まれている場合は、プロキシ・サーバーを指定します。

プロキシを設定するには、プロキシ・サーバー名とポートを入力します。たとえば、myproxy.mydomainおよび8080を入力します。内部Webサイトはプロキシ・サーバーを経由しないので、プロキシ・サーバーが設定されている場合は、プロキシ・ドメイン例外を指定します。例外フィールドに、プロキシを経由させないホストのホスト名接尾辞を入力します。ホスト名の接尾辞には、httpは含めません。たとえば、us.oracle.comoracle.comuk.oracle.comoraclecorp.comを指定します。プロキシを経由しないかどうかのチェックでは、ホスト名の接尾辞のマッチングが厳格に行われます。IPアドレスは、クロールされたURLのホスト名がIPでも指定されている場合のみ使用されます。つまり、一貫している必要があります。

プロキシ認証が必要な場合は、「認証」ページでプロキシ・ログイン・ユーザー名とパスワードを指定します。

認証

すべてのデータ・ソースに適用する認証情報を入力します。


注意:

データ・ソース固有の認証は、このグローバル認証よりも優先されます。

HTTP認証

Oracle Ultra Searchでは、BasicおよびDigest認証の両方をサポートしています。

HTTP認証が必要なホストおよびレルムのユーザー名およびパスワードを指定します。たとえば、ホスト、レルム、ユーザー名およびパスワードとして、myproxy.mydomain、LDAP、mynameおよびmypasswordと入力します。

レルムは、Webサイトの保護領域に関連付けられた名前です。そのような保護されたページにログオンするために指定する文字列です。

プロキシ認証の場合は、プロキシ・サーバーのユーザー名、パスワードおよびレルムを入力します。

HTMLフォーム認証

ユーザーから情報を収集するために、World Wide WebではHTMLフォームを使用します。主な使用例の1つに、認証情報の収集があります。HTMLフォーム認証に、HTMLページ上でユーザー名およびパスワードを入力するテキスト・ボックスを使用します。

HTMLフォームの複雑さは様々です。単純にすることも、多数のJavaScriptを非常に複雑に組み込むこともできます。次の例は、2つのテキスト・フィールドを持つ単純なHTMLフォームを示しています。

<FORM action="http://somesite.com/prog/adduser" method="post" name="MyForm">
  <LABEL for"i1>Username: </LABEL>
  <INPUT name="username" type="text" id="i1"><BR>
  <LABEL for="i2>Password: </LABEL>
  <INPUT name="passwd" type="passwd" id="i2"><BR>
</FORM>

ブラウザでは、これは図8-1のように表示されます。

図8-1 HTMLフォーム

図8-1の説明が続きます
「図8-1 HTMLフォーム」の説明

例の構成要素の意味は、次のとおりです。

name = フォーム名

method = HTTP POSTまたはGETをフォーム・データ・サブミッションに使用するかどうか

action = データが送信されるURL(通常はサーブレット)

INPUT要素 = フォーム制御と呼ばれます。この例には、テキスト・ボックス・タイプのコントロールと、パスワード・タイプのコントロールがあります。パスワード・タイプは、テキスト・ボックスと同じですが、入力したテキストが表示されません。多数の様々な種類のコントロールがありますが、フォームが送信されると、コントロールは単純な名前と値のペアに変換されてアクションURLに送信されます。名前はINPUT要素の名前ですが、値はユーザーがテキスト・ボックス、ドロップダウンなどで入力した値です。


関連項目:

W3C(www.w3c.org)で入手可能なHTMLフォーム・ドキュメント

Oracle Ultra SearchでのHTMLフォーム

Oracle Ultra Searchでは、HTMLフォームを登録できます。クローラは、クロール中に登録済のフォームを検出すると、フォームの登録時に送信したデータを使用して自動的に書き込みます。

フォームの登録

Oracle Ultra Search管理ツールを使用して、HTMLフォームを登録できます。Oracle Ultra Searchのインスタンス・レベルのフォーム登録エントリ、または特定のデータ・ソースのみが参照できるデータ・ソース・レベルのエントリを作成できます。

ウィザードベースのHTMLフォームの登録

フォームの登録には、HTMLフォーム登録ウィザードを使用することをお薦めします。ウィザードが送信されたデータの取込みを試行している間、通常どおりフォームを入力できます。フォームでページを指定すると、ウィザードはそれをフェッチして表示します。ユーザーは、Webブラウザから直接アクセスしているときと同様に入力してフォームを送信します。ウィザードは送信済のフォームへのWebサイトのレスポンスを表示し、ユーザーはフォームの送信が成功したかどうかを確認します。

このプロセス全体は、すぐに完了し、単純です。ただし、HTMLフォーム登録ウィザードはJavaScriptを使用するフォームを扱えません。JavaScriptで実行されている内容によっては処理される場合もありますが、常に処理されるとはかぎりません。かわりに、手動でフォームを登録することができます。

手動によるHTMLフォームの登録

手動で登録するには、登録するフォームの構造を理解している必要があります。フォームの参照や、Webブラウザからページ・ソースの表示を要求することでフォームを表示できます。

ウィザードベースの登録と同様に、まずHTMLフォームを含むページのURLを指定します。さらに、次の情報を指定します。

  • 名前 = フォーム名

  • アクションURL = フォームが送信されるURL(フォーム構想に関する前の項を参照)

  • 成功URL = フォームの送信に成功したらリダイレクトされるURL

  • コントロール = すべてのフォーム・コントロールおよびその値

JavaScriptを使用する場合は、JavaScriptが値を操作したり、動的に新しいコントロールを追加したりするために、これらの値の一部が明白でないことがあります。このため、JavaScriptが担う役割を理解する必要があります。


注意:

Oracle Ultra Searchクローラは、フォームのURLおよびフォーム名に基づいて使用するフォームを選択します。URLパラメータはマッチング時に含まれないので、フォームの登録中に切り捨てられます。

「属性」タブ

索引付けされたドキュメントに、作成者や日付情報などのメタデータが含まれる場合、問合せユーザーはこれらの情報に基づいて検索を絞り込むことができます。たとえば、作成者属性に特定の値を持つすべてのドキュメントを検索できます。

ドキュメント属性の値リスト(LOV)は、検索の問合せを指定する際に役立ちます。属性値には表示名を指定できます。たとえば、国属性には属性値として国コードを使用しますが、ユーザーには国名が表示されます。属性の表示名には複数の翻訳がある場合があります。

検索属性を定義するには、「検索属性」サブタブを使用します。Oracle Ultra Searchには、デフォルト検索属性(Title、Author、Description、Subject、Mimetype、Language、HostおよびLastModifedDate)があります。これらの属性を検索アプリケーションに組み込むことにより、さらに詳細な検索と検索結果の表示が可能になります。独自の属性を定義することもできます。

検索属性を定義した後は、データ・ソースに対するドキュメント属性とグローバル検索属性との間でマッピングを行う必要があります。この作業を行うには、「マッピング」サブタブを使用します。


注意:

Oracle Ultra Searchでは、検索属性LOVや表示名などのメタデータをOracle Ultra Searchデータベースにロードするためのコマンドライン・ツールが提供されます。データが大量にある場合は、このツールによってHTMLベースの管理ツールより速くロードできます。詳細は、付録A「メタデータのOracle Ultra Searchへのロード」を参照してください。

検索属性

検索属性は、問合せユーザーに公開されています。Oracle Ultra Searchでは、作成者や説明など、システム定義の属性が提供されます。Oracle Ultra Searchは検索属性のグローバルなリストを維持します。検索属性は、追加、編集または削除できます。「LOVの管理」をクリックして、検索属性の値リストを変更することもできます。属性LOVには、すべてのデータ・ソースを対象とするグローバル属性LOVと、データ・ソース固有の属性LOVの2つのカテゴリがあります。

独自の属性を定義するには、テキスト・ボックスに属性名を入力して、文字列、日付または数値を選択し、「追加」をクリックします。

検索属性のLOVエントリと表示名は、追加または削除できます。表示名はオプションです。表示名が指定されていない場合は、問合せ画面でLOVエントリが使用されます。


注意:

LOVは文字列タイプとしてのみ表示されます。LOVが日付書式の場合は、「DD-MM-YYYY」書式を使用して入力する必要があります。

ポリシー値を更新するには、該当する属性の「LOVの管理」をクリックします。

データ・ソース指定のLOVは次の3つのうちいずれかの方法で更新できます。

  1. LOVを手動で更新します。

  2. クローラ・エージェントは、クロール・プロセス中にLOVを自動的に更新できます。

  3. 入力ドキュメントの属性値を調べ、新規LOVエントリを自動的に追加できます。


注意:

ポリシーのアップデートがクローラ・エージェントによって制御されている場合、LOVおよびすべての変換された値は次のクロールで削除されます。

マッピング

すべてのデータ・ソースのマッピング情報について説明します。ユーザー定義のデータ・ソースでは、マッピングはエージェント・レベルで実行され、ドキュメント属性はまず同名の検索属性に自動的にマップされます。ドキュメント属性と検索属性は1対1でマップされます。各ユーザー定義データ・ソースについて、ドキュメント属性のマップ先のグローバル検索属性を編集できます。

Web、ファイルまたは表データ・ソースのマッピングは、データ・ソースの作成時に手動で作成します。ユーザー定義データ・ソースのマッピングは、後続のクロールで自動的に作成されます。

このマッピングを変更するには、「マッピングの編集」をクリックしてください。

既存マッピングの編集は、このデータ・ソースのすべてのドキュメントを再クロールする必要があるために、コストがかかります。必要なとき以外は、既存マッピングの編集をしないでください。


注意:

電子メール・ソースには、ユーザーが管理するマッピングはありません。電子メールには、事前に定義されたマッピングが2つあります。電子メールの「From(差出人)」は、Oracle Ultra Searchの作成者属性にマップされています。同様に、電子メールの「Subject(件名)」は、Oracle Ultra Searchの件名属性にマップされています。電子メール・メッセージの摘要は、説明属性にマップされています。

「ソース」タブ

ドキュメントのコレクションをソースと呼びます。データ・ソースは、Webサイトや電子メール受信ボックスなど、位置に関するプロパティを持つ特性があります。Oracle Ultra Searchクローラは、1つ以上のデータ・ソースからデータを取得します。

次のタイプのソースがあります。


関連項目:

  • 1つ以上のデータ・ソースを同期スケジュールに割り当てるには、「「スケジュール」タブ」を参照してください。

  • データ・ソースをデータ・グループに割り当て、制限的な問合せを可能にするには、「問合せ」タブ」を参照してください。


データ・ソースは、必要な数だけ作成できます。ここでは、データ・ソースの作成方法と編集方法について説明します。

Webソース

Webソースは、特定のWebサイトのコンテンツを表示します。Webソースは、特定のWebサイトのクロールを容易にメンテナンスするために使用します。

Webソースの作成

新しいWebソースを作成する手順は、次のとおりです。

  1. Webソースの名前および開始アドレスを指定します。これは、クローラがクロールを開始するURLです。開始アドレスには、HTTPまたはHTTPSを指定できます。

  2. URL境界ルールを設定して、クロール領域を絞り込みます。固有の名前で始まるか固有の名前で終わる、または固有の名前と同じホストあるいはドメインを包含または除外できます。

    たとえば、包含ドメインがoracle.comで終わる場合、Oracle Ultra Searchクローラが全世界のオラクル社に属するホストのみをクロールするように制限します。oracle.comで終わるものはすべてクロールされますが、http://www.oracle.com.twはクロールされません。新しいシードhttp://www.yahoo.comを使用して包含ドメインをyahoo.comに変更すると、すべてのoracle.com URLがクローラによって削除されます。

    除外ドメインがuk.oracle.comの場合、クローラはイギリスにあるOracleホストをクロールしません。特定のポートを使用して、Webサイトを包含または除外することもできます(デフォルトでは、すべてのポートがクロールされます)。特定のホストに対し、ポート包含ルールまたはポート除外ルールを指定できますが、両方は使用できません。除外ルールは常に包含ルールをオーバーライドします。

  3. Oracle Ultra Searchクローラがこのソース用に処理するドキュメントのタイプを指定します。HTMLとプレーン・テキストは、クローラが常に処理するデフォルトのドキュメント・タイプです。

  4. 認証設定を指定します。このステップはオプションです。「HTTP認証」で、認証が必要なホストおよびレルムのユーザー名およびパスワードを指定します。レルムは、Webサイトの保護領域に関連付けられた名前です。「HTMLフォーム」で、Webクロール中にOracle Ultra Searchクローラによって自動的に入力されるHTMLフォームを登録できます。HTMLフォームをサポートするには、HTTP Cookie機能を有効にする必要があります。Cookieは、HTTPリクエスト間でコンテキストを記憶します。たとえば、ユーザーがすでにログオンしていて、再度ログオンする必要がないかどうかを確認する場合などに、サーバーはCookieを送信できます。Cookieのサポートは、デフォルトで有効になっています。データ・ソースを保護する認証フォームを登録するには、「HTMLフォームの登録」をクリックします。注意: クロールするフォームURLについて、URLがrobots.txtファイルで除外されていないことを確認してください。除外されている場合、このデータ・ソースのロボットの除外を無効にする必要があります。(デフォルトでは、Oracle Ultra Searchはロボットの除外を有効にします。)

  5. データ・ソースに対して「ACLを使用しない」または「Ultra Search ACL」を選択します。ユーザーが検索を実行すると、ACL(アクセス制御リスト)により、ユーザーがアクセスできるドキュメントが制御されます。デフォルトは「ACLを使用しない」で、すべてのドキュメントが検索可能および表示可能とみなされます。データ・ソースのACLに、2つ以上のグループおよびユーザーを追加できます。インスタンスでセキュリティが有効になっている場合のみ、選択可能です。

  6. Webソースのメタ・タグのマッピングを定義、編集または削除します。メタ・タグは、HTMLドキュメントのヘッダーに表示される説明タグです。1つのメタ・タグは、1つの検索属性にのみマップできます。

  7. 各Webソースに関するデフォルトのクローラ設定を上書きします。このステップはオプションです。オーバーライドできるパラメータは、クロールの深さ、クローラ・スレッド数、言語、クローラ・タイムアウトしきい値、キャラクタ・セット、最大Cookieサイズ、最大Cookie数および各ホストの最大Cookie数です。ロボット除外、言語検出、URLリライタ、動的Webページの索引付け、HTTP Cookie、およびCookieログ・ファイルの内容を表示するかどうかを有効または無効にすることもできます(「Webソースの編集」を使用して、これらを編集することもできます)。

    ロボットの除外によって、ロボットで参照できるサイトを制御できます。ロボットの除外が有効(デフォルト)な場合、Webクローラは、Webサーバーのrobots.txtファイルに指定されているアクセス・ポリシーに基づいてページ間を横断します。たとえば、ロボットはhttp://www.foobar.com/を参照する場合、http://www.foobar.com/robots.txtをチェックします。このファイルが見つかった場合、クローラはその内容を分析して、ドキュメントを取り出せるかどうかを確認します。Webサイトを所有している場合は、ロボットの除外を無効にすることができます。ただし、他のWebサイトをクロールするときは、ロボットの除外を有効にしてrobots.txtに従う必要があります。

    URLリライタは、Oracle Ultra Search UrlRewriterインタフェースを実装するためにユーザーが提供するJavaモジュールです。クローラは、URLリライタを使用して、抽出したURLリンクがURLキューに挿入される前にフィルタ処理またはリライトを実行します。URLのフィルタ処理によって不要なリンクが削除され、URLのリライトによってURLリンクが変換されます。この変換は、アクセスURLを使用する場合に必要です。

    URLリライタは、リンクについて考えられる次の結果を提供します。

    • リンクの変更はありません。クローラはリンクをそのまま挿入します。

    • リンクを廃棄します。挿入はありません。

    • 新規の表示URLが戻されます。挿入のためにURLリンクが置換されます。

    • 表示URLおよびアクセスURLが戻されます。表示URLは、URLリンクと同一でない可能性があります。

    生成された新しいURLリンクは、既存のホスト、パスおよびMIMEタイプすべての包含ルールと除外ルールの影響を受けます。

    実装したリライタ・クラスをjarファイルに格納し、クラス名とjarファイル名をここで指定する必要があります。

    「動的ページの索引付け」を「はい」に設定すると、動的URLがクロールおよび索引付けされます。このオプションを使用してすでにクロールされたデータ・ソースについて、「動的ページの索引付け」を「いいえ」に設定し、データ・ソースを再クロールすると、索引から動的URLがすべて削除されます。


    注意:

    クローラにはJavaScriptで記述された動的Webページのクロールおよび索引付けを実行できないという制限があります。

    動的ページによっては、同じページに対する複数の検索ヒットとして表示されるため、すべてを索引付けする必要がない場合もあります。他の動的ページはそれぞれ異なるため、索引付けする必要があります。この2種類の動的ページを区別してください。一般的に、メニューの拡張時にメニューの内容に影響を与えることなく変更のみを行う動的ページは、索引付けする必要はありません。次の3つのURLを考慮してください。

    http://itweb.oraclecorp.com/aboutit/network/npe/standards/naming_convention.html
    
    http://itweb.oraclecorp.com/aboutit/network/npe/standards/naming_convention.html?nsdnv=14z1
    
    http://itweb.oraclecorp.com/aboutit/network/npe/standards/naming_convention.html?nsdnv=14
    
    
    
    

    URL内の疑問符(?)は、残りの文字列が入力パラメータであることを示します。重複するヒットは基本的に、異なる側にメニュー拡張がある同一ページです。問合せにヒットは1つのみというのが理想的です。

    http://itweb.oraclecorp.com/aboutit/network/npe/standards/naming_convention.html
    

    動的ページ索引の制御は、データ・ソース全体に適用されます。したがって、Webサイトに2種類の動的ページがある場合は、その動的ページの索引付けを制御するために、2つのデータ・ソースとして個別に定義する必要があります。


関連項目:


表ソース

表ソースは、データベース表またはビューのコンテンツを表します。データベース表またはビューは、Oracle Ultra Searchデータベースのインスタンスまたはリモート・データベースに常駐させることができます。Oracle Ultra Searchはデータベース・リンクを使用して、リモート・データベースにアクセスします。

表ソースの作成

表ソースを作成するには、「表ソース作成」をクリックし、次の手順を実行します。

  1. 表ソース名を指定し、データベース・リンク、スキーマおよび表の名前を指定します。(データベース・リンクは、該当のOracle Ultra Searchインスタンスに対してSQLのCREATE DATABASE LINKを手動で実行して構成します。データベース・リンクを作成すると、ドロップダウン・リストに表示されます。)「表の割当て」をクリックします。

  2. デフォルト言語や主キー列など、表ソースに関する設定を指定します。最終的なコンテンツが渡される列、およびその列に格納されるデータのタイプ(HTML、プレーン・テキストまたはバイナリ)も指定できます。デフォルト言語の詳細は、「「クローラ」タブ」を参照してください。

  3. 表ソースに関する情報を検証します。

  4. 表データ・ソースのクロールを最適化するために、Oracle Ultra Searchのロギング機能を使用するかどうかを決定します。クロールを有効にすると、新たに更新されたドキュメントのみがクロール・プロセスで再検査されます。ロギング機能は、Oracle表およびOracle以外の表に対して使用可能または使用禁止にできます。ロギング機能を使用可能にする場合は、ログ表とログ・トリガーを作成するように求められます。Oracle表には、Oracle SQL文が提供されています。Oracle以外の表を使用する場合は、ログ表とログ・トリガーを手動で作成する必要があります。作成例に従って、ログ表とログ・トリガーを作成します。表を作成した後、「ログ表名」に表名を入力します。

  5. 列を検索属性にマップします。各列は、1つの検索属性のみにマップできます。これによって、検索エンジンは表ソースからデータを継続して検索できます。

  6. 表ソースに対して表示URLのテンプレートまたは列を指定します。このステップはオプションです。Oracle Ultra Searchは、表データ・ソース用にデフォルトのテキスト・ビューアを使用します。表示URLを指定すると、Oracle Ultra Searchは定義済のWeb URLを使用して、取得した表データを表示します。表示URL列が使用可能な場合、Oracle Ultra Searchはその列を使用してURLを取得し、表データ・ソースのコンテンツを表示します。表示URLのテンプレートは、http://host:port/path?parameter_name=$(key1)という形式で指定してください。ここでkey1は該当する表の主キー列です。たとえば、URLのhttp://bug:7777/pls/bug?rptno=1234567を使用して、エラー番号1234567(エラー番号は表の主キー)を問い合せるとします。表ソースの表示URLテンプレートをhttp://bug:7777/pls/bug?rptno=$(key1)に設定できます。

    「行のキーへのマッピング」セクションでは、マッピング情報を提供します。Oracle Ultra Searchでは、STRING型、NUMBER型またはDATE型の表キーをサポートしています。key1がNUMBER型またはDATE型の場合は、Webサイトで使用する書式モデルを指定する必要があります。これによって、Oracleは文字列の解析方法を識別できます。たとえば、文字列「11-Nov-1999」の日付書式モデルは「DD-Mon-YYYY」です。他の表の列をOracle Ultra Search属性にマップすることもできます。テキスト列はマップしないでください。

  7. データ・ソースのACL(アクセス制御リスト)ポリシーを指定します。ユーザーが検索を実行すると、ACLにより、ユーザーがアクセスできるドキュメントが制御されます。デフォルトは「ACLを使用しない」で、すべてのドキュメントがパブリックおよび表示可能とみなされます。Oracle Ultra Search ACLを使用するように指定することもできます。データ・ソースのACLに、2つ以上のグループおよびユーザーを追加できます。インスタンスでセキュリティが有効になっている場合のみ、選択可能です。


関連項目:

書式モデルの詳細は、『Oracle Database SQLリファレンス』を参照してください。

表ソースの編集

表ソースの名前を変更するには、「表ソース」メイン・ページで「編集」をクリックします。表の列と検索属性とのマッピングの変更、追加または削除、表示URLのテンプレートまたは列の変更、および表ソースの設定値の表示を行います。

2つ以上の表で構成された表ソース

表ソースに2つ以上の表がある場合は、関連する表を結合するビューを作成する必要があります。Oracle Ultra Searchは、このビューを表ソースとして使用します。たとえば、マスター/ディテール関係にある2つの表は、マスター表のSELECT文およびディテール表の行を連結するユーザー実装のPL/SQLファンクションを使用して連結できます。

データベース・リンクの制限事項

次の制限事項は、クローラがデータベース・リンクを介してアクセスするリモート・データベース上の実表やビューに適用されます。

  • 実表やビューにBFILERAW型のテキスト列を含めることはできません。

  • 実表またはビューのテキスト列がBLOB型またはCLOB型の場合は、Oracle Ultra Searchがエラーを戻します。リモート表はクロールされますが、列を検索属性にマップすることはできません。

電子メール・ソース

電子メール・ソースは、特定の電子メール・アドレスに送信された電子メールから内容を導出します。Oracle Ultra Searchクローラが電子メール・ソースを検索する場合、クローラは電子メールのヘッダー・フィールドのTo:またはCc:に特定の電子メール・アドレスがあるすべての電子メールを収集します。

最も一般的な電子メール・ソースのアプリケーションでは、電子メール・ソースは、メーリング・リストに送信されたすべての電子メールを示します。この場合は、複数の電子メール・ソースが定義され、各電子メール・ソースは1つの電子メール・リストに対応します。

電子メール・ソースをクロールするには、IMAPアカウントが必要です。現在のOracle Ultra Searchクローラでクロールできるのは、1つのIMAPアカウントのみです。このため、クロール対象のすべての電子メールはIMAPアカウントの受信ボックスに存在する必要があります。たとえば、メーリング・リストの場合、IMAPアカウントは、クロールするすべてのメーリング・リストにサブスクライブされている必要があります。メーリング・リストに新しく投稿されたすべてのメールは、IMAPの電子メール・アカウントに送信されてからクロールされます。Oracle Ultra Searchクローラは、IMAP4に準拠しています。

電子メール・メッセージを取得したOracle Ultra Searchクローラは、IMAPサーバーからそのメッセージを削除します。次に、クローラは電子メール・メッセージの内容をHTMLに変換し、そのHTMLを索引付け用のキャッシュ・ディレクトリに一時的に格納します。さらに、取得したすべてのメッセージをアーカイブ・ディレクトリというディレクトリに格納します。このディレクトリに格納された電子メール・ファイルは、問合せ結果として、検索したエンド・ユーザーに表示されます。

電子メール・ソースをクロールするには、IMAPサーバーの電子メール・アカウントのユーザー名とパスワードを指定する必要があります。また、IMAPサーバーのホスト名およびアーカイブ・ディレクトリも指定する必要があります。

電子メール・ソースの作成

電子メール・ソースを作成するには、電子メール・アドレスおよび説明を入力する必要があります。オプションで、電子メールの別名およびACLポリシーを指定できます。この説明は検索を実行したすべてのエンド・ユーザーによって参照されるため、簡潔でわかりやすい名前を指定する必要があります。電子メール・ソースを作成(登録)する場合、使用する名前はメーリング・リストの電子メールです。電子メールが登録済のメーリング・リストの1つに送信されない場合、その電子メールはクロールされません。

電子メール・ソースの電子メール・アドレス別名を指定できます。電子メール・ソースに別名を指定すると、メインの電子メール・アドレスに送信されたすべての電子メールはアドレスの別名にも送信され、クローラによって収集されます。別名は、2つ以上の電子メール・アドレスが論理的に同じ場合に便利です。たとえば、配布リストを表す電子メール・ソースlist@company.comは、list@my.company.comという代替アドレスを持つことができます。別名リストにlist@my.company.comが追加されると、そのアドレスに送信された電子メールは、list@company.comに送信されたかのように処理されます。

データ・ソースのACL(アクセス制御リスト)ポリシーを指定します。ユーザーが検索を実行すると、ACLにより、ユーザーがアクセスできるドキュメントが制御されます。デフォルトは「ACLを使用しない」で、すべてのドキュメントが検索可能および表示可能とみなされます。データ・ソースのACLに、2つ以上のグループおよびユーザーを追加できます。

ファイル・ソース

ファイル・ソースは、ローカル・コンピュータ、FILEプロトコルを使用してアクセスできるドキュメントのセットです。

ファイル・ソースの名前を編集するには、「編集」をクリックします。

ファイル・ソースの作成

新しいファイル・ソースを作成する手順は、次のとおりです。

  1. ファイル・ソースの名前およびデフォルトの言語を指定します。

  2. クロールするファイルまたはディレクトリを指定します。URLが1つのファイルを表す場合、Oracle Ultra Searchクローラではそのファイルのみを検索します。URLが1つのディレクトリを表す場合、クローラではそのディレクトリ内のすべてのファイルとサブディレクトリを再帰的にクロールします。

  3. このファイル・ソースに関連したクロール領域を変更するには、包含パスと除外パスを指定します。このステップはオプションです。包含パスはクロール領域を制限します。除外パスを使用すると、クロール領域をさらに制限できます。どちらのパスも指定されていない場合、クロールはファイル・システムの基本的なアクセス権限に制限されます。パス・ルールはホストに固有ですが、ホストごとに2つ以上のパス・ルールを指定できます。たとえば、同じホスト上にパスfiles://host/docおよび除外パスfiles://host/doc/unwantedを含めることができます。

  4. Oracle Ultra Searchクローラがこのファイル・ソースについて処理するドキュメントのタイプを指定します。HTMLとプレーン・テキストは、クローラが常に処理するデフォルトのドキュメント・タイプです。

  5. Oracle Ultra Searchは、ファイル・データ・ソースをテキスト・フォーマットで表示します。ただし、ファイル・データ・ソースに対して表示URLを指定した場合、Oracle Ultra SearchはそのURLを使用してファイル・データ・ソースを表示します。

    ファイル・データ・ソースに対して表示URLを使用すると、そのURLでは、HTTPやHTTPSなどのネットワーク・プロトコルを使用してファイル・データ・ソースにアクセスします。ファイル・データ・ソースに対する表示URLを生成するには、元のファイルURLの接頭辞と表示URLの接頭辞を指定します。Oracle Ultra Searchは、ファイルURLの接頭辞を表示URLの接頭辞で置き換えます。

    たとえば、ファイルURLがfile:///home/operation/doc/file.docで、表示URLがhttps://webhost/client/doc/file.docの場合は、ファイルURLの接頭辞をfile:///home/operation、表示URLの接頭辞をhttps://webhost/clientに指定できます。

  6. データ・ソースのACL(アクセス制御リスト)ポリシーを指定します。ユーザーが検索を実行すると、ACLにより、ユーザーがアクセスできるドキュメントが制御されます。デフォルトは「ACLを使用しない」で、すべてのドキュメントが検索可能および表示可能とみなされます。Oracle Ultra Search ACLを使用するように指定することもできます。データ・ソースのACLに、2つ以上のグループおよびユーザーを追加できます。インスタンスでセキュリティが有効になっている場合のみ、選択可能です。

Oracleソース

Oracleソースは、作成、編集または削除できます。連携したソースまたはOracle Application Server Portalからクロール可能なソースを選択できます。連携したソースは、独自の索引を保持するリポジトリです。Oracle Ultra Searchは問合せを発行し、リポジトリは問合せ結果を返します。Oracle Ultra Searchは、Oracle Application Server Portalのインストールのクロールと索引付けもサポートしています。これによって、複数のポータルを検索できます。


注意:

Oracle Ultra SearchがOracle Portalのコンテンツをクロールするとき、実際の索引付け可能なコンテンツとともにすべてのメタデータ(属性値)を収集します。次にコンテンツにテキスト索引が付けられます。文字列xxxを検索する場合、属性またはコンテンツにその文字列が存在すると、そのドキュメントが戻されます。

これは、Oracle Portal単独の場合の動作と異なります。Oracle Portalの場合は、文字列xxxを検索するとき、ドキュメントのコンテンツ(Portalではページ/項目)のみが検索されます。属性は別に処理されます。


Oracle Portalソース

Oracle Ultra SearchはパブリックなOracleAS Portalソースのみクロールできます。パブリック・ページの設定方法は、『Oracle Application Server Portal構成ガイド』を参照してください。

Portalソースを作成するには、最初に使用するポータルをOracle Ultra Searchに登録する必要があります。ポータルを登録する手順は、次のとおりです。

  1. 名前およびポータルURLベースを指定します。ポータル名は、「Oracle Portalリスト」ページでこのポータル・エントリを識別するために使用されます。URLベースは、ポータル・ホームページの先頭部分です。これには、ホスト名、ポート番号およびDADが含まれます。一度作成すると、ポータルURLベースは更新できません。「Portalの登録」をクリックします。Oracle Ultra Searchは、Oracle Application Server Portalインスタンスに接続し、このインスタンスに関する情報を取得します。

  2. 索引付けに使用する1つ以上のページ・グループを選択します。ページ・グループごとにポータル・データ・ソースが作成されます。既存のポータル・データ・ソースを削除するには、「削除」をクリックします。

Oracle Ultra Searchクローラがポータル・ソースで処理するドキュメントのタイプを編集できます。HTMLとプレーン・テキストは、クローラが常に処理するデフォルトのドキュメント・タイプです。ドキュメントのタイプを編集するには、ドキュメントが作成された後に、ポータル・ソースの「編集」をクリックします。


関連項目:

Oracle Application Server Portalのマニュアルを参照してください。

連携したソース

連携したソースを作成するには、新しいデータ・ソースの名前およびJNDIを指定します。デフォルトでは、使用可能なリソース・アダプタはありません。

連携したソースを作成するには、Oracle Ultra Searchリソース・アダプタ、またはサーチレットを手動でデプロイする必要があります。サーチレットは、中間層(OC4J内)にデプロイされるJavaモジュールであり、ユーザーにかわり企業情報システム内のデータを検索します。ユーザーの問合せがサーチレットに委譲された場合、サーチレットはユーザーにかわり問合せを実行します。サーチレットはすべて、JCA 1.0に準拠するリソース・アダプタです。


関連項目:

リソース・アダプタおよびJava Connector Architectureの詳細は、JavasoftによるJCA 1.0仕様を参照してください。

Oracle Ultra Searchサーチレットのデプロイおよびバインド

Oracle Ultra Searchサーチレットでは、1つのOracle Ultra Searchインスタンスに対して問合せが可能です。Oracle Ultra Searchサーチレットはultrasearch_searchlet.rarとしてパッケージされ、$ORACLE_HOME/ultrasearch/adapter/ディレクトリに格納されて出荷されます。

Oracle Ultra Searchサーチレットをスタンドアロン・モードのOC4Jにデプロイするには、admin.jarを次のように使用します。

 java -jar admin.jar ormi://<host> <admin> <welcome> -deployconnector -file
ultrasearch_searchlet.rar -name UltraSearchSearchlet

この時点で、ultrasearch_searchlet.rarはOC4Jにデプロイされています。ただし、Oracle Ultra Searchインスタンスに接続するようインスタンス化されていません。次の手順を繰り返すことで、Oracle Ultra Searchサーチレットを複数回インスタンス化し、複数のOracle Ultra Searchインスタンスに接続できます。サーチレットをインスタンス化するには、構成パラメータ値を指定し、サーチレット・インスタンスのバインド先となるJNDIロケーションを指定する必要があります。そのためには、手動でoc4j-ra.xmlを編集する必要があります。通常、このファイルは$J2EE_HOME/application-deployments/default/UltraSearchSearchlet/ディレクトリの下にあります。Oracle Ultra Searchサーチレットには、connectionURLuserNamepasswordおよびinstanceNameの4つの構成プロパティが必要です。たとえば、eis/UltraSearchの下にサーチレットをバインドして、コンピュータdbhostのデフォルト・インスタンスWK_TESTに接続するには、次のエントリを使用できます。

<connector-factory location="eis/UltraSearch" connector-name="Ultra Search Adapter">
 <config-property name="connectionURL" value="jdbc:oracle:thin:@dbhost:1521:sid"/>
 <config-property name=:userName" value="wk_test"/>
 <config-property name="passwors" value="wk_test"/>
 <config-property name="instanceName" value="wk_test"/>
</connector-factory>

oc4j-ra.xmlを編集した後、OC4Jインスタンスを再起動します。再起動時にエラーが表示されない場合は、サーチレットが正常にインスタンス化され、JNDIにバインドされています。

フェデレータ・サーチレットのデプロイおよびバインド

フェデレータ・サーチレットは、他のサーチレットと対話することで、複数のリポジトリに対するシングル・ポイント検索が可能になります。たとえば、フェデレータ・サーチレットは複数のOracle Ultra Searchサーチレットを起動して、複数のOracle Ultra Searchインスタンスに対して同時に問合せ可能です。同様に、フェデレータ・サーチレットは、Oracle Files、Emailなどについてサーチレットを起動できます。フェデレータ・サーチレットは、連携したソース・タブで、Oracle Ultra Search管理ツールにより構成および管理されます。フェデレータ・サーチレットはfederator_searchlet.rarとしてパッケージされ、$ORACLE_HOME/ultrasearch/adapter/ディレクトリに格納されて出荷されます。federator_searchlet.rarのデプロイメント手順は、Oracle Ultra Searchサーチレットのデプロイメントと同様です。フェデレータ・サーチレットをスタンドアロンのOC4Jにデプロイするには、admin.jarを次のように使用します。

java -jar admin.jar ormi://<host> <admin> <welcome> -deployment -file
federator_searchlet.rar -name FederatorSearchlet

サーチレットをインスタンス化するため、フェデレータ・サーチレットでは、oc4j-ra.xmlファイルに、connectionURLuserNamepasswordおよびinstanceNameの4つの構成プロパティが必要です。通常、このファイルは$J2EE_HOME/application-deployments/default/FederatorSearchlet/ディレクトリの下にあります。次に例を示します。

<connector-factory location="eis/Federator" connector-name="Federator Adapter">
 <config-property name="connectionURL" value="jdbc:oracle:thin:@dbhost:1521:sid"/>
 <config-property name="userName" value="wk_test"/>
 <config-property name="password" value="wk_test"/>
 <config-property name=InstanceName" value="wk_test"/>
</connector-factory>

oc4j-ra.xmlを編集した後、OC4Jインスタンスを再起動します。再起動時にエラーが表示されない場合は、サーチレットが正常にインスタンス化され、JNDIにバインドされています。

ユーザー定義ソース

Oracle Ultra Searchでは、提供されているデータ・ソースとタイプ以外に、独自のデータ・ソースとタイプを定義、編集または削除できます。独自のドキュメント・リポジトリをクロールして索引付けするために独自のクローラ・エージェントを実装したり、Lotus NotesやDocumentumなど独自のデータベースやインタフェースを持つ管理システムを実装したりできます。

新規の各データ・ソース・タイプについて、クローラ・エージェントをJavaクラスとして実装する必要があります。エージェントは、独自のドキュメント・ソースからドキュメントURLおよび関連付けられたメタデータを収集し、Oracle Ultra Searchクローラに情報を戻します。Oracle Ultra Searchクローラでは、後でクロールするためにその情報をエンキューします。

新規データ・ソースを定義するには、最初に、そのデータ・ソースを表すデータ・ソース・タイプを定義します。

ユーザー定義データ・ソース・タイプの作成

データ・ソース・タイプを作成、編集または削除するには、「ソース・タイプの管理」をクリックします。新しいタイプを作成するには、「新規タイプの作成」をクリックします。

  1. データ・ソース・タイプ名、説明、およびクローラ・エージェントのJavaクラス・ファイル名またはjarファイル名を指定します。クローラ・エージェントのJava CLASSPATHは、インストール時に事前定義されています。エージェントは、独自のドキュメント・ソースからドキュメントURLのリストおよび関連付けられたメタデータを収集し、Oracle Ultra Searchクローラに情報を戻します。Oracle Ultra Searchクローラでは、後でクロールするためにその情報をエンキューします。エージェントのクラス・ファイルまたはjarファイルは、$ORACLE_HOME/ultrasearch/lib/agent/にあることが必要です。

  2. このデータ・ソース・タイプのパラメータを指定します。パラメータを追加する場合は、パラメータ名と説明を入力する必要があります。パラメータ値を暗号化するかどうかも決定する必要があります。

データ・ソース・タイプに関する情報は、データ・ソース・タイプ名、説明、クローラ・エージェントのJavaクラス・ファイル名やjarファイル名、またはパラメータを変更することによって編集します。

ユーザー定義ソースの作成

ユーザー定義のデータ・ソースを作成するには、タイプを選択して、「実行」をクリックします。

  1. データ・ソースの名前、デフォルト言語およびパラメータ値を指定します。デフォルト言語の詳細は、「「クローラ」タブ」を参照してください。

  2. 認証設定を指定します。このステップはオプションです。「HTTP認証」で、認証が必要なホストおよびレルムのユーザー名およびパスワードを指定します。レルムは、Webサイトの保護領域に関連付けられた名前です。「HTMLフォーム」で、Webクロール中にOracle Ultra Searchクローラによって自動的に入力されるHTMLフォームを登録できます。HTMLフォームをサポートするには、HTTP Cookie機能を有効にする必要があります。Cookieは、HTTPリクエスト間でコンテキストを記憶します。たとえば、ユーザーがすでにログオンしていて、再度ログオンする必要がないかどうかを確認する場合などに、サーバーはCookieを送信できます。Cookieのサポートは、デフォルトで有効になっています。データ・ソースを保護する認証フォームを登録するには、「HTMLフォームの登録」をクリックします。

  3. データ・ソースのACLポリシーを、ACLを使用しない、リポジトリ生成のACL、またはOracle Ultra Search ACLの中から指定します。ユーザーが検索を実行すると、ACLにより、ユーザーがアクセスできるドキュメントが制御されます。デフォルトは「ACLを使用しない」で、すべてのドキュメントが検索可能および表示可能とみなされます。Oracle Ultra Search ACLの場合、データ・ソースのACLに、2つ以上のグループおよびユーザーを追加できます。

  4. マッピングを指定します。このステップはオプションです。ドキュメント属性はクロール時に直接、同名の検索属性に自動的にマップされます。ドキュメント属性を他の検索属性にマップする場合は、ここで検索属性を指定します。クローラは、クローラ・エージェントから戻された属性、あるいはここで指定した属性を使用します。

  5. クロール・パラメータを編集します。

  6. クローラがこのデータ・ソースについて処理するドキュメント・タイプを指定します。デフォルトでは、HTMLおよびプレーン・テキストが常に処理されます。

ユーザー定義データ・ソースは、名前、タイプ、デフォルト言語または開始アドレスを変更することによって編集できます。

「スケジュール」タブ

このタブを使用して、データ同期および索引最適化をスケジュールします。データ同期の目的は、すべてのデータ・ソースについてOracle Ultra Searchの索引を最新に保つことです。索引最適化の目的は、更新された索引を最適化して問合せのパフォーマンスを最大に保つことです。

データ同期

このページの表には、同期スケジュールに関する情報が表示されます。同期スケジュールには1つ以上のデータ・ソースが割り当てられています。同期スケジュールの頻度によって、割り当てられたデータ・ソースの同期時期が指定されます。スケジュールは最初、名前でソートされています。同期スケジュールでは、個々のデータ・ソースをソース名またはソース・タイプでソートして表示できます。

同期スケジュールの作成

新しいスケジュールを作成するには、「新規スケジュールの作成」をクリックし、次の手順を実行します。

  1. スケジュールの名前を入力します。

  2. スケジュール頻度を選択し、索引付け用にスケジュールですべてのURLを自動的に実行するか、あるいは索引付けの前にURLを調査するかを決定します。初期の計画の目的として、索引付けを行わず、クローラでURLの収集のみを行う場合があります。クロールの終了後に、ドキュメントのURLとステータスを調査し、不要なドキュメントを削除してから、索引付けを開始できます。スケジュールをリモート・クローラ・プロファイルに関連付けることもできます。

    「手動による起動」に頻度を指定できます。この場合、「すぐに実行」をクリックしてデータ同期を明示的に実行するまで、SCHEDULEDのステータスにこの間隔が残ります(「同期スケジュールの起動」を参照)。

  3. データ・ソースをスケジュールに割り当てます。あるグループに割り当てたデータ・ソースを別のグループに割り当てることはできません。

スケジュールの更新

索引付けのオプションは、「更新スケジュール」タブで更新します。

同期スケジュールの編集

同期スケジュールを定義すると、「同期スケジュール」リストで次の操作を実行できます。

  • データベース・ホストで実行されているクローラ、または個別のホストで実行されているリモート・クローラのいずれかにスケジュールを割り当てるには、「ホスト名」をクリックします。

  • スケジュールの頻度を変更するには、スケジュール間隔のテキスト部分をクリックします。

  • スケジュールのステータスを変更するには、「ステータス」をクリックします。

  • スケジュールを削除するには、「削除」をクリックします。

  • スケジュール名、データ・ソース割当て、再クロール・ポリシーまたはクロール・モードを編集するには、「編集」をクリックします。クローラでは、ドキュメントを取得するとき、そのドキュメントが変更されているかどうかをチェックします。デフォルトでは、ドキュメントが変更されていない場合、クローラはそのドキュメントを処理しません。特定の状況では、クローラですべてのドキュメントを強制的に再処理できます。「編集」をクリックし、次の手順でスケジュールを編集します。

    • スケジュール名を更新します。このステップはオプションです。スケジュール名を変更するには、スケジュールの名前を指定し、「スケジュール名の更新」をクリックします。

    • データ・ソースをスケジュールに割り当てます。データ・ソースを割り当てるには、1つ以上の使用可能なソースを選択し、「>>」をクリックします。あるグループに割り当てたデータ・ソースを別のグループに割り当てることはできません。データ・ソースの割当てを取り消すには、1つ以上のスケジュールされたソースを選択し、「<<」をクリックします。

    • クローラ再クロール・ポリシーを更新します。再クロール・ポリシーを次のように更新できます。

      • 変更されたドキュメントの処理: これはクロールのメンテナンスです。変更されたドキュメントのみが再クロールされ、索引が付けられます。Webデータ・ソースの場合は、更新されたドキュメントに新しいリンクがあると、それらのリンクが後に続きます。ファイル・データ・ソースの場合は、その親ディレクトリが変更されると新規ファイルが収集されます。

      • 全ドキュメントの処理: クローラはデータ・ソースを再クロールします。たとえば、WebサイトでテキストとHTMLのみをクロールすると仮定します。その後、Microsoft WordとAdobe PDFのドキュメントもクロールする必要性が生じたとします。この場合、ソースのドキュメント・タイプを変更し、スケジュールを編集して「全ドキュメントの処理」を選択し、クローラがこのデータ・ソースに対してPDFとdocのドキュメント・タイプを選択するようにスケジュールを再実行する必要があります。クローラは、各ドキュメントを変更済として処理します。つまり、各ドキュメントは再度フェッチされて処理されます。

      スケジュールを再起動するとき、次のルールにより、再クロールされるURLが決定します。

      • 前のクロールが完了していない場合(クロールを停止した場合、データベースの表領域が一杯の場合など)、クローラはURLキュー内に残っているURLのみをクロールします。すでにクロールされたURLは、再クロールには関係しません。

      • URLキューが空で最後のクロール以降に新しいシードが追加された場合、クローラは新しいシードのみをクロールします。

      • URLキューが空で新しいシードがない場合、クローラはクロールされたすべてのURLを再クロールします。

      したがって、クローラを停止して「動的ページの索引付け」を「いいえ」に設定した場合、まだクロールされていないキュー内のURLにのみ影響します。すでにクロールされた動的ページは、キューが空の場合、3回目の再クロール時に索引から削除されます。


    注意:

    新しくクロールされたURLのみではなく、クロールされたすべてのURLがクローラ設定の対象です。

    • クロール・モードを更新します。クロール・モードを次のように更新できます。

      • 索引付けのためにすべてのURLを実行: このモードではクロールと索引付けが行われます。

      • 索引付けの前にURLを調査: このモードではクロールのみが行われます。初期の計画の目的として、索引付けを行わず、クローラでURLの収集のみを行う場合があります。クロールの終了後に、ドキュメントのURLとステータスを調査し、不要なドキュメントを削除してから、索引付けを開始できます。

      • 索引付けのみ: このモードでは索引付けのみが行われます。

      クローラの動作は、収集されるドキュメントによって異なります。

    クロール・モードと再クロール・ポリシーは、異なる6つの組合せで一体化できます。たとえば、「全ドキュメントの処理」「索引付けのみ」の組合せでは、このデータ・ソースの既存のドキュメントが強制的に再度索引付けされます。一方、「変更されたドキュメントの処理」「索引付けのみ」では、変更されたドキュメントのみが再度索引付けされます。

同期スケジュールの起動

スケジュールの同期の頻度は、別のスケジュールの同期の頻度と同じです。これにより、データ・ソースの同期を管理するときに、最大限の柔軟性を得ることができます。

次のように、同期スケジュールを起動できます。

  • スケジュールの頻度を設定し、事前に決めた起動時間まで待機します。

  • すぐに実行します。「ステータス」をクリックし、「すぐに実行」をクリックします。

  • スケジュールを手動で開始します。


注意:

同期スケジュールの起動には、長時間かかる場合があります。以前にスケジュールを起動したことがある場合は次のスケジュール起動時に、スケジュールでクロールされるデータ・ソースに属している全URLが更新され、キューに挿入されます。そのデータ・ソースに関連付けられているURLの数によっては、エンキュー処理に長時間かかる可能性があります。その間、Oracle Ultra Search管理ツールはスケジュールのステータスを「起動中」と表示します。

URLキューが空ではない場合、または最後のクロール以降に新しいシードが追加された場合は、スケジュールを起動しても、エンキューは実行されません。たとえば、ユーザーが早めにクローラを停止した場合、またはOracle表領域が不十分なためにクローラが終了した場合には、URLキューは空になりません。したがって、次の起動時には、クローラはエンキューを行わずに、URLキューが空になるまで既存のURLキューを処理します。つまり、起動時にキューが空の場合にのみ、エンキューが実行されます。

ステータスとクローラの進行状況との同期

ステータス列のリンクをクリックして、同期スケジュール・ステータスを確認します。このスケジュールに関連付けられているデータ・ソースのクロール進行状況を確認するには、「統計」をクリックします。

スケジュールの索引付けの前にURLを調査する場合は、スケジュールの実行後、スケジュールのステータスが「索引付け要求」になります。

データ収集モードでは、最初にクロールを開始してください。クロールの完了後、「URLを調査」をクリックしてドキュメントURLおよびステータスを調査し、不要なドキュメントを削除して、索引付けを開始します。「索引付けの開始」をクリックすると、スケジュールのステータスが「起動中」から「実行中」や「スケジュール」などに変わります。

次の統計も表示されます。

  • データ・ソース・タイプ

  • データ・ソース名

  • 開始時間

  • 終了時間

  • 経過時間

  • 合計索引作成時間

  • 収集されたドキュメント・データの合計サイズ

  • 平均ドキュメント・サイズ

  • 平均フェッチ・スループット

次の統計も含まれます。

  • フェッチするドキュメント

  • フェッチされたドキュメント: フェッチされたすべてのタイプのドキュメントが含まれます。

  • フェッチに失敗したドキュメント: Oracle HTTPサーバー・タイムアウトまたは別のHTTPサーバー・エラーの可能性があります。

  • 拒否されたドキュメント: ドキュメントがURL境界ルールの範囲外です。

  • 検出されたドキュメント: 検出されたすべてのタイプのドキュメントが含まれます。

  • 索引付けされたドキュメント

  • 索引付けできないドキュメント: ファイル・ディレクトリ、検出ノードであるOracleAS Portalのページ、または索引を指定しないロボット・メタ・タグの可能性があります。

  • 変換に失敗したドキュメント: バイナリ・ファイルのフィルタ処理に失敗しました。

索引最適化

索引最適化

Oracle Ultra Searchクローラは、すべてのデータ・ソースにわたってクロールしたすべてのドキュメントのアクティブな索引を維持し、問合せ結果を高速で取得します。索引の最適化は、これによりスケジュールできます。索引は、その使用率が低い時間に最適化してください。


注意:

クローラのキャッシュ・ディレクトリ・サイズを大きくすると、索引の断片化が少なくなります。

索引最適化スケジュール

索引の最適化頻度を指定できます。選択するオプションに必要なすべてのデータを確実に指定してください。索引をすぐに最適化するか、またはスケジュールを使用可能にできます。

最適化プロセスの長さ

索引最適化処理の最大の長さを指定します。最適化に要する実時間がこの制限を超えることはありませんが、この時間より短くなる場合はあります。長い最適化時間を指定するほど、効率的な最適化が行われます。または、最適化が完了するまで最適化を続行することもできます。

Oracle Ultra Searchインスタンスがセキュアな検索に対応している場合は、索引最適化処理により、未使用のアクセス制御リスト(ACL)のガベージ・コレクションもトリガーされます。

「問合せ」タブ

このセクションでは、データ・グループ、URL発行、検索オプション、問合せ統計など、問合せに関連する設定を指定できます。

データ・グループ

データ・グループは、検索エンジンのユーザーに公開された論理エンティティです。問合せを入力するときに、ユーザーは検索対象となる1つ以上のデータ・グループを選択するように求められます。

データ・グループは1つ以上のデータ・ソースで構成されます。データ・ソースは複数のデータ・グループに割り当てることができます。データ・グループは最初、名前でソートされています。各データ・グループ内にリストされている個々のデータ・ソースは、ソースの名前またはタイプによってソートできます。

新規データ・グループを作成する手順は、次のとおりです。

  1. グループの名前を指定します。

  2. データ・ソースをグループに割り当てます。Webソースまたは表データ・ソースをこのデータ・グループに割り当てるには、1つ以上の使用可能なWebソースまたは表ソースを選択し、「>>」をクリックします。あるグループに割り当てたデータ・ソースを別のグループに割り当てることはできません。Webソースまたは表データ・ソースの割当てを解除するには、1つ以上のスケジュールされたソースを選択し、「<<」をクリックします。

  3. 「終了」をクリックします。

URL発行

URL発行

URL発行によって、問合せユーザーはURLを発行できます。これらのURLはシードURLリストに追加され、Oracle Ultra Searchクローラ検索領域に含められます。ここでは、問合せユーザーによるURLの発行を許可または禁止できます。

URL境界ルール・チェック

URLは特定のWebデータ・ソースに対して発行されます。URL境界ルール・チェックによって、発行済のURLがWebデータ・ソースのURL境界ルールに準拠していることが確認されます。URL境界ルール・チェックは許可または禁止できます。

検索オプション

検索オプションによって、管理者は検索結果をオーバーライドでき、問合せ結果リストにランク付けされているドキュメントの順序を変更できます。これにより、重要なドキュメントを高くスコア付けし、そのようなドキュメントの検索を容易にすることができます。

検索オプションに関するURLの指定方法には、検索による指定、手動によるURLの入力の2種類があります。

検索による指定

URLを追加するには、まずURLを検索して指定してください。検索範囲を限定するためにホスト名を指定することもできます。URLの検索後は、「情報」をクリックし、問合せ文字列とドキュメントのスコアを編集します。

手動によるURLの入力

クロールまたは索引付けされていないドキュメントは、検索対象になりません。ただし、URLを指定して検索オプション情報を入力することは可能です。それには、「作成」をクリックし、次の項目を入力します。

  1. ドキュメントURLを指定します。このURLをデータ・ソースに割り当てる必要があります。このドキュメントには次のクロール時に索引が付けられます。

  2. 1つ以上の問合せ文字列に対し、1から100の範囲でスコアを入力します。ユーザーが正確な問合せ文字列を使用して検索すると、スコアがこのURLに適用されます。

ドキュメントが問合せ条件に対してロードされると、ドキュメントは検索可能になります。また、このドキュメントには次のスケジュール実行時に索引が付けられます。

URLを手動で入力した場合は、Webデータ・ソースにのみURLを割り当てることができます。Webデータ・ソースが定義されていない場合は、このページにエラー・メッセージが表示されます。


注意:

Oracle Ultra Searchでは、メタデータをOracle Ultra Searchデータベースにロードするためのコマンドライン・ツール(ドキュメント検索オプションなど)が提供されます。データが大量にある場合は、このツールによってHTMLベースの管理ツールより速くロードできます。詳細は、付録A「メタデータのOracle Ultra Searchへのロード」を参照してください。

問合せ統計

問合せ統計の使用可能または不可

このセクションでは、問合せ統計の収集を使用可能または使用禁止にできます。問合せ統計をロギングすると、問合せのパフォーマンスが低下します。したがって、通常の処理では問合せ統計の収集を使用禁止にしておくことをお薦めします。


注意:

問合せ統計を使用可能にすると、統計データを格納する表は毎週日曜日の午前1時に切り捨てられます。

統計の参照

問合せ統計が使用可能になっている場合は、次のカテゴリのいずれかをクリックできます。

毎日の問合せ統計のサマリー すべての問合せアクティビティが毎日集計されています。収集された統計は次のとおりです。

  • 平均問合せ時間: すべての問合せにかかった平均時間

  • 問合せ数: その日の問合せ総数

  • ヒット数: 各問合せにより戻された平均結果数

トップ50の問合せ 24時間以内に行われた最も使用された50の問合せが集計されています。

  • 問合せ文字列: 問合せ文字列

  • 平均問合せ時間: 結果が戻るまでの平均時間

  • 問合せ数: 24時間の問合せの総数

  • ヒット数: 各問合せにより戻された平均結果数

  • 頻度: すべての問合せ文字列について、問合せ総数で除算した問合せの数

  • 無効な問合せの割合: すべての問合せ文字列について、問合せ総数で除算した無効な問合せの数

トップ50の無効な問合せ 24時間以内に行われた最も使用された50の問合せが集計されています。表の各行には、特定の問合せ文字列に対する統計の説明があります。

  • 問合せ文字列: 問合せ文字列

  • 問合せ数: 24時間以内に実行された問合せの総数

  • 無効な問合せの割合: この問合せ文字列について、問合せ総数で除算した無効な問合せの数

トップ50の失敗した問合せ 24時間以内に失敗した50の問合せが集計されています。失敗した問合せは、検索エンジンのユーザーが結果を検索しなかった問合せです。

次の列があります。

  • 問合せ文字列: 問合せ文字列

  • 問合せ数: 24時間以内に実行された問合せの総数

  • 頻度: 失敗した問合せの発生率

  • 累積頻度: すべての失敗した問合せの累積発生率

構成

問合せアプリケーションおよび連携したエンジンでは、ヒットの最大数および検索オプションを使用可能にするかどうかなど、いくつかのパラメータを構成できます。

次のフェデレータ・パラメータを構成できます。

  • タイムアウトしきい値: 各リポジトリから検索結果を得るまで待機する最大時間。単位はミリ秒です。

  • 最大結果数: フェデレータは、このパラメータに基づく最大数の結果を取得します。大きな数に設定すると、検索の応答は遅くなります。小さな数に設定すると、検索結果の数は制限されます。

  • パラレル問合せモード: パラレル問合せモードは、問合せをより効率的にしますが、消費メモリーも多くなります。

  • 最小スレッド・プール・サイズ/最大スレッド・プール・サイズ: このパラメータは、チューニングを実行するためにも使用されます。検索アプリケーションを同時に実行するユーザーが増えると、より大きなプール・サイズを使用します。


注意:

「表の表示URL」、「ファイル表示URL」および「電子メール表示URL」は関連URLです。Oracle Portalが動作するには、ここでこれらのURLを、ホスト名、ポートおよびパスを含む完全なURLに変更する必要があります。

「ユーザー」タブ

このタブを使用して、Oracle Ultra Searchの管理ユーザーを管理します。ユーザーを割り当てて、Oracle Ultra Searchインスタンスを管理できます。言語を選択することもできます。

プリファレンス

このセクションでは、Oracle Ultra Search管理者のプリファレンス・オプションを設定できます。

日付書式と時刻書式を指定できます。次の言語がプルダウン・メニューにリストされます。

  • 英語

  • ポルトガル語(ブラジル)

  • フランス語

  • ドイツ語

  • イタリア語

  • 日本語

  • 韓国語

  • 簡体字中国語

  • スペイン語

  • 繁体字中国語

各ページに表示する行数も選択できます。

スーパーユーザー

スーパーユーザー権限を持つユーザーは、インスタンスの作成、削除および権限の付与など、インスタンスに関するすべての管理機能を実行できます。このページにアクセスできるのは、スーパーユーザーのみです。

シングル・サインオン・ユーザーは、Delegated Administrative Service(DAS)の値リストを使用して、他のシングル・サインオン・ユーザーをスーパーユーザーとして追加できます。これらのユーザーは、アクセスが許可される前に、OracleAS Single Sign-Onで認証されます。データベース・ユーザーは、他のデータベース・ユーザーをスーパーユーザーとして追加できます。

他のユーザーにスーパーユーザー権限を付与するには、ユーザーのユーザー名を入力します。他のユーザーにスーパーユーザー権限を付与できるかどうかも指定します。その後、「追加」ボタンをクリックします。

権限

「権限」ページにアクセスできるのは、インスタンスの所有者、このインスタンスの一般管理権限を付与されたユーザーまたはスーパーユーザーのみです。インスタンス所有者にはWKUSERロールを付与する必要があります。

シングル・サインオン・ユーザーは、Delegated Administrative Service(DAS)の値リストを使用して、他のシングル・サインオン・ユーザーに権限を追加できます。これらのユーザーは、アクセスが許可される前に、OracleAS Single Sign-Onで認証されます。データベース・ユーザーは、他のデータベース・ユーザーに権限を追加できます。


注意:

データベース・ユーザーは、シングル・サインオン・ユーザーに権限を付与することはできません。また、シングル・サインオン・ユーザーは、データベース・ユーザーに権限を付与することはできません。DASの値リストには、シングル・サインオン・ユーザーのみが表示されます。

一般管理権限を付与されたユーザーは、このインスタンスの一般的な設定を変更できます。これを行うには、ユーザー名を入力して、そのユーザーが他のユーザーに管理権限を付与できるかどうかを指定します。その後、「追加」ボタンをクリックします。

このインスタンスの管理者リストから1つ以上のユーザーを削除するには、削除するユーザー名を現在の管理者リストから選択し、「削除」ボタンをクリックします。


注意:

一般管理権限には、インスタンスを作成または削除する権限は含まれません。これらの権限はスーパーユーザーの権限です。

「グローバリゼーション」タブ

Oracle Ultra Searchでは、名前を異なる言語に翻訳できます。このタブでは、検索属性、LOV表示名およびデータ・グループに対して複数の値を入力できます。

検索属性名

このセクションでは、属性表示名を異なる言語に翻訳できます。

次の言語がプルダウン・メニューにリストされます。

  • 英語

  • アラビア語

  • ポルトガル語(ブラジル)

  • フランス語(カナダ)

  • チェコ語

  • デンマーク語

  • オランダ語

  • フィンランド語

  • フランス語

  • ドイツ語

  • ギリシャ語

  • ヘブライ語

  • ハンガリー語

  • イタリア語

  • 日本語

  • 韓国語

  • スペイン語(ラテン・アメリカ)

  • ノルウェー語

  • ポーランド語

  • ポルトガル語

  • ルーマニア語

  • ロシア語

  • 簡体字中国語

  • スロバキア語

  • スペイン語

  • スウェーデン語

  • タイ語

  • 繁体字中国語

  • トルコ語

LOV表示名

このセクションでは、属性LOV表示名を異なる言語に翻訳できます。プルダウン・メニューから検索属性(作者、説明、MIMEタイプ、件名またはタイトル)を選択します。LOVタイプを選択し、プルダウン・メニューから言語を選択します。

データ・グループ名

このセクションでは、データ・グループの表示名を異なる言語に翻訳できます。言語オプションがプルダウン・メニューにリストされます。