HTMLファイルを索引付けするには、次のようにCONTEXT
索引をテキスト列に作成します。HTMLの索引付けであるため、この例では、フィルタ処理が不要なNULL_FILTER
プリファレンス型とHTML_SECTION_GROUP
型を使用します。
CREATE INDEX idx_docs ON docs(text) INDEXTYPE IS CTXSYS.CONTEXT PARAMETERS ('FILTER CTXSYS.NULL_FILTER SECTION GROUP CTXSYS.HTML_SECTION_GROUP');
索引付け時にHTMLドキュメントをフィルタ処理する必要がないため、NULL_FILTER
を使用します。ただし、PDF、Microsoft Wordまたはその他の書式設定されたドキュメントを索引付けする場合は、FILTER
プリファレンスとしてCTXSYS.AUTO_FILTER
(デフォルト)を使用します。
この例では、HTMLドキュメントの索引付けに推奨されているHTML_SECTION_GROUP
セクション・グループも使用します。HTML_SECTION_GROUP
を使用すると、特定のHTMLタグ内を検索して、フォント情報などの不要なマークアップを索引から削除できます。