output.dom.includeプロパティをtrueに設定すると、Web CrawlerはHTMLドキュメントのコンテンツを正規化してXHTMLに変換し、レコード内のEndeca.Document.XHTMLプロパティに格納します。
-
テキスト・エディタでdefault.xmlを開きます。
-
output.dom.includeをtrueに設定します。
これにより、XSLTまたはその他のXML処理システムを使用して、XHTMLから情報を抽出できるようになります。
-
Endeca.Document.Textプロパティにも、抽出されたテキストがXMLヘッダーとHTMLタグが削除された形式で格納されることに注意してください。したがって、XHTMLバージョンのコンテンツが不要な場合は、output.dom.includeプロパティをfalseに設定します。
-
ファイルを保存して閉じます。