特定のURLでMIMEタイプに関してあいまいな点がある場合、Web CrawlerはデフォルトでサーバーのMIMEタイプよりもURLの拡張子を信頼します。mime.types.trust-server.text-htmlプロパティは、クロールにおいてtext/html MIMEタイプの解決で問題が発生する場合を想定しています。
http://www.xyz.com/scripts/InfoPDF.asp?FileName=4368.pdf
この場合、実際のページはASPページであり、サーバーはこのページのMIMEタイプとしてtext/htmlを返します。しかし、クローラはURLに.pdf拡張子があることを見つけ、このURLをPDFファイルとして解決します(つまり、サーバーが返したMIMEタイプをオーバーライドします)。そして、クローラはこのページに対してDocument Conversionモジュールを起動します。実際には、このモジュールは起動されるべきではありません。
前述の例で、mime.types.trust-server.text-htmlプロパティがtrueに設定されていたら、クローラはこの競合を解決する際にURL拡張子ではなくサーバーのtext/html MIMEタイプのほうを信用します。したがって、Document Conversionモジュールは起動されません。
サーバーのtext/html MIMEタイプをオーバーライドするには: