B Oracle Textでサポートされているドキュメント形式

Oracle Textは、自動フィルタ処理にOracle Outside InのHTMLエクスポート・テクノロジを使用します。この付録では、このリリースのAUTO_FILTER自動フィルタ処理テクノロジでサポートされているドキュメント形式とグラフィック・ファイル形式を表で説明します。

この付録の内容は次のとおりです。

関連項目:

AUTO_FILTERの使用方法の詳細は、「AUTO_FILTER」を参照してください。

B.1 ドキュメント・フィルタ処理テクノロジ

Oracle Textの自動フィルタ処理テクノロジを使用するとドキュメントを表示するために、CTX_DOCパッケージを使用してドキュメントをHTMLに変換できます。

索引付けおよびDML処理に自動フィルタ処理を使用するには、フィルタ・プリファレンスにAUTO_FILTERオブジェクトを指定する必要があります。

ドキュメントのHTMLへの変換(CTX_DOCパッケージを使用)に自動フィルタ処理テクノロジを使用するには、AUTO_FILTER索引付けプリファレンスを使用する必要はありません。

この項の内容は次のとおりです。

B.1.1 パッチ・リリースの最新の更新

この付録で示す、サポートされているプラットフォームと形式は、このリリースに適用されるものです。これらのサポートされている形式は、パッチ・リリースで更新されます。

B.1.2 形式のサポートに関する制限事項

この付録で示す形式は、AUTO_FILTERで認識される形式です。形式の認識は、テキストを抽出できることを必ずしも意味しません。たとえば、スキャンされたドキュメントは通常イメージであり、AUTO_FILTERは光学式文字認識を実行しません。同様に、マルチメディア・ファイル・タイプから索引付けするためにテキストを抽出できません。

パスワードで保護されているドキュメントおよびパスワードで保護されている内容を含むドキュメントは、AUTO_FILTERフィルタではサポートされていません。

その他の制限事項については、個別のドキュメント形式に関する「サポートされているドキュメント形式」を参照してください。

B.1.3 AUTO_FILTERドキュメント・フィルタ処理テクノロジでサポートされているプラットフォーム

いくつかのプラットフォームでAUTO_FILTERフィルタ・テクノロジを利用できます。AUTO_FILTERフィルタ・テクノロジは、Oracleでは次のプラットフォームをサポートしています。

  • Windows (x86 32ビット) Windows 2000、Windows Server 2003、Windows Server 2008、Windows XP、Windows Vista Enterprise

  • Windows (x86 64ビット) Windows Server 2003およびWindows Server 2008 x64 Standard、Enterprise、およびDatacenter Editions (64ビットExtended)

  • HP-UX(PA-RISC 64ビット)11.i

  • HP/UX(Itanium 64)11i

  • IBM AIX on POWER Systems (64-bit) 5.3 - 7.1

  • iSeries(PASEを使用するOS/400)V5R2

  • Red Hat Linux(x86)Advanced Server 3、4および5

  • Red Hat Linux(x86)Red Hat Enterprise Linux(RHEL)4

  • Red Hat Linux(Itanium 64)Advanced Server 3、4および5

  • Red Hat Linux(zSeries、31ビット)Advanced Server 3および4

  • Red Hat Enterprise Linux AS/ES 3.0、4.0および5.0、x86-64(AMD64/EM64T)Oracle Linux 4.0および5.0、x86-64(AMD64/EM64T)

  • SuSE Linux(x86)9、10およびEnterprise Server 9.0

  • SuSE Linux(x86 64ビット)SUSE Enterprise Server(SLES)9、10

  • SuSE Linux(Itanium 64)Enterprise Server 8

  • SuSE Linux(zSeries、31ビット)9

  • Sun Solaris(SPARC 64ビット)9.xから10.x

  • Sun Solaris(x86-64ビット)10x

Oracle Databaseでサポートされていないプラットフォームが存在する可能性があります。

B.1.4 PDFドキュメントおよびセキュリティ設定でのフィルタ処理

PDFドキュメントには、次のように異なるレベルのセキュリティ設定を適用できます。

表B-1 PDFセキュリティ設定に対するAUTO_FILTERの動作

セキュリティ・レベル 説明 PDFバージョン 暗号化 AUTO_FILTERサポート・レベル

レベル1

ドキュメントを開くには、パスワードが必要です。

1.2+

40 bit RC4

サポートされていません。

レベル1

ドキュメントを開くには、パスワードが必要です。

1.4+

128 bit RC4

サポートされていません。

レベル1

ドキュメントを開くには、パスワードが必要です。

1.5+

128 bit RC4

サポートされていません。

レベル1

ドキュメントを開くには、パスワードが必要です。

1.6+

128 bit AES

サポートされていません。

レベル1

ドキュメントを開くには、パスワードが必要です。

1.7+

256 bit AES

サポートされていません。

レベル2

ユーザーはドキュメントを印刷できません。

1.2+

40 bit RC4

サポートされています。

レベル2

ユーザーはドキュメントを印刷できません。

1.4+

128 bit RC4

サポートされています。

レベル2

ユーザーはドキュメントを印刷できません。

1.5+

128 bit RC4

サポートされています。

レベル2

ユーザーはドキュメントを印刷できません。

1.6+

128 bit AES

サポートされていません。

レベル2

ユーザーはドキュメントを印刷できません。

1.7+

256 bit AES

サポートされていません。

レベル3

ユーザーはドキュメントを変更できません。

1.2+

40 bit RC4

サポートされています。

レベル3

ユーザーはドキュメントを変更できません。

1.4+

128 bit RC4

サポートされています。

レベル3

ユーザーはドキュメントを変更できません。

1.5+

128 bit RC4

サポートされています。

レベル3

ユーザーはドキュメントを変更できません。

1.6+

128 bit RC4

サポートされていません。

レベル3

ユーザーはドキュメントを変更できません。

1.7+

256 bit AES

サポートされていません。

レベル4

ユーザーはドキュメントの内容をコピーまたは抽出できません。

1.2+

40 bit RC4

サポートされています。

レベル4

ユーザーはドキュメントの内容をコピーまたは抽出できません。

1.4+

128 bit RC4

サポートされています。

レベル4

ユーザーはドキュメントの内容をコピーまたは抽出できません。

1.5+

128 bit RC4

サポートされています。

レベル4

ユーザーはドキュメントの内容をコピーまたは抽出できません。

1.6+

128 bit AES

サポートされていません。

レベル4

ユーザーはドキュメントの内容をコピーまたは抽出できません。

1.7+

256 bit AES

サポートされていません。

B.1.5 PDFフィルタ処理の制限事項

PDFファイルをフィルタ処理する場合、次の制限事項が適用されます。

  • CID(Character ID-keyed)フォント、事前定義済のCJK CMapファイル、またはToUnicodeフォント・エンコーディングを使用してPDFドキュメントを作成し、ドキュメントに埋込みフォントが含まれない場合、マルチバイトのPDFがサポートされます。

  • PDFドキュメントの埋込みフォントは、正しくフィルタ処理されません。通常、疑問符(?)の置換文字で表示されます。

  • ブラウザまたは表示ウィンドウに表示される場合、PDFのハイパーリンクはアクティブではありません。

  • ノート、音声、動画などの注釈はサポートされていません。

B.1.6 環境変数

ユーザーが設定する必要のある環境変数はありません。

B.1.7 一般的な制限事項

AUTO_FILTERフィルタ・テクノロジには、次の制限事項があります。

  • 0x20(decimal 32)未満のASCII文字は、16進数に変換されます。

  • ファイルの長さが2GBを超える場合は処理されません。

B.2 サポートされているドキュメント形式

ドキュメント・フィルタ処理は、索引付け、DMLおよびドキュメントのHTMLへの変換(CTX_DOCパッケージを使用)に使用されます。この項の表は、フィルタ処理に対してOracle Textがサポートするドキュメント形式を示しています。

この項では、次の項目について説明します。

ノート:

これらのリストには、Oracle Textが処理できるすべての形式が記載されているわけではありません。プレーン・テキスト、HTML、XMLなどのテキスト形式をフィルタ処理できる外部フィルタが存在する場合は、USER_FILTERおよびPROCEDURE_FILTERにより、Oracle Textがすべてのドキュメント形式を処理できるようになります。

B.2.1 アーカイブ・ファイル形式

アーカイブ・ファイルをフィルタ処理すると、アーカイブ内のファイルの内容はすべて、1つの出力ファイルにエクスポートされます。この場合、アーカイブ・ファイル内のすべてのサブフォルダとファイルの内容も含まれます。

表B-2に、Oracle Textでサポートされているアーカイブ形式を示します。

表B-2 サポートされているアーカイブ・ファイル形式

アーカイブ形式 バージョン

7z (BZIP2と分割アーカイブはサポート対象外)

7zの自己解凍.exe (BZIP2と分割アーカイブはサポート対象外)

LZA自己解凍圧縮

LZH圧縮

Microsoft Office Binder

95 – 97

Microsoft Cabinet (CAB)

RAR

1.5, 2.0, 2.9

自己解凍.exe

UNIX Compress

UNIX GZip

UNIX Tar

Uuencode

Zip

PKZip

Zip

WinZip

Zip Zip64

B.2.2 データベース形式

形式 バージョン

DataEase

4.x

DBase

III、IV、V

First Choice DB

3.0まで

Framework DB

3.0

Microsoft Access

1.0, 2.0, 95–2013

Microsoft Works DB (DOS版)

1.0, 2.0

Microsoft Works DB (Macintosh版)

2.0

Microsoft Works DB (Windows版)

3.0, 4.0

Paradox for DOS

2.0 – 4.0

Paradox for Windows

1.0

Q&A Database

2.0まで

R:BASE

R:BASE 5000

R:BASE

R:BASE System V

Reflex

2.0

SmartWare II DB

1.02

B.2.3 電子メール形式

形式 バージョン

Apple Mail Message(EMLX)

2.0

Encoded mail messages

MHT

Encoded mail messages

Multi Part Alternative

Encoded mail messages

Multi Part Digest

Encoded mail messages

Multi Part Mixed

Encoded mail messages

Multi Part News Group

Encoded mail messages

Multi Part Signed

Encoded mail messages

TNEF

デジタル署名付きEML SMIME

IBM Lotus Notes Domino XML Language (DXL)

8.5

IBM Lotus Notes NSF (Notes ClientまたはDomino Serverを使用するWin32、Win64、Linux x86-32およびOracle Solaris 32ビット版のみ) 8.x

MBOX Mailbox

RFC 822

Microsoft Outlook Message(MSG)

97 – 2013

Microsoft Outlook Express(EML)

 

Microsoft Outlook Forms Template(OFT)

97 – 2013

Microsoft Outlook OST

97 – 2013

Microsoft Outlook PST

97 – 2013

Microsoft Outlook PST(Mac)

2001

デジタル署名付きMSG SMIME

MIMEのサポートに関する注意

次の形式をサポートしています。

  • MIME形式

    • EML

    • MHT(Webアーカイブ)

    • NWS(ニュースグループのシングルパートおよびマルチパート)

    • Simple Text Mail (RFC 2822で定義)

  • TNEF形式

  • MIMEエンコード(次のものを含む)

    • base64 (RFC 1521で定義)

    • binary (RFC 1521で定義)

    • binhex (RFC 1741で定義)

    • btoa

    • quoted-printable (RFC 1521で定義)

    • utf-7 (RFC 2152で定義)

    • uue

    • xxe

    • yenc

また、メッセージの本文は複数の方法でエンコードできます。次のエンコードがサポートされています。

  • HTML

  • RTF

  • TNEF

  • Text/enriched(RFC 1523で定義)

  • Text/richtext (RFC1341で定義)

  • 埋込みメール・メッセージ(RFC 822で定義): 新しいメッセージへのリンクとして扱われます。

MIMEメッセージの添付は複数の形式で格納できます。Oracleのテクノロジでサポートされるすべての添付タイプが処理されます。

B.2.4 グラフィック形式(ラスターおよびベクター・イメージ)

AUTO_FILTERフィルタで認識されるグラフィック形式を使用すると、その形式を含むテキスト列の索引付けでエラーが生成されません。形式は、埋込みグラフィックまたはスタンドアロン・グラフィックのいずれかに分類されます。埋込みグラフィックは、ドキュメント内で挿入または参照されます。

この項には、サポートされるグラフィック形式をまとめた次の表があります。

ノート:

AUTO_FILTERフィルタはグラフィックからテキスト情報を抽出できません。

表B-3 AUTO_FILTERフィルタでサポートされているラスター・イメージ形式

形式 バージョン
Adobe Photoshop 4.0
Adobe Photoshop PSD (File IDのみ)  
Adobe Photoshop CS1–6

CALS Raster(GP4)

Type I

CALS Raster(GP4)

Type II

Computer Graphics Metafile

ANSI

Computer Graphics Metafile

CALS

Computer Graphics Metafile

NIST

Encapsulated PostScript(EPS)

TIFFヘッダーのみ

GEM Image(ビットマップ)

Graphics Interchange Format(GIF)

IBM Graphics Data Format(GDF)

1.0

IBM Picture Interchange Format

1.0

JBIG2

PDFへのグラフィック埋込み

JFIF (TIFF形式ではないJPEG)

JPEG

JPEG 2000

JP2

Kodak Flash Pix

Kodak Photo CD

1.0

Lotus PIC

Lotus Snapshot

Macintosh PICT

BMPのみ

Macintosh PICT2

BMPのみ

MacPaint

Microsoft Windows Bitmap

Microsoft Windowsカーソル

Microsoft Windowsアイコン

OS/2 Bitmap

OS/2 Warp Bitmap

Paint Shop Pro (Win32のみ)

5.0, 6.0

PC Paintbrush(PCX)

PC Paintbrush DCX(複数ページのPCX)

Portable Bitmap(PBM)

Portable Graymap PGM

Portable Network Graphics(PNG)

Portable Pixmap(PPM)

Progressive JPEG

StarOffice Draw

6.x – 9.0

Sun Raster

TIFF

Group 5 & 6

TIFF CCITT

Group 3 & 4

TruVision TGA(Targa)

2.0

Word Perfect Graphics

1.0

WBMPワイヤレス・グラフィック・フォーマット

X-Windows Bitmap

x10互換

X-Windows Dump

x10互換

X-Windows Pixmap

x10互換

WordPerfect Graphics

2.0 – 10.0

表B-4 AUTO_FILTERフィルタでサポートされているベクター・イメージ形式

グラフィック形式 バージョン

Adobe Illustrator

4.0 – 7.0

Adobe Illustrator(PDFプレビューのみ) 9.0, CS1–6

Adobe Illustrator XMP

CS1 – 6

Adobe InDesign XMP

CS1–6

Adobe InDesign Interchange (XMPのみ)

Adobe PDF

1.0 – 1.7 (Acrobat 1 - 10)

Adobe PDFパッケージ

1.7 (Acrobat 8 – 10)

Adobe PDFポートフォリオ

1.7 (Acrobat 8 – 10)

Ami Draw

SDW

AutoCAD Drawing

2.5, 2.6

AutoCAD Drawing

9.0 – 14.0

AutoCAD Drawing

2000i – 2015

AutoShade Rendering

2

Corel Draw

2.0 – 9.0およびX7

Corel Draw Clipart

5.0, 7.0

Enhanced Metafile (EMF)

Escherグラフィック

FrameMakerグラフィック(FMV)

3.0 – 5.0

Gem File(ベクター)

Harvard Graphics Chart DOS

2.0 – 3.0

Harvard Graphics for Windows

Hewlett Packard Graphics Language(HPGL)

2.0

IGES Drawing

5.1 – 5.3

Micrografx Designer (DRW)

3.1まで

Micrografx Designer(DFS)

6.0

Micrografx Draw(DRW)

4.0まで

Microsoft XPS(テキストのみ)

Novell PerfectWorks Draw

2

OpenOffice Draw

1.1 – 3.0

Oracle Open Office Draw

3.x

SVG(XMLとして処理、レンダーなし)  

Visio(ページ・プレビュー・モードWMF/EMF)

4.0

Visio

5.0 - 2010

Visio(テキストのみ) 2013

Windows Metafile(WMF)

B.2.5 マルチメディア形式

次に示すマルチメディア形式は、AUTO_FILTERで認識される形式です。形式の認識は、テキストを抽出できることを必ずしも意味しません。また、ファイル名およびファイル・ヘッダー情報は索引付けされません。スキャンされたドキュメントは通常イメージであり、AUTO_FILTERは光学式文字認識を実行しません。同様に、マルチメディア・ファイル・タイプから索引付けするためにテキストを抽出できません。

形式 バージョン

Flash (テキスト抽出のみ)

6.x、7.x、Lite

MP3 (ID3メタデータのみ)

B.2.6 その他の形式

形式 バージョン

Microsoft Live Messenger (XMLフィルタ経由)

10.0

Microsoft OneNote (テキストのみ)

2007, 2010, 2013

Microsoft Project (表ビューのみ)

98 – 2003

Microsoft Project (表ビューのみ)

2007, 2010

Microsoft Windows DLL

-

Microsoft Windows実行可能ファイル

-

Trillianテキスト・ログ・ファイル (テキスト・フィルタ経由)

4.2

vCalendar

2.1

vCard

2.1

Yahoo Messenger

6.x – 8

B.2.7 プレゼンテーション形式

形式 バージョン

Apple iWork Keynote(テキストとPDFのプレビュー)

09, 2014

Harvard Graphics Presentation DOS

3.0

IBM Lotus Symphony Presentation

1.x

Kingsoft WPS Presentation

2010

LibreOffice Impress

4.x

Lotus Freelance

1.0 – Millennium 9.8

Lotus Freelance for OS/3

2

Lotus Freelance for Windows

95、97、SmartSuite 9.8

Microsoft PowerPoint for Macintosh

4.0 – 2011

Microsoft PowerPoint for Windows

3.0 – 2016

Microsoft PowerPoint for Windowsスライドショー

2007 – 2016

Microsoft PowerPoint for Windowsテンプレート

2007 – 2016

Novell Presentation

3.0, 7.0

OpenOffice Impress

1.1, 3.0

Oracle Open Office Impress

3.x

StarOffice Impress

5.2 – 9.0

WordPerfect Presentation

5.1 – X7

B.2.8 スプレッドシート形式

形式 バージョン

Apple iWork Numbers (テキストとPDFのプレビュー)

09

Enable Spreadsheet

3.0 – 4.5

First Choice SS

3.0まで

Framework SS

3.0

IBM Lotus Symphony Spreadsheet

1.x

Kingsoft WPS Spreadsheet

2010

LibreOffice Calc

4.x

Lotus 1-2-3

Millennium 9.8まで

Lotus 1-2-3 Charts (DOS版およびWindows版)

5.0まで

Lotus 1-2-3 for OS/2

2.0

Microsoft Excelグラフ

2.x – 2007

Microsoft Excel for Macintosh

98 – 2011

Microsoft Excel for Windows

3.0 – 2016

Microsoft Excel for Windows (XMLフィルタを介したテキストのみ)

2003 XML

Microsoft Excel for Windows(.xlsb)

2007 – 2016 (バイナリ)

Microsoft Works SS for DOS

2.0

Microsoft Works SS (Macintosh版)

2.0

Microsoft Works SS (Windows版)

3.0, 4.0

Multiplan

4.0

Novell PerfectWorks Spreadsheet

2.0

OpenOffice Calc

1.1 – 3.0

Oracle Open Office Calc

3.x

PFS: Plan

1.0

Quattro Pro for DOS

5.0まで

Quattro Pro for Windows

X7まで

SmartWare Spreadsheet

SmartWare II SS

1.02

StarOffice Calc

5.2 – 9.0

SuperCalc

5.0

Symphony

2.0まで

VP-Planner

1.0

B.2.9 テキストおよびマークアップ形式

形式 バージョン

ANSIテキスト

7および8ビット

ASCIIテキスト

7および8ビット

DOSキャラクタ・セット

EBCDIC

HTML(HTML5の最新要素は、一般にHTMLベースの電子メールに見られる要素に限定。)

1.0 – 5.0

IBM DCA/RFT

Macintoshキャラクタ・セット

リッチ・テキスト・フォーマット(RTF)

Unicodeテキスト

3.0, 4.0

UTF-8

Wireless Markup Language

XML(テキストのみ)

B.2.10 ワード処理形式およびデスクトップ・パブリッシング形式

形式 バージョン

Adobe FrameMaker (MIFのみ)

3.0 – 6.0

Adobe Illustrator Postscript

レベル2

Ami

Ami Pro for OS/2

Ami Pro for Windows

2.0, 3.0

Apple iWork Pages(テキストとPDFのプレビュー)

09

DEC DX

4.0まで

DEC DX Plus

4.0, 4.1

Enable Word Processor

3.0 – 4.5

First Choice WP

1.0, 3.0

Framework WP

3.0

Hangul

97 – 2010

IBM DCA/FFT

IBM DisplayWrite

2.0 – 5.0

IBM Writing Assistant

1.01

Ichitaro

5.0, 6.0, 8.0 – 13.0, 2004, 2013

JustWrite

3.0まで

Kingsoft WPS Writer

2010

Legacy

1.1

LibreOffice Writer

4.x

Lotus Manuscript

2.0まで

Lotus WordPro

9.7, 96 – Millennium 9.8

MacWrite II

1.1

Mass 11

8.0まで

Microsoft Word for DOS

4.0 – 6.0

Microsoft Word for Macintosh

4.0 – 6.0, 98 – 2011

Microsoft Word for Windows

1.0 – 2016

Microsoft Word for Windows (XMLフィルタを介したテキストのみ)

2003 XML

Microsoft Word for Windows

98-J

Microsoft WordPad

Microsoft Works WP for DOS

2.0

Microsoft Works WP (Macintosh版)

2.0

Microsoft Works WP (Windows版)

3.0, 4.0

Microsoft Write (Windows版)

1.0 – 3.0

MultiMate

4.0まで

MultiMate Advantage

2.0

Navy DIF

Nota Bene

3.0

Novell PerfectWorks Word Processor

2.0

OfficeWriter

4.0 – 6.0

OpenOffice Writer

1.1 – 3.0

Oracle Open Office Writer

3.x

PC File Doc

5.0

PFS: Write

A、B

Professional Write for DOS

1.0, 2.0

Professional Write Plus for Windows

1.0

Q&A Write

2.0, 3.0

Samna Word IV

1.0 – 3.0

Samna Word IV+

Signature

1.0

SmartWare II WP

1.02

Sprint

1.0

StarOffice Writer

5.2 – 9.0

Total Word

1.2

Wang IWP

2.6まで

WordMarc Composer

WordMarc Composer+

WordMarc Word Processor

WordPerfect for DOS

4.2

WordPerfect for Macintosh

1.02 – 3.1

WordPerfect for Windows

5.1 – X7

WordStar 2000 for DOS

1.0 – 3.0

Wordstar for DOS

3.0 – 7.0

Wordstar for Windows

1.0

XyWrite

III+まで