プライマリ・コンテンツに移動
Oracle® Textリファレンス
12cリリース1 (12.1)
B71316-03
目次へ移動
目次
索引へ移動
索引

前
次

B Oracle Textでサポートされているドキュメント形式

Oracle Textは、自動フィルタ処理にOracle Outside InのHTMLエクスポート・テクノロジを使用します。この付録では、このリリースのAUTO_FILTER自動フィルタ処理テクノロジでサポートされているドキュメント形式とグラフィック・ファイル形式を表で説明します。

この付録の内容は次のとおりです。

関連項目:

AUTO_FILTERの使用方法の詳細は、「AUTO_FILTER」を参照してください。

B.1 ドキュメント・フィルタ処理テクノロジ

Oracle Textの自動フィルタ処理テクノロジを使用するとドキュメントを表示するために、CTX_DOCパッケージを使用してドキュメントをHTMLに変換できます。

索引付けおよびDML処理に自動フィルタ処理を使用するには、フィルタ・プリファレンスにAUTO_FILTERオブジェクトを指定する必要があります。

ドキュメントのHTMLへの変換(CTX_DOCパッケージを使用)に自動フィルタ処理テクノロジを使用するには、AUTO_FILTER索引付けプリファレンスを使用する必要はありません。

この項の内容は次のとおりです。

B.1.1 パッチ・リリースの最新の更新

この付録で示す、サポートされているプラットフォームと形式は、このリリースに適用されるものです。これらのサポートされている形式は、パッチ・リリースで更新されます。

B.1.2 形式のサポートに関する制限事項

この付録で示す形式は、AUTO_FILTERで認識される形式です。形式の認識は、テキストを抽出できることを必ずしも意味しません。たとえば、スキャンされたドキュメントは通常イメージであり、AUTO_FILTERは光学式文字認識を実行しません。同様に、マルチメディア・ファイル・タイプから索引付けするためにテキストを抽出できません。

パスワードで保護されているドキュメントおよびパスワードで保護されている内容を含むドキュメントは、AUTO_FILTERフィルタではサポートされていません。

その他の制限事項については、個別のドキュメント形式に関する「サポートされているドキュメント形式」を参照してください。

B.1.3 AUTO_FILTERドキュメント・フィルタ処理テクノロジでサポートされているプラットフォーム

いくつかのプラットフォームでAUTO_FILTERフィルタ・テクノロジを利用できます。AUTO_FILTERフィルタ・テクノロジは、Oracleでは次のプラットフォームをサポートしています。

  • Windows (x86 32ビット) Windows 2000、Windows Server 2003、Windows Server 2008、Windows XP、Windows Vista Enterprise

  • Windows (x86 64ビット) Windows Server 2003およびWindows Server 2008 x64 Standard、Enterprise、およびDatacenter Editions (64ビットExtended)

  • HP-UX(PA-RISC 64ビット)11.i

  • HP/UX(Itanium 64)11i

  • IBM AIX(32ビットpSeries)5.1から5.3

  • iSeries(PASEを使用するOS/400)V5R2

  • Red Hat Linux(x86)Advanced Server 3、4および5

  • Red Hat Linux(x86)Red Hat Enterprise Linux(RHEL)4

  • Red Hat Linux(Itanium 64)Advanced Server 3、4および5

  • Red Hat Linux(zSeries、31ビット)Advanced Server 3および4

  • Red Hat Enterprise Linux AS/ES 3.0、4.0および5.0、x86-64(AMD64/EM64T)Oracle Linux 4.0および5.0、x86-64(AMD64/EM64T)

  • SuSE Linux(x86)9、10およびEnterprise Server 9.0

  • SuSE Linux(x86 64ビット)SUSE Enterprise Server(SLES)9、10

  • SuSE Linux(Itanium 64)Enterprise Server 8

  • SuSE Linux(zSeries、31ビット)9

  • Sun Solaris(SPARC 64ビット)9.xから10.x

  • Sun Solaris(x86-64ビット)10x

Oracle Databaseでサポートされていないプラットフォームが存在する可能性があります。

B.1.4 PDFドキュメントおよびセキュリティ設定でのフィルタ処理

PDFドキュメントには、次のように異なるレベルのセキュリティ設定を適用できます。

表B-1 PDFセキュリティ設定に対するAUTO_FILTERの動作

セキュリティ・レベル 説明 PDFバージョン 暗号化 AUTO_FILTERサポート・レベル

レベル1

ドキュメントを開くには、パスワードが必要です。

1.2+

40ビットRC4

サポートされていません。

レベル1

ドキュメントを開くには、パスワードが必要です。

1.4+

128ビットRC4

サポートされていません。

レベル1

ドキュメントを開くには、パスワードが必要です。

1.5+

128ビットRC4

サポートされていません。

レベル1

ドキュメントを開くには、パスワードが必要です。

1.6+

128ビットAES

サポートされていません。

レベル1

ドキュメントを開くには、パスワードが必要です。

1.7+

256ビットAES

サポートされていません。

レベル2

ユーザーはドキュメントを印刷できません。

1.2+

40ビットRC4

サポートされています。

レベル2

ユーザーはドキュメントを印刷できません。

1.4+

128ビットRC4

サポートされています。

レベル2

ユーザーはドキュメントを印刷できません。

1.5+

128ビットRC4

サポートされています。

レベル2

ユーザーはドキュメントを印刷できません。

1.6+

128ビットAES

サポートされていません。

レベル2

ユーザーはドキュメントを印刷できません。

1.7+

256ビットAES

サポートされていません。

レベル3

ユーザーはドキュメントを変更できません。

1.2+

40ビットRC4

サポートされています。

レベル3

ユーザーはドキュメントを変更できません。

1.4+

128ビットRC4

サポートされています。

レベル3

ユーザーはドキュメントを変更できません。

1.5+

128ビットRC4

サポートされています。

レベル3

ユーザーはドキュメントを変更できません。

1.6+

128ビットRC4

サポートされていません。

レベル3

ユーザーはドキュメントを変更できません。

1.7+

256ビットAES

サポートされていません。

レベル4

ユーザーはドキュメントの内容をコピーまたは抽出できません。

1.2+

40ビットRC4

サポートされています。

レベル4

ユーザーはドキュメントの内容をコピーまたは抽出できません。

1.4+

128ビットRC4

サポートされています。

レベル4

ユーザーはドキュメントの内容をコピーまたは抽出できません。

1.5+

128ビットRC4

サポートされています。

レベル4

ユーザーはドキュメントの内容をコピーまたは抽出できません。

1.6+

128ビットAES

サポートされていません。

レベル4

ユーザーはドキュメントの内容をコピーまたは抽出できません。

1.7+

256ビットAES

サポートされていません。

B.1.5 PDFフィルタ処理の制限事項

PDFファイルをフィルタ処理する場合、次の制限事項が適用されます。

  • CID(Character ID-keyed)フォント、事前定義済のCJK CMapファイル、またはToUnicodeフォント・エンコーディングを使用してPDFドキュメントを作成し、ドキュメントに埋込みフォントが含まれない場合、マルチバイトのPDFがサポートされます。

  • PDFドキュメントの埋込みフォントは、正しくフィルタ処理されません。通常、疑問符(?)の置換文字で表示されます。

  • ブラウザまたは表示ウィンドウに表示される場合、PDFのハイパーリンクはアクティブではありません。

  • ノート、音声、動画などの注釈はサポートされていません。

B.1.6 環境変数

ユーザーが設定する必要のある環境変数はありません。

B.1.7 一般的な制限事項

AUTO_FILTERフィルタ・テクノロジには、次の制限事項があります。

  • 0x20(decimal 32)未満のASCII文字は、16進数に変換されます。

  • ファイルの長さが2GBを超える場合は処理されません。

B.2 サポートされているドキュメント形式

ドキュメント・フィルタ処理は、索引付け、DMLおよびドキュメントのHTMLへの変換(CTX_DOCパッケージを使用)に使用されます。この項の表は、フィルタ処理に対してOracle Textがサポートするドキュメント形式を示しています。

この項の内容は次のとおりです。

注意:

これらのリストには、Oracle Textが処理できるすべての形式が記載されているわけではありません。プレーン・テキスト、HTML、XMLなどのテキスト形式をフィルタ処理できる外部フィルタが存在する場合は、USER_FILTERおよびPROCEDURE_FILTERにより、Oracle Textがすべてのドキュメント形式を処理できるようになります。

B.2.1 アーカイブ・ファイル形式

アーカイブ・ファイルをフィルタ処理すると、アーカイブ内のファイルの内容はすべて、1つの出力ファイルにエクスポートされます。この場合、アーカイブ・ファイル内のすべてのサブフォルダとファイルの内容も含まれます。

表B-2に、Oracle Textでサポートされているアーカイブ形式を示します。

表B-2 サポートされているアーカイブ・ファイル形式

アーカイブ形式 バージョン

7z (BZIP2と分割アーカイブはサポート対象外)

7zの自己解凍.exe (BZIP2と分割アーカイブはサポート対象外)

LZA自己解凍圧縮

LZH Compress

Microsoft Office Binder

95 – 97

Microsoft Cabinet (CAB)

RAR

1.5, 2.0, 2.9

自己解凍.exe

UNIX Compress

UNIX GZip

UNIX Tar

Uuencode

Zip

PKZip

Zip

WinZip

B.2.2 データベース形式

形式 バージョン

DataEase

4.x

dBASE

III、IV、V

First Choice DB

3.0まで

Framework DB

3.0

Microsoft Access

1.0, 2.0

Microsoft Accessレポート・スナップショット(ファイルIDのみ)

2000 – 3000

Microsoft Works DB (DOS版)

1.0, 2.0

Microsoft Works DB (Macintosh版)

2.0

Microsoft Works DB (Windows版)

3.0, 4.0

Paradox for DOS

2.0 – 4.0

Paradox for Windows

1.0

Q&A Database

2.0まで

R:BASE 5000

3.1まで

R:BASE System V

1.0

Reflex

2.0

SmartWare II

1.02

B.2.3 電子メール形式

注意:

Oracle Textは、次のファイル形式の場合、テキストを抽出しません。

  • IBM Lotus Notes NSF (ファイルID) 7.x、8.x

  • IBM Lotus Notes NSF (Notes ClientまたはDomino Serverを使用するWindows、Linux x86-32およびOracle Solaris 32ビット版のみ)8.x

形式 バージョン

Apple Mail Message (EMLX)

2.0

Encoded mail messages

MHT

Encoded mail messages

Multi Part Alternative

Encoded mail messages

Multi Part Digest

Encoded mail messages

Multi Part Mixed

Encoded mail messages

Multi Part News Group

Encoded mail messages

Multi Part Signed

Encoded mail messages

TNEF

IBM Lotus Notes Domino XML Language (DXL)

8.5

MBOX Mailbox

RFC 822

Microsoft Outlook Message(MSG)

97 – 2007

Microsoft Outlook Express (EML)

MIMEエンコード・メール・メッセージ

Microsoft Outlook Forms Template (OFT)

97 – 2007

Microsoft Outlook OST

97 – 2007

Microsoft Outlook PST

97 – 2007

Microsoft Outlook PST (Mac)

2001

MIMEサポートの注意事項

次の形式をサポートしています。

  • MIME形式

    • EML

    • MHT(Webアーカイブ)

    • NWS(ニュースグループのシングルパートおよびマルチパート)

    • Simple Text Mail(RFC 2822で定義)

  • TNEF形式

  • MIMEエンコード(次のものを含む)

    • base64(RFC 1521で定義)

    • binary(RFC 1521で定義)

    • binhex(RFC 1741で定義)

    • btoa

    • quoted-printable(RFC 1521で定義)

    • utf-7(RFC 2152で定義)

    • uue

    • xxe

    • yenc

また、メッセージの本文は複数の方法でエンコードできます。次のエンコードがサポートされています。

  • HTML

  • RTF

  • TNEF

  • Text/enriched(RFC 1523で定義)

  • Text/richtext(RFC1341で定義)

  • 埋込みメール・メッセージ(RFC 822で定義): 新しいメッセージへのリンクとして扱われます。

MIMEメッセージの添付ファイルは複数の形式で格納できます。Oracleのテクノロジでサポートされるすべての添付ファイル・タイプが処理されます。

B.2.4 グラフィック形式(ラスターおよびベクター・イメージ)

AUTO_FILTERフィルタで認識されるグラフィック形式を使用すると、その形式を含むテキスト列の索引付けでエラーが生成されません。形式は、埋込みグラフィックまたはスタンドアロン・グラフィックのいずれかに分類されます。埋込みグラフィックは、ドキュメント内で挿入または参照されます。

この項には、サポートされるグラフィック形式をまとめた次の表があります。

注意:

AUTO_FILTERフィルタはグラフィックからテキスト情報を抽出できません。

表B-3 AUTO_FILTERフィルタでサポートされているラスター・イメージ形式

形式 バージョン

CALS Raster(GP4)

Type I

CALS Raster(GP4)

Type II

Computer Graphics Metafile

ANSI

Computer Graphics Metafile

CALS

Computer Graphics Metafile

NIST

Encapsulated PostScript(EPS)

TIFFヘッダーのみ

GEM Image (Bitmap)

Graphics Interchange Format(GIF)

IBM Graphics Data Format(GDF)

1.0

IBM Picture Interchange Format

1.0

JBIG2

PDFへのグラフィック埋込み

JFIF(TIFF形式でないJPEG)

JPEG

JPEG 2000

JP2

Kodak Flash Pix

Kodak Photo CD

1.0

Lotus PIC

Lotus Snapshot

Macintosh PICT

BMPのみ

Macintosh PICT2

BMPのみ

MacPaint

Microsoft Windows Bitmap

Microsoft Windowsカーソル

Microsoft Windowsアイコン

OS/2 Bitmap

OS/2 Warp Bitmap

Paint Shop Pro (Win32のみ)

5.0, 6.0

PC Paintbrush (PCX)

PC Paintbrush DCX(複数ページのPCX)

Portable Bitmap(PBM)

Portable Graymap PGM

Portable Network Graphics(PNG)

Portable Pixmap(PPM)

Progressive JPEG

StarOffice Draw

6.x – 9.0

Sunラスター

TIFF

Group 5 & 6

TIFF CCITT

Group 3 & 4

TruVision TGA (Targa)

2.0

Word Perfect Graphics

1.0

WBMPワイヤレス・グラフィック・フォーマット

X-Windows Bitmap

x10互換

X-Windows Dump

x10互換

X-Windows Pixmap

x10互換

WordPerfect Graphi

2.0 – 10.0

表B-4 AUTO_FILTERフィルタでサポートされているベクター・イメージ形式

グラフィック形式 バージョン

Adobe Illustrator

4.0 – 7.0, 9.0

Adobe Illustrator (XMPのみ)

11 – 13 (CS 1 – 3)

Adobe InDesign (XMPのみ)

3.0 – 5.0 (CS 1 - 3)

Adobe InDesign Interchange (XMPのみ)

Adobe Photoshop (XMPのみ)

8.0 – 10.0 (CS 1 – 3)

Adobe PDF

1.0 – 1.7 (Acrobat 1 - 9)

Adobe PDFパッケージ

1.7 (Acrobat 8 – 9)

Adobe PDFポートフォリオ

1.7 (Acrobat 8 – 9)

Adobe Photoshop

4.0

Ami Draw

SDW

AutoCAD Drawing

2.5, 2.6

AutoCAD Drawing

9.0 – 14.0

AutoCAD Drawing

2000i – 2010

AutoShade Rendering

2

Corel Draw

2.0 – 9.0

Corel Draw Clipart

5.0, 7.0

Enhanced Metafile (EMF)

Escherグラフィック

FrameMakerグラフィック(FMV)

3.0 – 5.0

Gem File (ベクター)

Harvard Graphics Chart DOS

2.0 – 3.0

Harvard Graphics for Windows

Hewlett Packard Graphics Language(HPGL)

2.0

IGES Drawing

5.1 – 5.3

Micrografx Designer(DRW)

3.1まで

Micrografx Designer(DFS)

6.0

Micrografx Draw(DRW)

4.0まで

Microsoft XPS(テキストのみ)

Novell PerfectWorks Draw

2

OpenOffice Draw

1.1 – 3.0

Oracle Open Office Draw

3.x

Visio(ページ・プレビュー・モードWMF/EMF)

4.0

Visio

5.0 - 2007

Visio XML VSX(ファイルIDのみ)

2007

Windows Metafile(WMF)

B.2.5 マルチメディア形式

次に示すマルチメディア形式は、AUTO_FILTERで認識される形式です。形式の認識は、テキストを抽出できることを必ずしも意味しません。また、ファイル名およびファイル・ヘッダー情報は索引付けされません。スキャンされたドキュメントは通常イメージであり、AUTO_FILTERは光学式文字認識を実行しません。同様に、マルチメディア・ファイル・タイプから索引付けするためにテキストを抽出できません。

形式 バージョン

AVI (メタデータ抽出のみ)

Flash (テキスト抽出のみ)

6.x、7.x、Lite

Flash (ファイルIDのみ)

9, 10

RealMedia (ファイルIDのみ)

MP3 (ID3メタデータのみ)

MPEG-1 Audio layer 3 V ID3 v1 (ファイルIDのみ)

MPEG-1 Audio layer 3 V ID3 v2 (ファイルIDのみ)

MPEG-1 Video V 2 (ファイルIDのみ)

MPEG-1 Video V 3 (ファイルIDのみ)

MPEG-2 Audio (ファイルIDのみ)

MPEG-4 (メタデータ抽出のみ)

MPEG-7 (メタデータ抽出のみ)

QuickTime (メタデータ抽出のみ)

Windows Media ASF (メタデータ抽出のみ)

Windows Media DVR-MS (メタデータ抽出のみ)

Windows Media Audio WMA (メタデータ抽出のみ)

Windows Media Playlist (ファイルIDのみ)

Windows Media Video WMV (メタデータ抽出のみ)

WAV (メタデータ抽出のみ)

B.2.6 その他の形式

形式 バージョン

AOL Messenger (ファイルIDのみ)

7.3

Microsoft InfoPath (ファイルIDのみ)

2007

Microsoft Live Messenger (XMLフィルタ経由)

10.0

Microsoft OneNote (ファイルIDのみ)

2007

Microsoft Project (表ビューのみ)

98 – 2003

Microsoft Project (表ビューのみ)

2007, 2010

Microsoft Windows Compiled Help (ファイルIDのみ)

.chm

Microsoft Windows DLL

-

Microsoft Windows実行可能ファイル

-

Microsoft Windows Explorer Command (ファイルIDのみ)

.scf

Microsoft Windows Help (ファイルIDのみ)

.hlp

Microsoft Windowsショートカット (ファイルIDのみ)

.lnk

Trillianテキスト・ログ・ファイル (テキスト・フィルタ経由)

4.2

Trillian XMLログ・ファイル (ファイルIDのみ)

4.2

TrueType Font (ファイルIDのみ)

ttf、ttc

vCalendar

2.1

vCard

2.1

Yahoo Messenger

6.x – 8

B.2.7 プレゼンテーション形式

形式 バージョン

Harvard Graphics Presentation DOS

3.0

IBM Lotus Symphony Presentation

1.x

Kingsoft WPS Presentation

2010

Lotus Freelance

1.0 – Millennium 9.6

Lotus Freelance for OS/3

2

Lotus Freelance for Windows

95, 97

Microsoft PowerPoint for Macintosh

4.0 – 2008

Microsoft PowerPoint for Windows

3.0 – 2010

Microsoft PowerPoint for Windowsスライドショー

2007 – 2010

Microsoft PowerPoint for Windowsテンプレート

2007 – 2010

Novell Presentation

3.0, 7.0

OpenOffice Impress

1.1, 3.0

Oracle Open Office Impress

3.x

StarOffice Impress

5.2 – 9.0

WordPerfect Presentation

5.1 – X4

B.2.8 スプレッドシート形式

形式 バージョン

Enable Spreadsheet

3.0 – 4.5

First Choice SS

3.0まで

Framework SS

3.0

IBM Lotus Symphony Spreadsheet

1.x

Kingsoft WPS Spreadsheet

2010

Lotus 1-2-3

Millennium 9.6まで

Lotus 1-2-3 Charts (DOS版およびWindows版)

5.0まで

Lotus 1-2-3 for OS/2

2.0まで

Microsoft Excel Charts

2.x – 2007

Microsoft Excel for Macintosh

98 – 2008

Microsoft Excel for Windows

3.0 – 2010

Microsoft Excel for Windows (XMLフィルタを介したテキストのみ)

2003 XML

Microsoft Excel for Windows (.xlsb)

2007 - 2010 (バイナリ)

Microsoft Works SS for DOS

2.0

Microsoft Works SS (Macintosh版)

2.0

Microsoft Works SS (Windows版)

3.0, 4.0

Multiplan

4.0

Novell PerfectWorks Spreadsheet

2.0

OpenOffice Calc

1.1 – 3.0

Oracle Open Office Calc

3.x

PFS: Plan

1.0

Quattro Pro for DOS

5.0まで

Quattro Pro for Windows

X4まで

SmartWare Spreadsheet

SmartWare II SS

1.02

StarOffice Calc

5.2 – 9.0

SuperCalc

5.0

VP-Planner

1.0

B.2.9 テキストおよびマークアップ形式

形式 バージョン

ANSIテキスト

7および8ビット

ASCIIテキスト

7および8ビット

DOSキャラクタ・セット

EBCDIC

HTML (CSSレンダリングはサポート対象外)

1.0 – 4.0

IBM DCA/RFT

Macintoshキャラクタ・セット

リッチ・テキスト・フォーマット(RTF)

Unicodeテキスト

UTF-8

Wireless Markup Language

XML (テキストのみ)

XHTML (ファイルIDのみ)

1.0

B.2.10 ワード処理形式およびデスクトップ・パブリッシング形式

形式 バージョン

Adobe FrameMaker (MIFのみ)

3.0 – 6.0

Adobe Illustrator Postscript

レベル2

Ami

Ami Pro for OS/2

Ami Pro for Windows

2.0, 3.0

DEC DX

4.0まで

DEC DX Plus

4.0, 4.1

Enable Word Processor

3.0 – 4.5

First Choice WP

1.0, 3.0

Framework WP

3.0

Hangul

97 – 2007

IBM DCA/FFT

IBM DisplayWrite

2.0 – 5.0

IBM Writing Assistant

1.01

Ichitaro

5.0, 6.0, 8.0 – 13.0, 2004, 2010

JustWrite

3.0まで

Kingsoft WPS Writer

2010

Legacy

1.1

Lotus Manuscript

2.0まで

Lotus WordPro

9.7、96 - Millennium 9.6

Lotus Word Pro (非Win32)

97 – Millennium 9.6

MacWrite II

1.1

Mass 11

8.0まで

Microsoft Publisher (ファイルIDのみ)

2003 – 2007

Microsoft Word for DOS

4.0 – 6.0

Microsoft Word for Macintosh

4.0 – 6.0, 98 – 2008

Microsoft Word for Windows

1.0 – 2010

Microsoft Word for Windows (XMLフィルタを介したテキストのみ)

2003 XML

Microsoft Word for Windows

98-J

Microsoft WordPad

Microsoft Works WP for DOS

2.0

Microsoft Works WP (Macintosh版)

2.0

Microsoft Works WP (Windows版)

3.0, 4.0

Microsoft Write (Windows版)

1.0 – 3.0

MultiMate

4.0まで

MultiMate Advantage

2.0

Navy DIF

Nota Bene

3.0

Novell PerfectWorks Word Processor

2.0

OfficeWriter

4.0 – 6.0

OpenOffice Writer

1.1 – 3.0

Oracle Open Office Writer

3.x

PC File Doc

5.0

PFS: Write

A、B

Professional Write for DOS

1.0, 2.0

Professional Write Plus for Windows

1.0

Q&A Write

2.0, 3.0

Samna Word IV

1.0 – 3.0

Samna Word IV+

Samsung JungUm Global (ファイルIDのみ)

Signature

1.0

SmartWare II WP

1.02

Sprint

1.0

StarOffice Writer

5.2 – 9.0

Total Word

1.2

Wang IWP

2.6まで

WordMarc Composer

WordMarc Composer+

WordMarc Word Processor

WordPerfect for DOS

4.2

WordPerfect for Macintosh

1.02 – 3.1

WordPerfect for Windows

5.1 – X4

WordStar 2000 for DOS

1.0 – 3.0

Wordstar for DOS

3.0 – 7.0

Wordstar for Windows

1.0

XyWrite

Through III+