23 変換の操作
ノート:
Inbound Refineryがwin64プラットフォーム上でサービスとして実行されていると、ネイティブ変換は失敗します。これは、win64プラットフォーム上のサービスはプリンタ・サービスにアクセスできないためです。ネイティブ変換の実行時には、Inbound Refineryはサービスとして実行しないでください。
変換の様々なタイプ、実行する方法および場所、各タイプの利点を説明する追加情報については、ブログ記事「WebCenter Contentでの変換」を参照してください。
この章の内容は次のとおりです。
23.1 PDF変換の管理
Inbound Refineryでは、Oracle Outside In PDF Export (Inbound Refineryに付属)を使用してネイティブ・ファイルをPDFに直接エクスポートするか、サード・パーティ・アプリケーションを使用してネイティブ・ファイルをPostScriptに印刷し、その後サード・パーティのPDF Distillerエンジンを使用してPostScriptファイルをPDFに変換することにより、ネイティブ・ファイルをPDFに変換できます。
PDF変換を行うには、次のコンポーネントをInbound Refineryサーバーにインストールして有効にする必要があります。
コンポーネント名 | コンポーネントの説明 | 有効にするサーバー |
---|---|---|
PDFExportConverter |
Inbound Refineryで、Oracle OutsideInを使用してネイティブ・フォーマットをPDFに直接変換できます。サードパーティのツールの使用は不要です。PDFエクスポートは迅速なマルチ・プラットフォームの機能であり、同時変換を可能にします。 |
Inbound Refineryサーバー |
WinNativeConverter |
Inbound Refineryで、ネイティブ・アプリケーションまたはOutsideInXを使用して、ネイティブ・ファイルをPostScriptファイルに変換し、そのPostScriptファイルをサードパーティのDistillerエンジンを使用してPDFに変換できます。このコンポーネントを使用できるのは、Windowsプラットフォームのみです。このコンポーネントは、非推奨のPDFConverterコンポーネントで以前使用できた機能に取って代わるものです。 WinNativeConverterにより、Windowsプラットフォームのネイティブ・アプリケーションを使用する際に、すべてのPDF変換オプションに最良のレンディション品質が提供されます。これによって同時変換は可能になりません。 WinNativeConverterでは、ネイティブのOfficeアプリケーションを使用して、Inbound RefineryでWord、Excel、PowerPointおよびVisioで作成されたネイティブのMicrosoft OfficeファイルをHTMLに変換することもできます。 |
Inbound Refineryサーバー |
ノート:
Inbound Refineryがwin64プラットフォーム上でサービスとして実行されていると、ネイティブ変換は失敗します。これは、win64プラットフォーム上のサービスはプリンタ・サービスにアクセスできないためです。ネイティブ変換の実行時には、Inbound Refineryはサービスとして実行しないでください。
この項では、PDF変換の操作方法について説明します。内容は次のとおりです。
23.1.1 PDF変換に関する注意事項
PDF変換方法を選択する場合、考慮すべき要因がいくつかあります。システム・パフォーマンス(ファイルをPDFフォーマットに変換するのにかかる時間)、PDF出力の再現性(ネイティブ・ファイルの外観と書式にどれだけ厳密に一致しているか)、必要なネイティブ・アプリケーション(Inbound Refineryにより変換されたPostScriptファイルの生成に使用されるMicrosoft WordやPowerPointなど)、および変換アプリケーションに必要なプラットフォームをすべて考慮する必要があります。
変換速度が最優先事項である場合は、PDF Exportを使用して元のファイルをPDFに直接変換する方法が最速です。PDF Exportではサード・パーティのツールが不要なだけでなく、同時PDF変換が可能であり、Windows、LinuxおよびUNIXプラットフォームがサポートされます。
PDF出力の再現性が最優先事項である場合は、ネイティブ・アプリケーションを使用して元のファイルを開き、PostScriptに印刷してからPostScriptをPDFに変換する方法が最適なオプションです。ただし、この方法はWindowsプラットフォームに限定され、同時PDF変換は実行できません。
表23-1 では、変換方法を比較し、サポートされるプラットフォームを示します。
ノート:
使用する変換オプションにかかわらず、PDFはネイティブ・フォーマットのWeb対応バージョンになります。変換されたPDFはネイティブ・フォーマットの厳密な複製ではありません。フォントの置換、埋め込まれたグラフィックの複雑度と形式、表構造、サード・パーティのDistillerエンジンの問題などの多くの要因が、PDF出力とネイティブ・フォーマットとの差異の原因になります。
表23-1 PDF変換方法
変換方法 | パフォーマンス | 再現性 | サポート対象プラットフォーム | 同時PDF変換 |
---|---|---|---|---|
PDF Export |
最良 |
良 |
Windows/UNIX |
はい |
サード・パーティ・ネイティブ・アプリケーション |
良 |
最良 |
Windows |
いいえ |
23.1.2 PDF変換設定の構成
この項では、PDF変換の設定に関する次の項目について説明します。
23.1.2.1 コンテンツ・サーバーでのInbound Refineryへのジョブ送信の構成
コンテンツ・サーバーでは、ファイル拡張子、ファイル形式および変換を使用して、コンテンツ・アイテムがInbound Refineryおよびその変換アドオンによってどのように処理されるべきかを定義します。各コンテンツ・サーバーは、変換用にリファイナリにファイルを送信するように構成されている必要があります。ファイル拡張子がファイル形式と変換にマップされていると、そのタイプのファイルはコンテンツ・サーバーへのチェックイン時に変換用に送信されます。ファイル拡張子、ファイル形式および変換のマッピングを設定するには、ファイル形式ウィザードまたは構成マネージャを使用します。
コンテンツ・サーバーではデフォルトで、Inbound Refineryに必要なすべての変換が使用可能です。コンテンツ・サーバーでのファイル拡張子、ファイル形式および変換の構成の詳細は、「MIMEタイプについて」および「ファイル・タイプの管理」を参照してください。
コンテンツ・サーバーで使用可能な変換は、リファイナリで使用可能な変換と一致する必要があります。あるファイル形式がコンテンツ・サーバーで変換にマップされると、そのフォーマットのファイルは、チェックイン時に変換用に送信されます。その変換を承認するように、1つ以上のリファイナリが設定されている必要があります。リファイナリが承認し、キューに入れる変換の最大数は、「変換リスト」ページで設定します。コンテンツ・サーバーとInbound Refineryのどちらでもデフォルトで、Inbound Refineryに必要なすべての変換が使用可能です。
承認される変換の設定の詳細は、「承認される変換の設定」を参照してください。
23.1.2.3 DistillerエンジンとPDFプリンタのインストール
WinNativeConverterを使用してドキュメントをPDFに変換する場合には、DistillerエンジンとPDFプリンタを入手して、インストールおよび構成する必要があります。Outside In PDF Exportを使用してドキュメントを開き、PDFとして保存する場合には、これは不要です。
WinNativeConverterは、複数のサードパーティ・アプリケーションを使用してコンテンツ・アイテムのPDFファイルを作成できます。ほとんどの場合は、ファイルを開いて印刷する機能のあるサードパーティ・アプリケーションを使用して、ファイルがPostScriptに印刷されます。その後PostScriptファイルは、構成済のPostScriptのDistillerエンジンを使用してPDFに変換されます。WinNativeConverterがサードパーティ・アプリケーションを使用して、ファイルをPDFに直接変換できる場合もあります。
ノート:
Inbound RefineryにはDistillerエンジンは付属していません。好みのDistillerエンジンを入手する必要があります。選択したDistillerエンジンは、コマンドラインから変換を実行できなければなりません。この項の手順では、例としてAFPL Ghostscriptを使用します。これは、PostScriptからPDFへの変換と変換中または変換後のPDFファイルの最適化の両方を行う、無料の強力なDistillerエンジンです。
PDFプリンタをインストールするには:
23.1.2.4 サード・パーティ・アプリケーション設定の構成
サードパーティ・アプリケーションの設定を変更するには:
- リファイナリにログインします。
- 「変換設定」→「サードパーティ・アプリケーションの設定」を選択します。
- 「サードパーティ・アプリケーションの設定」ページで、サードパーティ・アプリケーションに対する「オプション」をクリックします。
- サード・パーティ・アプリケーションのオプションを変更します。
- 「更新」をクリックして変更を保存します。
23.2 TIFF変換の管理
TIFF変換では、TIFF (Tagged Image File Format)ファイル固有の次の機能が有効になります。
-
単一ページまたは複数ページのTIFFファイルから管理対象PDFファイルを作成します。
-
単一のZIPファイルに圧縮された複数のTIFFファイルから管理対象PDFファイルを作成します。
-
TIFFからPDFへの変換中にOCR (Optical Character Recognition)を使用します。これにより、チェックインされたTIFFファイル内のテキストを索引付けできるため、ユーザーはこれらのファイルのフルテキスト検索を実行できます。
TiffConverterコンポーネントは、Windowsでのみサポートされています。PdfCompressorによって変換可能なファイル形式および言語の詳細は、CVISION社が提供するドキュメントを参照してください。
ノート:
TiffConverterコンポーネントには、OCRを使用してTIFFからPDFへの変換を実行するためにCVISION CVista PdfCompressorが必要です。PdfCompressorはTiffConverterコンポーネントには付属していません。CVISIONからPdfCompressorを入手する必要があります。
TIFF変換を行うには、次のコンポーネントを指定されたサーバーにインストールして有効にする必要があります。
コンポーネント名 | コンポーネントの説明 | 有効にするサーバー |
---|---|---|
TiffConverter |
Inbound Refineryで、単一ページまたは複数ページのTIFFファイルをテキスト検索が可能なPDF Completeに変換できます。 |
Inbound Refineryサーバー |
TiffConverterSupport |
コンテンツ・サーバーで、TIFFからPDFへの変換をサポートできます。 |
コンテンツ・サーバー |
23.2.1 コンテンツ・サーバーでのTIFF変換用のジョブ送信の構成
コンテンツ・サーバーでは、ファイル形式および変換方法を使用して、コンテンツ・アイテムがInbound Refineryおよび変換オプションによってどのように処理されるべきかを定義します。コンテンツ・サーバー上にTiffConverterSupportコンポーネントをインストールして有効にすると、「ファイル形式ウィザード」ページに3つのTIFFConversionオプションが追加されます。
コンテンツ・アイテムがInbound Refineryによって処理されるには、そのファイル拡張子(TIFやTIFFなど)が、TIFFConversion変換方法に関連付けられたフォーマット名にマップされている必要があります。TIFF Converterに対する追加の変換オプションは自動的にはマップされません。これらは手動でマップする必要があります。次の項ではマッピングの設定方法を説明します。
23.2.1.1 TIFF変換に対するファイル形式ウィザードの使用
Inbound Refineryに対するファイル形式および変換方法は、コンテンツ・サーバーでファイル形式ウィザードを使用して管理できます。TIFFをPDFに変換するにはOCRを使用する方法と使用しない方法があります。
OCRを使用してTIFFをPDFに変換するには:
-
コンテンツ・サーバーに管理者としてログインします。
-
メイン・メニューから、「管理」→「リファイナリ管理」→「ファイル形式ウィザード」を選択します。
-
「ファイル形式ウィザード」ページでtiff、tifを選択して、「ファイル・タイプ」(変換名)フィールド・メニューの「TIFFからPDFへの変換」(TIFFConversion)を有効にします。このメニュー・アイテムを選択すると、TIFおよびTIFFファイル拡張子がimage/tiffファイル形式にマップされ、image/tiffファイル形式がTIFFConversion変換方法に関連付けられます。TIFまたはTIFFファイルはコンテンツ・サーバーにチェックインされると、リファイナリによってTIFF Converterを使用して処理され、OCRを使用してPDFに変換されます。このチェック・ボックスの選択を解除すると、image/tiffファイル形式がPASSTHRUに設定されるため、TIFおよびTIFFファイルはInbound Refineryによって処理されません。
ノート:
TIFFConversion変換方法は、TiffConverterSupportコンポーネントがインストールされて有効になっており、コンテンツ・サーバーが再起動されている場合にのみ選択できます。
-
構成マネージャを使用して
tifz
およびtiz
ファイル拡張子を追加した場合は、「ファイル形式ウィザード」ページでtifz、tizを選択して、「ファイル・タイプ」(変換名)フィールド・メニューのapplication/zipオプションを有効にできます。-
PDFに圧縮したTIFF (tifz、tiz): このメニュー・アイテムを選択すると、TIFZおよびTIZファイル拡張子がgraphic/tiff-x-compressedファイル形式にマップされ、graphic/tiff-x-compressedファイル形式がTIFFConversion変換方法に関連付けられます。TIFZまたはTIZファイルはコンテンツ・サーバーにチェックインされると、リファイナリによってTIFF Converterを使用して処理され、OCRを使用してPDFに変換されます。このチェック・ボックスの選択を解除すると、graphic/tiff-x-compressedファイル形式がPASSTHRUに設定されるため、TIFZおよびTIZファイルはInbound Refineryによって処理されません。
-
PDFに圧縮したTIFF (zip): このメニュー・アイテムを選択すると、ZIPファイル拡張子がapplication/zipファイル形式にマップされ、application/zipファイル形式がTIFFConversion変換方法に関連付けられます。ZIPファイルはコンテンツ・サーバーにチェックインされると、リファイナリによってTIFF Converterを使用して処理され、OCRを使用してPDFに変換されます。このチェック・ボックスの選択を解除すると、application/zipファイル形式がPASSTHRUに設定されるため、ZIPファイルはInbound Refineryによって処理されません。
-
-
「更新」をクリックしてすべての変更内容を保存します。
OCRを使用せずにTIFFをPDFに変換するには:
-
コンテンツ・サーバーに管理者としてログインします。
-
メイン・メニューから、「管理」→「リファイナリ管理」→「ファイル形式ウィザード」を選択します。
-
「ファイル・フォーマット・ウィザード」ページでtiffとtifを選択して、「ファイル・タイプ」(変換名)フィールド・メニューの「TIFFからPDFへの変換」(Direct PDFExport)を有効にします。このメニュー・アイテムを選択すると、TIFおよびTIFFファイル拡張子がimage/tiffファイル形式にマップされ、image/tiffファイル形式がDirect PDFExport変換方法に関連付けられます。TIFまたはTIFFファイルがコンテンツ・サーバーにチェックインされると、oit PDFExportを使用するリファイナリによって処理され、OCRを使用せずにPDFに変換されます。
ノート:
TIFFからPDF (直接エクスポート)オプションが使用されると、生成されるPDF内のメタデータのみが検索できるようになります。テキストは検索できません。
-
「更新」をクリックしてすべての変更内容を保存します。
23.2.1.2 TIFF変換に対する構成マネージャの使用
Inbound Refineryに対するファイル形式および変換方法は、コンテンツ・サーバーで構成マネージャを使用して管理できます。変更を加えるには:
-
コンテンツ・サーバーに管理者としてログインします。
-
メイン・メニューから、「管理」→「管理アプレット」を選択します。
-
「アプレット」リストから「構成マネージャ」を選択します。
構成マネージャ・アプレットが起動します。
-
「構成マネージャ」アプレットで、「オプション」→「ファイル形式」を選択します。
-
Inbound Refineryで単一のzipされていないTIFFファイル(TIFおよびTIFF)を処理する手順は次のとおりです。
-
「ファイル形式」セクションで、image/tiffファイル形式が追加され、TIFFConversion変換方法に関連付けられていることを確認します。
ノート:
TIFFConversion変換方法は、TiffConverterSupportコンポーネントがインストールされて有効になっており、コンテンツ・サーバーが再起動されている場合にのみ選択できます。
-
「ファイル拡張子」セクションで、tifとtiff ファイル拡張子が追加され、image/tiffファイル形式にマップされていることを確認します。
-
-
単一のTIFZまたはTIZファイルに圧縮されたTIFFファイルをInbound Refineryで処理するには:
-
「ファイル形式」セクションで、graphic/tiff-x-compressedファイル形式がTIFFConversion変換方法に関連付けられていることを確認します。
-
「ファイル拡張子」セクションで、tifzとtizファイル拡張子が追加され、graphic/tiff-x-compressedファイル形式にマップされていることを確認します。
-
-
単一のZIPファイルに圧縮されたTIFFファイルをInbound Refineryで処理するには:
-
「ファイル形式」セクションで、application/zipファイル形式が追加され、TIFFConversion変換方法に関連付けられていることを確認します。
-
「ファイル拡張子」セクションで、zipファイル拡張子が追加され、application/zipファイル形式にマップされていることを確認します。
-
23.2.1.3 TIFF変換におけるZipファイルの処理に関するヒント
環境によっては、ZIPファイル拡張子は複数の方法で使用されている場合があります。たとえば、次のようなファイルをチェックインすることが考えられます。
-
Inbound Refineryに、OCRを使用して単一のPDFファイルに変換させる、単一のZIPファイルに圧縮された複数のTIFFファイル。
-
処理しない、単一のZIPファイルに圧縮された複数のファイル・タイプ(ZIPファイルはネイティブ・フォーマットのまま通過させる)。
ZIPファイル拡張子を複数の方法で使用している場合は、ユーザーがチェックイン時にZIPファイルの処理方法を選択できるようにコンテンツ・サーバーを構成することをお薦めします。これを、「チェックイン時にフォーマットのオーバーライドを許可」と呼びます。このコンテンツ・サーバーの機能を有効にするには:
ノート:
アップロード・アプレットを使用して複数のファイルをチェックインする場合は、チェックインする前にファイルは単一のZIPファイルに圧縮されます。この場合も、ユーザーが複数のTIFFファイルのアップロード時にZIPファイルの処理方法を選択できるように、「チェックイン時にフォーマットのオーバーライドを許可」を選択することをお薦めします。
ヒント:
CVista PdfCompressorによって圧縮ZIPファイルからの複数のTIFFファイルがマージされる際に、入力ファイルは標準ASCII文字セットに従って辞書式順序で追加されます。
23.2.2 TIFF変換設定の構成
この項では、変換の設定に関する次の項目について説明します。
23.2.2.1 承認される変換の設定
TiffConverterコンポーネントがリファイナリにインストールされると、TIFFConversionオプションが「変換リスト」ページに追加されます。コンテンツ・サーバーによって送信されたアイテムに対してリファイナリが変換を実行するには、この変換オプションが有効になっている必要があります。
23.2.2.2 タイムアウト設定の変更
タイムアウト設定は、コンテンツ・サーバーに一般的にチェックインするTIFFファイルのサイズに必要な処理時間を反映する必要があります。これは、CPUの処理能力とTIFFの複雑度によって大きく異なります。TIFFファイルに適切なタイムアウト値を決定するには、次の作業を実行します。
-
CVista PdfCompressorのみを使用して(Inbound Refineryなしで)代表的なInbound Refineryジョブをいくつか実行して時間を測定します。
-
ドキュメント履歴情報を確認し、必要な処理時間を決定します。
-
それに応じて、Inbound Refineryのタイムアウト設定を変更します。
ノート:
TIFF Converterのタイムアウトに関する情報は、Inbound Refineryおよびエージェントのログに記録されます。
TIFFからPDFのファイル変換に対するタイムアウト設定を構成するには:
23.2.3 CVista PdfCompressorの構成
この項では、CVista PdfCompressorに関する次の項目について説明します。
23.2.3.1 PdfCompressor設定の変更
これらのオプションはCVista PdfCompressor固有です。TiffConverterコンポーネントがインストールされていない場合は、「CVista PdfCompressorのオプション」は使用できません。
PdfCompressorの設定を変更するには:
- リファイナリにログインします。
- 「変換設定」→「サードパーティ・アプリケーションの設定」を選択します。
- 「サードパーティ・アプリケーションの設定」ページで、CVista PdfCompressorに対する「オプション」をクリックします。
- 「CVista PdfCompressorのオプション」ページで、適切なテキスト・ボックスに、CVista PdfCompressor実行可能ファイルの場所へのパスを設定します。
- パラメータ・オプション・テキスト・ボックスに、パラメータ値の文字列を入力します。TiffConverterコンポーネントのインストール時に、デフォルト・オプション文字列が設定されています。
- 「更新」をクリックして設定を保存します。
ヒント:
CVista PdfCompressorによって圧縮ZIPファイルからの複数のTIFFファイルがマージされる際に、入力ファイルは標準ASCII文字セットに従って辞書式順序で追加されます。
次の推奨パラメータ文字列により、それぞれのシナリオで最適な結果が得られます。これらの設定で意図する結果が得られない場合は、設定を削除するか追加することによりこれらの文字列を変更します。これらの設定および使用可能なその他の設定の詳細は、CVista PdfCompressorに付属のオンライン・ヘルプ(特に「Appendix A: Command-Line Flags for Compression」)を参照してください。
デフォルトのCVista PdfCompressorパラメータ - OCR有効
文字列がすでに存在している(TIFF Converterの以前のバージョンを使用して文字列が設定された)場合を除いて、TiffConverterコンポーネントのインストール時にデフォルト文字列が設定されます。デフォルト文字列は、OCRを有効にしたPdfCompressorの典型的な用途に合せて最適化されています。
‐m ‐c ON ‐colorcomptype 2 ‐mrcquality 5 ‐mrcColorCompType 0 ‐linearize ‐o ‐ocrmode 1 ‐ot 120 ‐qualityc 75 ‐qualityg 75 ‐rscdwndpi 300 ‐rsgdwndpi 300 ‐rsbdwndpi 300 ‐cconc ‐ccong
CVista PdfCompressorパラメータ: 水平および垂直OCR有効
次の文字列は、OCRを有効にした典型的な用途に使用でき、同じイメージ内の垂直および水平テキストのOCR処理をサポートします(-ocrtwodを追加)。
‐m ‐c ON ‐colorcomptype 2 ‐mrcquality 5 ‐mrcColorCompType 0 ‐linearize ‐o ‐ocrmode 1 ‐ot 120 ‐ocrtwod ‐lsize 25 ‐qualityc 75 ‐qualityg 75 ‐rscdwndpi 300 ‐rsgdwndpi 300 ‐rsbdwndpi 300 ‐cconc ‐ccong
CVista PdfCompressorパラメータ - OCRなし
次の文字列は単純な変換(OCRなし)に使用できます。
‐m ‐c ON ‐colorcomptype 2 ‐mrcquality 5 ‐mrcColorCompType 0 ‐linearize ‐qualityc 75 ‐qualityg 75 ‐rscdwndpi 300 ‐rsgdwndpi 300 ‐rsbdwndpi 300 ‐cconc ‐ccong
23.2.3.2 CVista PdfCompressorのOCR言語の構成
ノート:
CVista PdfCompressorのユーザー・インタフェースで行った変更は、TIFF Converterによってコールされた場合にCVista PdfCompressorがどのように機能するかには影響しません。
デフォルトでは、CVista PdfCompressorはTIFFファイルに対してOCRを実行する際に英語のOCR辞書を使用します。ただし、CVista PdfCompressorは他のいくつかの言語でOCRを実行することもできます。
複数のOCR言語を設定し、ユーザーがチェックイン時にOCR言語を選択できるようにするには:
ノート:
次の方法を使用する場合は、「CVista PdfCompressorのオプション」ページで言語パラメータを指定したり、リファイナリに渡したりしないでください。
-
CVISION社に問い合せて、適切な最新の言語ファイルを入手します。
-
各言語に対する
lng
ファイルが必要です。 -
チェコ語、ポーランド語およびハンガリー語には
latin2.shp
ファイルも必要です。 -
ロシア語には
cyrillic.shp
ファイルも必要です。 -
ギリシャ語には
greek.shp
ファイルも必要です。 -
トルコ語には
turkish.shp
も必要です。
-
-
CVISION言語ファイルをCVistaインストール・ディレクトリに置きます。デフォルトの場所は
C:\Program Files\CVision\PdfCompressor
xx
\
(xx
はPdfCompressorのバージョン番号)です。 -
コンテンツ・サーバーに管理者としてログインします。
-
メイン・メニューから、「管理」→「管理アプレット」を選択します。
-
「アプレット」リストから「構成マネージャ」を選択します。
-
「構成マネージャ」ページで、「情報フィールド」タブをクリックします。
-
OCRLang情報フィールドが追加されている場合は、このステップを省略します。追加されていない場合は、次の手順を実行します。
-
「フィールド情報」セクションで「追加」をクリックします。
-
カスタム情報の追加ページで、「フィールド名」フィールドに「OCRLang」と入力します。これにより、CVista言語変換オプションに対する新しい情報フィールドが作成されます。
ノート:
このフィールド名は正確に入力します。
-
「OK」をクリックします。
-
カスタム情報フィールドの追加ページで、「フィールド・キャプション」フィールドに、「コンテンツ・チェックイン・フォーム」ページに表示する説明的なキャプションを入力します。たとえば、「
OCR Language
」と入力します。 -
「フィールド・タイプ」リストから「テキスト」を選択します。
-
「オプション・リストの有効化」チェック・ボックスを選択します。
-
「オプション・リスト・タイプ」リストから「Vタイプの選択リスト」を選択します。
-
「オプション・リストの使用」フィールドに
xOCRLangList
と入力します。 -
「オプション・リストの使用」フィールドの隣の「編集」をクリックします。
-
「オプションリスト」ページで、オプションとして表示するCVista OCR言語を入力します。次の言語名は有効なオプションです。
ノート:
英語の言語名または対応するネイティブ言語名(リストされている場合)のいずれかを使用できます。ただし、言語オプションは次の表に示すとおりに正確に入力する必要があります。
英語 ネイティブ Czech
-
デンマーク語
Dansk
Dutch
Nederlands
英語
-
Finnish
Suomi
French
Français
German
Deutsch
Greek
-
Hungarian
Magyar
Italian
Italiano
Norwegian
Norsk
Polish
Polski
Portuguese
Português
Russian
-
Spanish
Español
Swedish
Svenska
Turkish
-
-
「大文字小文字を区別しない」チェック・ボックスを選択します。
-
「OK」をクリックします。
-
「デフォルト値」フィールドに、デフォルトのOCR言語オプションを入力します。
-
「OK」をクリックして設定を保存し、「情報フィールド」タブに戻ります。
-
「データベース設計の更新」をクリックします。
-
-
OCRLang情報フィールドが追加されているが、言語オプション・リストやデフォルトの言語に変更を加える必要がある場合は、次の手順を実行します。
-
「フィールド情報」セクションでOCRLangを選択し、「編集」をクリックします。
-
カスタム情報の追加ページで、「オプション・リストの使用」フィールドの隣の「編集」をクリックします。
-
「オプションリスト」ページで、使用されていない任意のCVista OCR言語を削除します。
-
「OK」をクリックします。
-
「デフォルト値」フィールドに、デフォルトのOCR言語オプションを入力します。
-
「OK」をクリックして設定を保存し、「情報フィールド」タブに戻ります。
-
-
構成マネージャ・アプレットを終了します。ユーザーはTIFFファイルのチェックイン時に、設定されたいずれかのOCR言語を選択することにより、デフォルトのOCR言語をオーバーライドできます。
23.3 XML変換の管理
XML変換を行うには、次のコンポーネントを指定されたサーバーにインストールして有効にする必要があります。
コンポーネント名 | コンポーネントの説明 | 有効にするサーバー |
---|---|---|
XMLConverter |
Inbound Refineryで、プライマリWeb表示可能ファイルまたは独立したレンディションとしてFlexionDocおよびSearchMLスタイルのXMLを生成できます。また、Xalan XSLトランスフォーマを使用して、XSL変換を処理できます。 |
Inbound Refineryサーバー |
XMLConverterSupport |
コンテンツ・サーバーで、XML変換およびXSL変換をサポートできます。 |
コンテンツ・サーバー |
この項では、XML変換の管理に関する次の項目について説明します。
23.3.1 コンテンツ・サーバーでのInbound Refineryへのジョブ送信の構成
コンテンツ・サーバーでは、ファイル拡張子、ファイル形式および変換を使用して、コンテンツ・アイテムがInbound Refineryおよびその変換アドオンによってどのように処理されるべきかを定義します。各コンテンツ・サーバーは、変換用にリファイナリにファイルを送信するように構成されている必要があります。
ファイル拡張子がファイル形式と変換にマップされていると、そのタイプのファイルはコンテンツ・サーバーへのチェックイン時に変換用に送信されます。ファイル拡張子、ファイル形式および変換のマッピングは、ファイル形式ウィザードまたは構成マネージャを使用して構成できます。
コンテンツ・サーバーではデフォルトで、Inbound Refineryに必要なほとんどの変換が使用可能です。デフォルトの変換に加え、XMLConverterSupportコンポーネントのインストール時に次の変換がコンテンツ・サーバーに追加されます。
変換 | 説明 |
---|---|
FlexionXML |
FlexionDocスキーマを使用してファイルをXMLに変換するために使用します。変換リストに含まれる標準のファイル・タイプ(Word、PowerPointなど)以外のファイル・タイプに適用されます。これらの標準のファイル・タイプをFlexionDocを使用したXMLへの変換用にリファイナリに送信するには、これらのファイル形式をFlexionXML変換に再マップする必要はありません。この変換は、ファイル形式ウィザードでは使用できません。構成マネージャを使用してマップする必要があります。 |
SearchML |
SearchMLスキーマを使用してファイルをXMLに変換するために使用します。変換リストに含まれる標準のファイル・タイプ(Word、PowerPointなど)以外のファイル・タイプに適用されます。これらの標準のファイル・タイプをSearchMLを使用したXMLへの変換用にリファイナリに送信するには、これらのファイル形式をSearchML変換に再マップする必要はありません。この変換は、ファイル形式ウィザードでは使用できません。構成マネージャを使用してマップする必要があります。 |
XSLT変換 |
XML ConverterによるFlexionDocスキーマへのドキュメントの変換後、生成されたXMLはXSLT変換により、開発者が指定した別のXMLスキーマに変換されます。 |
コンテンツ・サーバーで使用可能な変換は、リファイナリで使用可能な変換と一致する必要があります。あるファイル形式がコンテンツ・サーバーで変換にマップされると、そのフォーマットのファイルは、チェックイン時に変換用に送信されます。その変換を承認するように、1つ以上のリファイナリが設定されている必要があります。
デフォルトで、Inbound Refineryに必要なほとんどの変換が使用可能です。リファイナリが承認できるデフォルトの変換に加え、XMLConverterコンポーネントのインストール時にFlexionXMLおよびSearchML変換がリファイナリに追加されます。FlexionXMLとSearchML変換はデフォルトで承認されます。
23.3.4 XSL変換の設定
Inbound Refineryは、Inbound Refineryを実行するJava仮想マシンに組み込まれたXalan XSLTプロセッサおよびSAXバリデータを使用します。変換を有効にするには、リファイナリ・サーバーにXMLConverterコンポーネントをインストールして有効にし、コンテンツ・サーバーにXMLConverterSupportコンポーネントをインストールして有効にする必要があります。
XSL変換を有効にするには:
-
リファイナリ・サーバーにログインします。
-
次のいずれかの操作を行います。
-
XMLレンディションをプライマリWeb表示可能ファイルにする場合は、「変換設定」→「プライマリWebレンディション」をクリックします。「プライマリWeb表示可能レンディション」ページが表示されたら、「XMLへの変換」を選択します。
-
XMLレンディションを追加のレンディションにする場合は、「変換設定」→「追加レンディション」をクリックします。「追加レンディション」ページが表示されたら、「フォーマットがすべてサポートされている場合XMLに変換する」を選択します。
-
-
「XMLオプション」をクリックします。
-
「XMLオプション」ページで、「XSLT変換の処理」を選択し、次のオプションから、使用するXMLスキーマを選択します。
-
FlexionDoc XMLの生成
-
SearchMLの生成
-
-
すべての変更を保存するには「更新」を、最後に保存した設定に戻すには「リセット」をクリックします。
Inbound RefineryでXSL変換を行うには、変換中に適用するXSLテンプレートがコンテンツ・サーバーにチェックインされている必要があります。XSLテンプレートをコンテンツ・サーバーにチェックインするには:
-
XSLファイルを作成します。XSLファイルは、特定のコンテンツ・タイプのXMLファイルが新しいXMLファイルにどのように変換されるかを指定します。DTDやスキーマを検証用に指定し、コンテンツ・サーバーに格納できますが、これは必須ではありません。
-
XSLファイルをコンテンツ・サーバーにチェックインし、コンテンツ・タイプに関連付けます。
-
コンテンツ・チェックイン・フォームで、「タイプ」リストから「コンテンツ・タイプ」を選択します。
-
次の表記規則に従ってコンテンツIDを入力します。
コンテンツ・タイプ
.xsl
たとえば、コンテンツ・タイプが
「ドキュメント」
の場合は、documents.xslと入力します。 -
「プライマリ・ファイル」としてXSLファイルを入力します。
-
「セキュリティ・グループ」が、XSLファイルに関連付けられているコンテンツ・サーバー内のDTD/スキーマ・ファイルおよびコンテンツ・サーバーにチェックインされるネイティブ・ファイルと一致していることを確認します。
-
「チェックイン」をクリックします。
このコンテンツ・タイプでファイルがチェックインされ、XML ConverterによってFlexionDoc/SearchML XMLファイルが生成されるかチェックインされたファイルがXMLである場合、このXSLファイルが新しいXMLドキュメントへのXSL変換に使用されます。
-
-
XMLに後処理するコンテンツ・タイプごとに、これらのステップを繰り返します。
23.3.4.1 XSLTエラー
検証が失敗すると、Inbound RefineryはSAX検証エンジンからエラーを収集し、hcspエラー・ページを作成し、そのページをコンテンツ・サーバーにチェックインしようとします。
リファイナリからエラー・ページをチェックインするには、Inboard Refineryに、コンテンツ・プロバイダへの送信プロバイダを手動で設定します。Inbound Refineryプロバイダの名前はエージェント名に一致する必要があります。たとえば、Inbound Refineryの名前がproduction_ibr
であり、production_cs
という名前のコンテンツ・サーバーに対してファイルを変換している場合、production_ibr
Inbound Refinery上にproduction_cs
という名前の送信プロバイダを作成する必要があります。
XSL変換の失敗に関する通知を受け取るように基準ワークフローを設定するには:
- メイン・メニューから、「管理」→「管理アプレット」を選択します。
- 「アプレット」リストから「ワークフロー管理」を選択します。
- XSLT変換の失敗を通知するための基準ワークフローを追加します。
- 次のプロパティでワークフロー・ステップを追加します。
-
ユーザー: 通知する必要があるユーザーを指定します。
-
終了条件: 「レビューアの最低必要人数」を選択し、値を0に設定します。
-
イベント: 「開始時」イベントに対して、次のカスタム・スクリプトの式を追加します。
<$if dDocTitle like "*XSLT Error"$> <$else$> <$wfSet("wfJumpEntryNotifyOff", "1")$> <$wfExit(0,0)$> <$endif$>
ワークフローの使用の詳細は、「ワークフローの管理」を参照してください。
23.4 Microsoft OfficeファイルのHTMLへの変換
Inbound Refineryは、WindowsシステムにインストールされたネイティブMicrosoft Officeアプリケーションを使用して、ネイティブMicrosoft OfficeファイルをHTMLに変換できます。コンテンツ・サーバーはWindowsまたはUNIXプラットフォームのいずれにでもインストールできますが、Microsoft OfficeからHTMLへの変換が機能するためには、Inbound RefineryはMicrosoft Officeネイティブ・アプリケーションがインストールされているWindowsシステム上で構成されている必要があります。
HTML変換は、ネイティブ・アプリケーションでMicrosoft Officeファイルを自動的に開き、HTMLページとして保存し、HTML出力をコンテンツ・サーバーに返すための圧縮ZIPファイルにまとめます。
HTML変換では次のタイプのファイルを処理できます。
-
Microsoft Word 2003から2010
-
Microsoft Excel 2003から2010
-
Microsoft PowerPoint 2003から2010
-
Microsoft Visio 2007
WinNativeConverterとInbound Refineryとの連携が有効になっている場合、コンテンツ・サーバーにチェックインされたネイティブMicrosoft Officeファイルは変換用にInbound Refineryに送信されます。Inbound Refineryは、ネイティブMicrosoft Officeアプリケーションを使用したファイルのHTMLへの変換処理を自動化します。単一のHTMLページがコンテンツ・サーバーに返されると、それがWeb表示可能ファイルとして使用されます。変換により複数のHTMLページが生成されると、次のファイルがコンテンツ・サーバーに返されます。
-
プライマリWeb表示可能レンディションであるHCSPページ
-
OfficeアプリケーションからのHTML出力を含むZIPファイル
-
オプションで、ネイティブMicrosoft Officeファイルのサムネイル・レンディション
Inbound Refineryによって複数のHTMLページに変換されたドキュメントに対するコンテンツ・サーバー内のWeb表示可能リンクをユーザーがクリックすると、HCSPページによりサーバーがHTMLレンディションにリダイレクトされます。
Microsoft OfficeからHTMLへの変換を行うには、次のコンポーネントを指定されたサーバーにインストールして有効にする必要があります。
コンポーネント名 | コンポーネントの説明 | 有効にするサーバー |
---|---|---|
WinNativeConverter |
Inbound Refineryで、ネイティブのOfficeアプリケーションを使用して、Word、Excel、PowerPointおよびVisioで作成されたネイティブのMicrosoft OfficeファイルをHTMLに変換できます。 |
Inbound Refineryサーバー |
MSOfficeHtmlConverterSupport |
コンテンツ・サーバーで、Inbound RefineryによってネイティブのMicrosoft OfficeからHTMLに変換されたファイルが、ZIPファイルでコンテンツ・サーバーに返されることをサポートできます。コンテンツ・サーバーには、ZipRenditionManagementコンポーネントがインストールされている必要があります。 |
コンテンツ・サーバー |
ZipRenditionManagement |
コンテンツ・サーバーで、Inbound Refineryによって作成されてZIPファイルに圧縮されたHTMLのレンディションにアクセスできます。 |
コンテンツ・サーバー |
この項では、Microsoft OfficeからHTMLへの変換を使用するようにコンテンツ・サーバーを構成する方法について説明します。
23.4.1 コンテンツ・サーバーでのHTML変換用のジョブ送信の構成
WinNativeConverterがリファイナリにインストールされると、Word HTML、PowerPoint HTML、Excel HTMLおよびVisio HTMLオプションが「変換リスト」ページに追加されます。コンテンツ・サーバーによって送信されたアイテムに対してリファイナリが変換を実行するには、この変換オプションが有効になっている必要があります。コンテンツ・サーバーでは、ファイル形式および変換方法を使用して、コンテンツ・アイテムがInbound Refineryおよび変換オプションによってどのように処理されるべきかを定義します。
Microsoft OfficeドキュメントがInbound Refineryによって処理されるには、そのファイル拡張子が、HTML変換方法に関連付けられたフォーマット名にマップされている必要があります。HTML変換に対する追加の変換オプションは自動的にはマップされません。これらは手動でマップする必要があります。これらは、ファイル形式ウィザードまたは構成マネージャ・アプレットを使用して設定できます。構成マネージャ・アプレットでは、どのファイル拡張子をどの変換オプションにマップするかについて、より細かく制御できます。詳細は、次の各項を参照してください。
23.4.1.1 Microsoft Office変換に対するファイル形式ウィザードの使用
Inbound Refineryに対するファイル形式および変換方法は、コンテンツ・サーバーでファイル形式ウィザードを使用して管理できます。変更を加えるには:
23.4.1.2 Microsoft Office変換に対する構成マネージャの使用
Inbound Refineryに対するファイル形式および変換方法は、コンテンツ・サーバーで構成マネージャを使用して管理できます。変更を加えるには:
- コンテンツ・サーバーに管理者としてログインします。
- メイン・メニューから、「管理」→「管理アプレット」を選択します。
- 「アプレット」リストから「構成マネージャ」を選択します。
- 「オプション」→「ファイル形式」を選択します。
- 「フォーマット」列から変換するOfficeドキュメント・タイプに対するアプリケーション・フォーマットを選択します。たとえば、Microsoft Wordに対してapplication/mswordを選択します。
- 「編集」をクリックします。
- 「ファイル形式の編集」ダイアログで、「変換」リストから、選択したOfficeドキュメント・フォーマットに適切なHTML変換オプションを選択します。たとえば、application/mswordに対して変換オプションWord HTMLを選択します。
- 「OK」をクリックします。
- HTMLに変換するすべてのMicrosoft Officeフォーマットに対して、これらのステップを繰り返します。
- 完了したら、「閉じる」をクリックして「ファイル形式」ページを閉じ、続いて構成マネージャを終了します。
- コンテンツ・サーバーとInbound Refineryを再起動します。