OpenCSV標準について
ファイル・エクストラクタの抽出サービスのCSVパーサーは、Opencsvを使用します。 extractserviceで処理されるcsvファイルは、Opencsv標準に準拠している必要があります。
「Opencsvのファイル標準」を参照してください。 CSVパーサーに加えて、extractサービスはRFC4180仕様に準拠するファイルをサポートします。 RFC 4180 CSVパーサーでは、.CSVファイル内に単一行および複数行のデータを取り込むことができます。 RFC 4180パーサーは、最大99個の改行を含むデータ・レコードの取込みをサポートしています。 RFC 4180仕様の詳細については、「カンマ区切り値(CSV)ファイルの共通書式およびMIMEタイプ」を参照してください。
次のことに注意してください:
- 特殊文字を使用する場合:
- 特殊文字のない文字列の場合、引用符はオプションです。
- 特殊文字を含む文字列の場合、引用符は必須です。 たとえば、文字列にカンマがある場合は、「Abc、123」などの文字列に引用符を使用する必要があります。
- エスケープ(バックスラッシュ文字)はオプションです。
- バックスラッシュ文字は常にエスケープする必要があります。 たとえば、データにバックスラッシュがある場合は、次の形式を使用: "二重バックスラッシュ(\\) abc"。
- 引用符で囲まれた文字列内の引用符を管理するには、引用符内でバックスラッシュを使用: "Asd " asd".
- Opencsvパーサーでは、次の使用可能な文字のいずれかをデリミタとして選択できます:
- カンマ(,)
- Semi-colon ( ; )
- パイプ(|)
- タブ()