機械翻訳について

OpenCSV標準について

ファイル・エクストラクタの抽出サービスのCSVパーサーは、Opencsvを使用します。 extractserviceで処理されるcsvファイルは、Opencsv標準に準拠している必要があります。

「Opencsvのファイル標準」を参照してください。 CSVパーサーに加えて、extractサービスはRFC4180仕様に準拠するファイルをサポートします。 RFC 4180 CSVパーサーでは、.CSVファイル内に単一行および複数行のデータを取り込むことができます。 RFC 4180パーサーは、最大99個の改行を含むデータ・レコードの取込みをサポートしています。 RFC 4180仕様の詳細については、「カンマ区切り値(CSV)ファイルの共通書式およびMIMEタイプ」を参照してください。

次のことに注意してください:
  • 特殊文字を使用する場合:
    • 特殊文字のない文字列の場合、引用符はオプションです。
    • 特殊文字を含む文字列の場合、引用符は必須です。 たとえば、文字列にカンマがある場合は、「Abc、123」などの文字列に引用符を使用する必要があります。
    • エスケープ(バックスラッシュ文字)はオプションです。
    • バックスラッシュ文字は常にエスケープする必要があります。 たとえば、データにバックスラッシュがある場合は、次の形式を使用: "二重バックスラッシュ(\\) abc"。
    • 引用符で囲まれた文字列内の引用符を管理するには、引用符内でバックスラッシュを使用: "Asd " asd".
  • Opencsvパーサーでは、次の使用可能な文字のいずれかをデリミタとして選択できます:
  • カンマ(,)
  • Semi-colon ( ; )
  • パイプ(|)
  • タブ()