15 ORACLE_LOADERアクセス・ドライバ

ORACLE_LOADERアクセス・ドライバは、ORACLE_LOADER型の外部表に固有のアクセス・パラメータのセットを提供します。

アクセス・ドライバのデフォルトの動作を変更するためにアクセス・パラメータを使用できます。アクセス・ドライバで指定する情報により、データ・ソースのデータが、外部表の定義と一致するように処理されます。

詳細は次のトピックを参照してください。

これらの項目内の情報を正しく使用するには、使用するプラットフォームのデータ・ファイルのファイル形式およびレコード形式(文字セット、フィールドのデータ型など)についての知識が必要です。また、外部表を作成し、その外部表に問合せを実行するためのSQLの知識も必要です。

SQL*LoaderでEXTERNAL_TABLE=GENERATE_ONLYパラメータを使用すると、任意のSQL*Loader制御ファイルに適正なアクセス・パラメータを取得できます。GENERATE_ONLYを指定すると、制御ファイルに記述されているとおり、SQL*Loaderログ・ファイル内の外部表を使用してロードを行うために必要なすべてのSQL文が書き込まれます。これらのSQL文は、編集およびカスタマイズできます。実際のロードは、SQL*Loaderを使用せずに、SQL*Plusでこれらの文を実行して、後で行うことができます。

関連項目:

ノート:

  • 章の後半で説明されているその他の構文を使用しなければ、わかりにくい場合があります。構文によって行われる処理が明確でない場合は、先に進み、その説明を参照してください。

  • ここで示す例は、外部表の場合のデータ・ファイル内容のサンプルを伴うCREATE TABLE...ORGANIZATION EXTERNAL文の例で、その内容は、CREATE TABLE文の一部ではなく、完全な例です。

  • 外部表アクセス・パラメータにおいて列名や表名などの識別子が指定される場合、特定の値はアクセス・パラメータ・パーサーによって予約語とみなされます。予約語を識別子として使用するには、二重引用符で囲む必要があります。詳細は、「ORACLE_LOADERアクセス・ドライバの予約語」を参照してください。

15.1 access_parameters句

access_parameters句には、コメント、レコード形式およびフィールド形式の情報が含まれています。

データ・ソースのデータの記述は外部表の定義とは別です。これは、次のことを意味します。

  • ソース・ファイルに含まれるフィールドの数は、外部表の列数と異なる場合があります。

  • データ・ソースのフィールドのデータ型は、外部表の列のデータ型と異なる場合があります。

アクセス・ドライバによって、データ・ソースのデータが、外部表の定義と一致するように処理されます。

access_parameters句の構文は次のとおりです。

ノート:

これらのアクセス・パラメータは、SQL文のCREATE TABLE...ORGANIZATION EXTERNALopaque_format_specとしてまとめて参照されます。

関連項目:

コメント

コメントは、2つのハイフンで始まり、その後にテキストが続く行です。コメントは、次の例のように、アクセス・パラメータより前に位置する必要があります。

--This is a comment.
--This is another comment.
RECORDS DELIMITED BY NEWLINE

二重ハイフンの右側のすべてのテキストは行末まで無視されます。

record_format_info

record_format_info句はオプションであり、レコード(形式など)、データの文字セット、およびレコードをロードの対象外とする規則についての情報が含まれます。構文の詳細は、「record_format_info句」を参照してください。

field_definitions

field_definitions句を使用して、データ・ファイルのフィールドを指定します。データ・ファイルのフィールドが外部表の列と同じ名前の場合、フィールドのデータはその列に使用されます。構文の詳細は、「field_definitions句」を参照してください。

column_transforms

column_transforms句はオプションであり、データ・ファイルの列に直接マップされない外部表の列のロード方法を記述するために使用します。NULLCONSTANTCONCATおよびLOBFILE変換を使用して行います。構文の詳細は、「column_transforms句」を参照してください。

15.2 record_format_info句

record_format_info句には、レコード(形式など)、データの文字セットおよびレコードをロード対象とする規則についての情報が含まれます。

PREPROCESSOR句を使用すると、ユーザーが用意したプログラムの名前を指定し、そのプログラムを実行して、ORACLE_LOADERアクセス・ドライバで解析できるようにデータ・ファイルの内容を変更できます。

record_format_info句はオプションです。デフォルト値は、句が指定されているかどうかにかかわらず、RECORDS DELIMITED BY NEWLINEです。record_format_info句の構文は次のとおりです。

et_record_spec_options句を使用すると、追加の書式情報をオプションで指定できます。書式オプションは必要な数だけ任意の順序で指定できます。オプションの構文は次のとおりです。

次のet_output_filesの図に、不良ファイル、廃棄ファイルおよびログ・ファイルを指定するオプションを示します。これらの句ごとに、ディレクトリ・オブジェクト名またはファイル名(あるいはその両方)を指定する必要があります。

15.2.1 FIXED長

FIXED句を使用して、すべてのレコードをバイト単位の固定長として識別します。FIXEDレコードに対して指定したサイズには、改行などのレコード終了文字を含める必要があります。他のレコード型と比較して、固定長レコードの固定長フィールドは、アクセス・ドライバを最も簡単に処理できるフィールドおよびレコード形式です。

次に、FIXEDレコードが使用されている例を示します。データ・ファイルの各レコードの末尾に1バイトの改行文字があるとします。その後に、ロードが可能なデータ・ファイルのサンプルを示します。

CREATE TABLE emp_load (first_name CHAR(15), last_name CHAR(20), year_of_birth CHAR(4))
  ORGANIZATION EXTERNAL (TYPE ORACLE_LOADER DEFAULT DIRECTORY ext_tab_dir
                         ACCESS PARAMETERS (RECORDS FIXED 20 FIELDS (first_name CHAR(7),
                                                                    last_name CHAR(8),
                                                                    year_of_birth CHAR(4)))
                         LOCATION ('info.dat'));

Alvin  Tolliver1976
KennethBaer    1963
Mary   Dube    1973

15.2.2 VARIABLEサイズ

VARIABLE句を使用して、レコードを可変長として識別します。各レコードの先頭に、レコードのバイト数を示す文字列が付きます。カウント・フィールドを含む文字列の長さは、VARIABLEパラメータの後に続くサイズ引数となります。サイズは、文字数ではなく、バイト数で表されることに注意してください。レコードの先頭の数値にレコード終了文字の分が含まれる必要があります。ただし、カウント・フィールド自身のサイズは含まれません。レコード終了文字のバイト数は、ファイルの作成方法および作成時のプラットフォームによって異なります。

次に、VARIABLEレコードが使用されている例を示します。データ・ファイルの各レコードの末尾に1バイトの改行文字があるとします。その後に、ロードが可能なデータ・ファイルのサンプルを示します。

CREATE TABLE emp_load (first_name CHAR(15), last_name CHAR(20), year_of_birth CHAR(4))
  ORGANIZATION EXTERNAL (TYPE ORACLE_LOADER DEFAULT DIRECTORY ext_tab_dir
                         ACCESS PARAMETERS (RECORDS VARIABLE 2 FIELDS TERMINATED BY ','
                                             (first_name CHAR(7),
                                              last_name CHAR(8),
                                              year_of_birth CHAR(4)))
                         LOCATION ('info.dat'));

21Alvin,Tolliver,1976,
19Kenneth,Baer,1963,
16Mary,Dube,1973,

15.2.3 DELIMITED BY

DELIMITED BY句を使用して、レコードの終わりを識別する文字を指定します。

DELIMITED BY NEWLINEを指定する場合、実際に使用される値はプラットフォームに依存します。UNIXプラットフォームでは、NEWLINEは「\n」です。Windowsオペレーティング・システムでは、NEWLINEは「\r\n」とみなされます。

DELIMITED BY stringを指定する場合、stringは、テキストまたは一連の16進数のいずれかになります。16進数の場合は、OXまたはXで開始して引用符で囲みます。テキストの場合は、データ・ファイルの文字セットに変換され、その結果がレコードの境界の識別に使用されます。詳細は、「string」を参照してください。

次の条件を満たす場合は、デリミタの識別には16進数字を使用する必要があります。

  • アクセス・パラメータの文字セットがデータ・ファイルの文字セットとは異なる場合。

  • 区切り文字列中にデータ・ファイルの文字セットに変換できない文字がある場合。

16進数字はバイトに変換されます。16進文字列では文字セットの変換は実行されません。

ファイルの終わりがレコード終了記号の前で検出された場合、アクセス・ドライバは、終了記号が検出された場合と同様に、ファイルの終わりまでの処理されていないすべてのデータをレコードの部分とみなします。

ノート:

デリミタ付きのレコードには、VARCHARおよびVARRAWのバイナリ数値を含むバイナリ・データを含めないでください。バイナリ・データを含めると、そのバイナリ・データがデリミタの検索中に文字として解釈されるため、エラーまたは破損が発生します。

次に、DELIMITED BYレコードの使用例を示します。

CREATE TABLE emp_load (first_name CHAR(15), last_name CHAR(20), year_of_birth CHAR(4))
  ORGANIZATION EXTERNAL (TYPE ORACLE_LOADER DEFAULT DIRECTORY ext_tab_dir
                         ACCESS PARAMETERS (RECORDS DELIMITED BY '|' FIELDS TERMINATED BY ','
                                              (first_name CHAR(7),
                                               last_name CHAR(8),
                                               year_of_birth CHAR(4)))
                         LOCATION ('info.dat'));

Alvin,Tolliver,1976|Kenneth,Baer,1963|Mary,Dube,1973

15.2.4 XMLTAG

ORACLE_LOADERアクセス・ドライバのXMLTAG句を使用して、XMLドキュメントからのサブドキュメントのロードに使用するXMLタグを指定できます。このアクセス・ドライバでは、データ・ファイル内でこれらのタグに囲まれたドキュメントを検索し、それらのドキュメントを個別の行として外部表にロードします。

XMLTAG句は、1つ以上の文字列のリストを受け入れます。これらの文字列を使用して、ORACLE_LOADERがデータ・ファイル内のサブドキュメントを検索するときに使用するタグが作成されます。アクセス・パラメータで指定するタグには、デリミタ"<"および">"は含めません。

ORACLE_LOADERアクセス・ドライバは、XMLTAG句にリストされたタグが最初に出現する箇所を、ファイルの最初から検索します。一致が見つかると、対応する閉じタグを検索します。たとえば、タグが"ORDER_ITEM"の場合、ORACLE_LOADERは、ファイルの先頭からテキスト文字列"<ORDER_ITEM>"を検索します。"<ORDER_ITEM>"が出現する箇所が見つかると、次に、"</ORDER_ITEM>"を検索します。タグ<ORDER_ITEM>と</ORDER_ITEM>の間のすべての内容が、ドキュメントから行にロードされる部分となります。その後、ORACLE_LOADERは、閉じタグの後の最初の文字から、次に出現するタグを検索します。

ORACLE_LOADERアクセス・ドライバは、タグ名と一致する要素に対してXMLドキュメントを解析するのではなく、単に、テキスト・ファイル全体の文字列検索を実行します。外部表がパラレルにアクセスされている場合、ORACLE_LOADERは、各セクションが独立して読み取られるように、大きいファイルを分割します。データ・ファイルのセクションの読取りを開始するとき、XMLTAGで指定されたタグの1つの検索を開始します。セクションの終わりに到達したが、まだ一致する終了タグを検索している場合、ORACLE_LOADERは、一致する終了タグが見つかるまで引き続き次のセクションを読み取ります。

XMLTAGの使用時の制限事項

  • 要素が同じ要素のドキュメントの内側にネストされているデータ・ファイルは、XMLTAG句を使用してロードすることはできません。たとえば、XMLTAG(‘FOO’)を使用してロードするデータ・ファイルに次のデータが含まれているとします。

    <FOO><BAR><FOO></FOO></BAR></FOO>

    この場合、ORACLE_LOADERでは最初の<FOO>と最初の</FOO>の間にあるすべての内容をドキュメントとして抽出しますが、これは有効なドキュメントを構成していません。

    同様に、XMLTAG(“FOO”,”BAR”)を指定した場合、データ・ファイルに次のデータが含まれているとします。

    <FOO><BAR></BAR></FOO>

    この場合は、<BAR></BAR>がロードされますが、"FOO"のドキュメントとしてロードされます。

  • 抽出されるサブドキュメントの大きさの制限は、READSIZEアクセス・パラメータによって決定されます。ORACLE_LOADERアクセス・ドライバがREADSIZEよりも大きいサブドキュメントを検出した場合、エラーが返されます。

XMLTAG句の使用例

たとえば、次のようにして外部表T_XTを作成するとします。

CREATE TABLE "T_XT"
(
  "C0" VARCHAR2(2000)
)
ORGANIZATION external
(
  TYPE oracle_loader
  DEFAULT DIRECTORY DMPDIR
  ACCESS PARAMETERS
  (
    RECORDS
    XMLTAG ("home address", "work address"," home phone ")
    READSIZE 1024
    SKIP 0
    FIELDS NOTRIM
    MISSING FIELD VALUES ARE NULL
    (
      "C0" (1:2000) CHAR(2000)
    )
  )
  location
  (
    't.dat'
  )
)REJECT LIMIT UNLIMITED
/
exit;

データ・ファイルの内容が次のとおりだとします。

<first name>Lionel</first name><home address>23 Oak St, Tripoli, CT</home address><last name>Rice</last name>

この場合、次のSQL問合せを実行できます。

SQL> SELECT C0 FROM T_XT;

C0
------------------------------------------------------------------
<home address>23 Oak St, Tripoli, CT</home address>

15.2.5 CHARACTERSET

CHARACTERSET string句を使用して、データ・ファイルの文字セットを識別します。文字セットを指定しない場合、データベースのデフォルトの文字セットが使用されます。詳細は、「string」を参照してください。

ノート:

クライアントのNLS環境変数設定は、データベースに使用される文字セットに影響しません。

関連項目:

Oracleでサポートされる文字セットのリストは、『Oracle Databaseグローバリゼーション・サポート・ガイド』を参照してください。

15.2.6 EXTERNAL VARIABLE DATA

ノート:

EXTERNAL VARIABLE DATA句がOracle SQL Connector for Hadoop Distributed File System (HDFS)とともに使用する場合にのみ、有効です。Oracle SQL Connector for HDFSの詳細は、『Oracle Big Data Connectorsユーザーズ・ガイド』を参照してください。

EXTERNAL VARIABLE DATA句を指定し、ORACLE_LOADERアクセス・ドライバを使用してORACLE_DATAPUMPアクセス・ドライバで生成されたダンプ・ファイルをロードします。構文は次のとおりです。

EXTERNAL VARIABLE DATA句で使用できるアクセス・パラメータは、次のとおりです。

次の例では、EXTERNAL VARIABLE DATA句を使用しています。この例では、deptxt1.dmpダンプ・ファイルが事前にORACLE_DATAPUMPアクセス・ドライバで生成されていることを想定しています。PREPROCESSORパラメータで指定されたtkexcatプログラムは、入力データを処理するためにユーザーが用意したプログラムです。

CREATE TABLE deptxt1
(
   deptno  number(2),
   dname   varchar2(14),
   loc     varchar2(13)
)
ORGANIZATION EXTERNAL
(
  TYPE ORACLE_LOADER
  DEFAULT DIRECTORY dpump_dir
  ACCESS PARAMETERS
  (
    EXTERNAL VARIABLE DATA
    LOGFILE 'deptxt1.log'
    READSIZE=10000
    PREPROCESSOR tkexcat
  )
  LOCATION ('deptxt1.dmp')
)
REJECT LIMIT UNLIMITED
;

15.2.7 PREPROCESSOR

注意:

PREPROCESSOR句を使用するときに考慮する必要があるセキュリティ上の注意事項があります。詳細は、『Oracle Databaseセキュリティ・ガイド』を参照してください。

ロードするファイルにORACLE_LOADERアクセス・ドライバでサポートしていない形式のデータ・レコードが含まれる場合は、PREPROCESSOR句を使用して、ユーザーが用意するプリプロセッサ・プログラムを指定し、そのプログラムをすべてのデータ・ファイルに対して実行します。プログラムの指定は、引数を使用する場合にシェル・スクリプトに入れる必要があります(「file_spec」の説明を参照)。

プリプロセッサ・プログラムは、アクセス・ドライバがサポートするレコード形式にデータを変換し、変換したレコード・データを標準出力(stdout)に書き出します。アクセス・ドライバはそのデータを入力として読み取ることになります。PREPROCESSOR句の構文は次のとおりです。

directory_spec

各データ・ファイルに対して実行するプリプロセッサ・プログラムの名前が含まれるディレクトリ・オブジェクトを指定します。外部表にアクセスするユーザーには、使用されるディレクトリ・オブジェクトのEXECUTE権限が必要です。directory_specを省略した場合は、外部表に対して指定されたデフォルトのディレクトリが使用されます。

注意:

セキュリティ上の理由から、プリプロセッサ・プログラムは、デフォルト・ディレクトリでなく別のディレクトリを使用して格納することをお薦めします。プリプロセッサ・プログラムが格納されているディレクトリには別のファイルを保管しないでください。

プリプロセッサ・プログラムは、ディレクトリ・オブジェクト内に存在する必要があります。これは、セキュリティ上の理由から、プログラムへのアクセスを制御できるようにするためです。OSシステム管理者は、そのディレクトリ・オブジェクトに対応するディレクトリを作成し、OSユーザーORACLEがそのディレクトリへのアクセス権を持っていることを確認する必要があります。DBAは、承認されたユーザーのみが、ディレクトリ・パスに関連付けられたディレクトリ・オブジェクトにアクセスできるようにする必要があります。ディレクトリ・オブジェクトのアクセス権は、複数のデータベース・ユーザーに付与できますが、そのディレクトリ内のプリプロセッサを実行できるのはEXECUTE権限を持つユーザーのみです。ディレクトリ・オブジェクトへの読取り/書込み権限を持つ既存データベース・ユーザーでは、前処理の機能を使用できません。DBAがディレクトリ・オブジェクトのEXECUTE権限をどのユーザーにも付与しなければ、プリプロセッサの使用を禁止できます。

関連項目:

EXECUTE権限を付与する方法については、『Oracle Database SQL言語リファレンス』を参照してください。

file_spec

プリプロセッサ・プログラムの名前です。この名前は、使用されているディレクトリ・オブジェクト(directory_specまたは外部表のデフォルト・ディレクトリのいずれか)に関連付けられたパス名の後ろに追加されます。file_specに絶対ディレクトリ・パスや相対ディレクトリ・パスを含めることはできません。

プリプロセッサ・プログラムに引数(gunzip -cなど)が必要な場合は、プログラム名とその引数を実行可能シェル・スクリプト(Windowsオペレーティング・システムではバッチ(.bat)・ファイル)で指定する必要があります。次の各項で説明するように、シェル・スクリプトとバッチ・ファイルには特定の要件があります。

オペレーティング・システム・ディレクトリに正しいバージョンのプリプロセッサ・プログラムがあることを必ず確認してください。

シェルやバッチ・ファイルを使用しないで、PREPROCESSOR句を指定する例を次に示します。

SQL> CREATE TABLE xtab (recno varchar2(2000))
     2    ORGANIZATION EXTERNAL (
     3    TYPE ORACLE_LOADER
     4    DEFAULT DIRECTORY data_dir
     5    ACCESS PARAMETERS (
     6    RECORDS DELIMITED BY NEWLINE
     7    PREPROCESSOR execdir:'zcat'
     8    FIELDS (recno char(2000)))
     9    LOCATION ('foo.dat.gz'))
   10    REJECT LIMIT UNLIMITED;
Table created.

Linuxオペレーティング・システムにおけるPREPROCESSOR句でのシェル・スクリプトの使用

  • シェル・スクリプトは、directory_specに存在する必要があります。

  • gunzipなどのシステム・コマンドのフルパス名を指定する必要があります。

  • プリプロセッサのシェル・スクリプトには、EXECUTE権限が必要です。

  • 外部表のLOCATION句にリストされているデータ・ファイルは、$1で参照する必要があります。

次の例は、外部表作成時のPREPROCESSOR句でのシェル・スクリプトの指定方法を示しています。

SQL> CREATE TABLE xtab (recno varchar2(2000))
     2    ORGANIZATION EXTERNAL (
     3    TYPE ORACLE_LOADER
     4    DEFAULT DIRECTORY data_dir
     5    ACCESS PARAMETERS (
     6    RECORDS DELIMITED BY NEWLINE
     7    PREPROCESSOR execdir:'uncompress.sh'
     8    FIELDS (recno char(2000)))
     9    LOCATION ('foo.dat.gz'))
   10    REJECT LIMIT UNLIMITED;
Table created.

Windowsオペレーティング・システムにおけるPREPROCESSOR句でのバッチ・ファイルの使用

  • バッチ・ファイルは、directory_specに存在する必要があります。

  • gunzipなどのシステム・コマンドのフルパス名を指定する必要があります。

  • プリプロセッサのバッチ・ファイルには、EXECUTE権限が必要です。

  • バッチ・ファイルの最初の行には、@echo offが含まれている必要があります。これが必要になるのは、バッチ・ファイルが実行されるとき、デフォルトでは実行中のコマンドが表示されるため、このことによって、エコー処理されたコマンドが外部表のアクセス・ドライバへの入力として処理されるという意図しない副次的な影響を回避するためです。

  • location句からの入力を表すには、%1を使用する必要があります。(これは、location句が$1により参照されるLinuxスタイルのシェル・スクリプトとは異なります。)

  • バッチ・ファイル内のすべての実行可能ファイル(次の例ではsed.exe)のフルパスを指定する必要があります。また、すべてのWindowsインストールにMKSツールキットが存在するとはかぎらないため、sed.exeなどのコマンドを使用できない場合があることにも注意してください。

    Windowsで使用するバッチ・ファイルは、.batまたは.cmdの拡張子を持つ必要があります。そうでない場合(たとえば、プリプロセッサ・スクリプトをsed.shとして指定しようとした場合)は、次のエラーが発生します。

    SQL> select * from foo ;
    select * from foo
    *
    ERROR at line 1:
    
    ORA-29913: error in executing ODCIEXTTABLEFETCH callout
    ORA-29400: data cartridge error
    KUP-04095: preprocessor command
    C:/Temp\sed.sh encountered error
    "CreateProcess Failure for Preprocessor:
    C:/Temp\sed.sh, errorcode: 193

Windowsでバッチ・ファイルを外部表のPREPROCESSORオプションとともに使用する単純な例を、次に示します。この例では、バッチ・ファイルはストリーム・エディタ(sed.exe)ユーティリティを使用して、入力データの単純な変換を実行します。

create table deptxt
(
   deptno char(2),
   dname char(14),
   loc char(13)
)
organization external
(
type ORACLE_LOADER
default directory def_dir1
access parameters
(
   records delimited by newline
   badfile 'deptxt.bad'
   logfile 'deptxt.log'
   preprocessor exec_dir:'sed.bat'
   fields terminated by ','
   missing field values are null
)
   location ('deptxt.dat')
)
reject limit unlimited ;

select * from deptxt ;

Where deptxt.dat contains:

10,ACCOUNTING,NEW YORK
20,RESEARCH,DALLAS
30,SALES,CHICAGO
40,OPERATIONS,BOSTON

プリプロセッサ・プログラムsed.batの内容は次のとおりです。

@echo off
c:/mksnt/mksnt/sed.exe -e 's/BOSTON/CALIFORNIA/' %1

PREPROCESSORオプションは、入力データ(deptxt.dat)をsed.batに渡します。次にdeptxt表から選択すると、最後の行のLOC列(以前はBOSTONであった列)がCALIFORNIAになっています。

SQL> select * from deptxt ;

DE DNAME          LOC
-- -------------- -------------
1a ACCOUNTING     NEW YORK
20 RESEARCH       DALLAS
30 SALES          CHICAGO
40 OPERATIONS     CALIFORNIA

4 rows selected.
15.2.7.1 PREPROCESSOR句によるパラレル処理の使用

外部表では、LOCATION句で指定された各データ・ファイルが単一グラニュルとして扱われます。PREPROCESSOR句によるパラレル処理を最大限に活用するには、ロードされるデータを複数ファイル(グラニュル)に分割する必要があります。これは、外部表における並列度が、存在するデータ・ファイル数まで制限されるためです。たとえば、並列度を16に指定し、データ・ファイルが10個のみ存在する場合には、10個のスレーブ・プロセスがビジーとなり、6個がアイドル状態になるため、実際の並列度は10となります。アイドル状態のスレーブ・プロセスがないことが最適な状態です。したがって、並列度を指定する場合、すべてのスレーブ・プロセスがビジーになるように、並列度がデータ・ファイル数を超えないことが理想的です。

関連項目:

15.2.7.2 PREPROCESSOR句を使用する際の制限事項
  • Oracle Database Vault機能を使用するデータベースでは、PREPROCESSOR句を使用できません。

  • PREPROCESSOR句は、COLUMN TRANSFORMS句とともには使用できません。

15.2.8 LANGUAGE

LANGUAGE句を使用すると、データのロケール依存情報を得るための言語名(FRENCHなど)を指定できます。次に、言語名から得られる情報のタイプの例を示します。

  • 月と日の名前およびその略称

  • A.M.、P.M.、A.D.およびB.C.と同じ内容を表す記号

  • ORDER BY SQL句が指定されている場合の文字データのデフォルトのソート順序

  • 筆記方向(右から左、左から右)

  • 肯定および否定応答の文字列(たとえばYESNO)

関連項目:

Oracleでサポートされる言語のリストは、『Oracle Databaseグローバリゼーション・サポート・ガイド』を参照してください。

15.2.9 TERRITORY

TERRITORY句を使用すると、地域名を指定して、入力データの特性をより詳細に指定することができます。たとえば、カンマではなく小数点(531,298のかわりに531.298など)が数字に使用される国もあります。

関連項目:

Oracleでサポートされる地域のリストは、『Oracle Databaseグローバリゼーション・サポート・ガイド』を参照してください。

15.2.10 DATA IS...ENDIAN

DATA IS...ENDIAN句を使用して、データ・ファイルを生成したプラットフォームによってバイト順序が異なるデータのエンディアンを指定します。次の型のフィールドは、この句の影響を受けます。

  • INTEGER

  • UNSIGNED INTEGER

  • FLOAT

  • BINARY_FLOAT

  • DOUBLE

  • BINARY_DOUBLE

  • VARCHAR(数値のみ)

  • VARRAW(数値のみ)

  • UTF16文字セットの任意の文字データ型

  • RECORDS DELIMITED BY stringによって指定するUTF16文字セット文字列

Windowsベースのプラットフォームではリトル・エンディアン・データが生成されます。ビッグ・エンディアン・プラットフォームには、Sun SolarisおよびIBM MVSがあります。DATA IS...ENDIAN句を指定しない場合、データは、アクセス・ドライバが実行されているプラットフォームと同じエンディアンになります。UTF-16データ・ファイルには、ファイルの先頭にデータのエンディアンを示すマークがあります。このマークは、DATA IS...ENDIAN句に優先します。

15.2.11 BYTEORDERMARK (CHECK | NOCHECK)

BYTEORDERMARK句を使用して、データ・ファイルにバイト順序マーク(BOM)があるかを確認するかどうかを指定します。この句は、文字セットがUnicodeの場合にのみ有効です。

BYTEORDERMARK NOCHECKを指定すると、データ・ファイルにBOMが存在するかどうかが確認されず、データ・ファイルのすべてのデータがデータとして読み込まれます。

BYTEORDERMARK CHECKを指定すると、データ・ファイルにBOMがあるかどうかを確認します。これはUnicode文字セットのデータ・ファイルについてのデフォルト動作です。

次に、使用例をいくつか示します。

  • データをリトル・エンディアンまたはビッグ・エンディアンとして指定し、CHECKを指定したときにそのエンディアンがデータ・ファイルと一致していないと判断された場合は、エラーが返されます。たとえば、次のパラメータを指定したとします。

    DATA IS LITTLE ENDIAN 
    BYTEORDERMARK CHECK 
    

    Unicodeデータ・ファイル内にBOMが存在するかどうかが確認され、そのデータが実際にはビッグ・エンディアンであった場合は、リトル・エンディアンを指定していたため、エラーが返されます。

  • BOMが存在せず、DATA IS...ENDIANパラメータを使用してエンディアンを指定しない場合は、プラットフォームのエンディアンが使用されます。

  • BYTEORDERMARK NOCHECKを指定し、DATA IS...ENDIANパラメータを使用してエンディアンを指定した場合は、その値が使用されます。それ以外の場合は、プラットフォームのエンディアンが使用されます。

    関連項目:

    バイト順序

15.2.12 STRING SIZES ARE IN

STRING SIZES ARE IN句を使用して、文字列の長さがバイト単位であるか、または文字単位であるかを指定します。この句を指定しない場合、アクセス・ドライバは、データベースが使用するモードを使用します。長さが埋め込まれた文字型(VARCHARなど)も、この句の影響を受けます。この句を指定すると、埋め込まれた長さは、バイト数ではなく、文字数となります。UTF16などのマルチバイト文字セットのロード時には、STRING SIZES ARE IN CHARACTERSを指定する必要があります。

15.2.13 LOAD WHEN

LOAD WHEN condition_spec句を使用して、データベースに渡すレコードを識別します。評価の方法は様々です。

  • condition_spec句がレコードのフィールドを参照する場合、この句は、すべてのフィールドがレコードから解析された後で、NULLIF句またはDEFAULTIF句の評価が行われるにのみ評価されます。

  • 条件指定が範囲のみを参照する(フィールド名は参照しない)場合、フィールドが解析される前に句が評価されます。これは、ファイル中のロードできないレコードを、エラーなしで現行のレコード定義に解析できない場合に有効です。

詳細は、「condition_spec」を参照してください。

次に、LOAD WHENの使用例を示します。

LOAD WHEN (empid != BLANKS)
LOAD WHEN ((dept_id = "SPORTING GOODS" OR dept_id = "SHOES") AND total_sales != 0)

15.2.14 BADFILE | NOBADFILE

BADFILE句を使用して、エラーのためにロードできない場合にレコードが書き込まれるファイルを指定します。たとえば、データ・ファイルのフィールドを外部表の列のデータ型に変換できなかった場合、不良ファイルにレコードが書き込まれます。不良ファイルの目的は、すべての拒否されたデータを調査および修正して、ファイルをロードできるようにすることです。不良レコードがあってもデータを修正しない場合は、NOBADFILEオプションを使用して不良ファイルの作成を回避できます。

BADFILE句を指定する場合、ディレクトリ・オブジェクト名またはファイル名(あるいはその両方)を指定する必要があります。詳細は、「[directory object name:] [filename]」を参照してください。

BADFILEまたはNOBADFILEのいずれも指定しない場合、デフォルトでは1つ以上のレコードが拒否されると、不良ファイルが作成されます。このファイルの名前は、表名の後に_%pが付いたものになります(%pは、ファイル作成プロセスのPIDで置き換えられます)。ファイルには拡張子.badが付けられます。ディレクトリ・ナビゲーションとして解釈できない文字(%、/、*など)が表名に含まれる場合、これらの文字は出力ファイル名に含められません。

LOAD WHEN句が正常に実行されない場合、レコードは不良ファイルには書き込まれず、かわりに、廃棄ファイルに書き込まれます。また、外部表のレコードを使用中にエラーが発生する場合は(外部表に対してINSERT INTO...AS SELECT...を使用した場合の制約違反など)、レコードは不良ファイルに書き込まれません。

15.2.15 DISCARDFILE | NODISCARDFILE

DISCARDFILE句を使用して、レコードがLOAD WHEN句の条件を満たすことができないことが書き込まれるファイルを指定します。この廃棄ファイルは、廃棄される最初のレコードが検出されると作成されます。同じ外部表が複数回アクセスされる場合、廃棄ファイルはそのたびに再度書き込まれます。廃棄レコードを個別のファイルに保存する必要がない場合、NODISCARDFILEを使用します。

DISCARDFILEを指定する場合、ディレクトリ・オブジェクト名またはファイル名(あるいはその両方)を指定する必要があります。詳細は、「[directory object name:] [filename]」を参照してください。

DISCARDFILE またはNODISCARDFILEのいずれも指定しない場合、デフォルトでは1つ以上のレコードでLOAD WHEN句が失敗すると、廃棄ファイルが作成されます。このファイルの名前は、表名の後に_%pが付いたものになります(%pは、ファイル作成プロセスのPIDで置き換えられます)。ファイルには拡張子.dcsが付けられます。ディレクトリ・ナビゲーションとして解釈できない文字(%、/、*など)が表名に含まれる場合、これらの文字はファイル名に含められません。

15.2.16 LOGFILE | NOLOGFILE

LOGFILE句を使用して、データ・ファイルのデータへのアクセス中に外部表のユーティリティによって生成されたメッセージを含むファイルを指定します。ログ・ファイルがすでに同じ名前で存在する場合は、アクセス・ドライバによってそのログ・ファイルが再びオープンされ、新しいログ情報がファイルの終わりに追加されます。この点では、既存のファイルを上書きする不良ファイルおよび廃棄ファイルとは異なります。NOLOGFILE句を使用してログ・ファイルの作成を回避できます。

LOGFILEを指定する場合、ディレクトリ・オブジェクト名またはファイル名(あるいはその両方)を指定する必要があります。詳細は、「[directory object name:] [filename]」を参照してください。

LOGFILEまたはNOLOGFILEのいずれも指定しない場合、デフォルトではログ・ファイルが作成されます。このファイルの名前は、表名の後に_%pが付いたものになります(%pは、ファイル作成プロセスのPIDで置き換えられます)。ファイルには拡張子.logが付けられます。ディレクトリ・ナビゲーションとして解釈できない文字(%、/、*など)が表名に含まれる場合、これらの文字はファイル名に含められません。

15.2.17 SKIP

SKIPパラメータは、ロードの前に、データ・ファイルに含まれる指定した件数のレコードをスキップします。データにパラレルにアクセスしない場合にのみ指定できます。同じ表について同じ場所に複数のデータ・ファイルがある場合、SKIPパラメータは、最初のデータ・ファイルに含まれる指定した件数のレコードのみをスキップします。

15.2.18 FIELD NAMES

FIELD NAMES句を使用してフィールド順序を指定できます。構文は次のとおりです。

FIELD NAMES {FIRST FILE | FIRST IGNORE | ALL FILES | ALL IGNORE| NONE}

FIELD NAMESのオプションは次のとおりです。

  • FIRST FILE: 最初のデータ・ファイルに、最初のレコードのデータに対応するフィールド名のリストが含まれることを示します。このリストでは、データ・ファイルのデータと同じデリミタが使用されます。このレコードは、データ・ファイルのフィールドとターゲット表の列とのマッピングを設定するために読み取られ、使用されます。このレコードは、データが処理されるとスキップされます。これは、データ・ファイルのフィールドの順序が表の列の順序と異なる場合や、データ・ファイルのフィールドの数がターゲット表の列の数と異なる場合に役立ちます。

  • FIRST IGNORE: 最初のデータ・ファイルに、最初のレコードのデータに対応するフィールド名のリストが含まれるが、その情報は無視する必要があることを示します。このレコードは、データが処理されるとスキップされますが、フィールドの設定には使用されません。

  • ALL FILES: すべてのデータ・ファイルに、最初のレコードのデータに対応する列名のリストが含まれることを示します。各データ・ファイルの最初のレコードは、データが処理されるとスキップされます。リストは、各データ・ファイルで同じであるとみなされます。そうではない場合、データ・ファイルで不一致が検出されたときにロードは終了します。

  • ALL IGNORE: すべてのデータ・ファイルに、最初のレコードのデータに対応するフィールド名のリストが含まれるが、その情報は無視する必要があることを示します。このレコードは、すべてのデータ・ファイルでデータが処理されるとスキップされますが、フィールドの設定には使用されません。

  • NONE: データ・ファイルに、最初のレコードの通常のデータが含まれることを示します。このオプションがデフォルトです。

15.2.19 READSIZE

READSIZEパラメータは、レコードの処理に使用する読取りバッファのサイズを指定します。読取りバッファのサイズは、アクセス・ドライバで処理する最大入力レコードのサイズ以上にする必要があります。サイズは、整数のバイト数で指定します。デフォルト値は512KB(524288バイト)です。データ・ファイル内に512KBより大きいレコードがある場合は、デフォルト値より大きい値を指定する必要があります。READSIZEのサイズに上限はありませんが、アクセス・ドライバで割当て可能なメモリーの最大量が事実上の上限となります。

追加のバッファが割り当てられる場合もあるため、割当てに使用可能なメモリーの量によっても制限されます。追加のバッファは、(データ内、デリミタ、またはマルチ・キャラクタ/バイトのデリミタが使用されている場合はそのデリミタのいずれかで)分割された可能性のあるレコードの処理を正常に完了するために使用されます。

15.2.20 DISABLE_DIRECTORY_LINK_CHECK

デフォルトでは、ORACLE_LOADERアクセス・ドライバは、データやログ・ファイルを開く前にチェックを行い、使用するディレクトリがシンボリック・リンクでないことを確認します。DISABLE_DIRECTORY_LINK_CHECKパラメータ(引数なし)を指定して、このチェックを回避するようにアクセス・ドライバに指示すると、親ディレクトリがシンボリック・リンクの可能性があるファイルも使用できます。

ノート:

シンボリック・リンクは外部表のロード操作での入力や出力をリダイレクトするために使用される可能性もあるため、このパラメータの使用にはセキュリティのリスクが伴います。

15.2.21 DATE_CACHE

デフォルトでは、(1000要素に対して)日付キャッシュ機能が使用できます。日付キャッシュ機能を完全に使用禁止にするには、0(ゼロ)に設定します。

DATE_CACHEは、日付キャッシュ・サイズ(エントリ数)を指定します。たとえば、DATE_CACHE=5000を指定すると、作成された日付キャッシュごとに最大5000の一意の日付エントリが含まれます。必要に応じて、すべての表に固有の日付キャッシュが作成されます。日付キャッシュは、表への格納のためにデータ型変換が必要な日付値またはタイムスタンプ値が1つ以上ロードされた場合にのみ作成されます。

日付キャッシュ機能は、デフォルトで使用可能です。デフォルトの日付キャッシュ・サイズは1000要素です。デフォルトのサイズを使用し、1000を超える一意の入力値をロードすると、日付キャッシュ機能は、この表に対して自動的に使用禁止となります。ただし、デフォルトを変更して0以外の日付キャッシュ・サイズを指定し、キャッシュ量がこのサイズを超えた場合、キャッシュは使用禁止になりません。

ログ・ファイルに含まれている日付キャッシュ統計(エントリ数、ヒット数、ミス数)を使用して、将来、同様のロードを行うときのためにキャッシュのサイズを調整できます。

15.2.22 string

stringは、引用符で囲まれた一連の文字または16進数字です。一連の文字の場合、これらの文字はデータ・ファイルの文字セットに変換されます。また、16進数字の場合には、偶数にする必要があります。16進数字は、バイナリに翻訳されたものに変換され、その翻訳結果はデータ・ファイルの文字セット内の文字列として処理されます。これは、16進数字がバイナリに翻訳されたものに変換された後では、他の文字セットの翻訳が実行されないことを意味します。 stringの構文は次のとおりです。

15.2.23 condition_spec

condition_specは、真または偽のいずれかに評価される式です。ブール演算子によって結合される1つ以上の条件を指定します。条件およびブール演算子は、左から右へと評価されます。(ブール演算子は、条件が評価された後に適用されます。)カッコを使用して、ブール演算子を評価するデフォルトの順序を変更できます。condition_spec句の評価にはより多くのレコード処理時間が必要であるため、多くの句を使用しないようにする必要があります。condition_specの構文は次のとおりです。

条件指定にフィールド名を参照する条件が含まれている場合、条件指定は、すべてのフィールドがレコードで検出され、空白の切捨てが行われた後のみに評価されます。空白がフィールドから切り捨てられている場合、フィールドとBLANKSの比較は有効ではありません。

次に、condition_specの使用例を示します。

empid = BLANKS OR last_name = BLANKS
(dept_id = SPORTING GOODS OR dept_id = SHOES) AND total_sales != 0

関連項目:

condition

15.2.24 [directory object name:] [filename]

この句を使用して、出力ファイル(BADFILEDISCARDFILEまたはLOGFILE)の名前を指定します。ディレクトリ・オブジェクト名またはファイル名(あるいはその両方)を指定する必要があります。そのディレクトリ・オブジェクト名は、外部表にアクセスしているユーザーが書込み権限を所有しているディレクトリ・オブジェクトの名前です。このディレクトリ・オブジェクト名を指定しない場合、CREATE TABLE...ORGANIZATION EXTERNAL文のDEFAULT DIRECTORY句に対して指定した値が使用されます。

filenameパラメータは、ディレクトリ・オブジェクト内に作成するファイルの名前です。パラレル・ロードでファイル名を一意にするには、アクセス・ドライバで記号置換を行います。UNIXおよびWindowsオペレーティング・システムでサポートされる記号置換は、次のとおりです(その他のプラットフォームでは、別の記号が使用される場合があります)。

  • %pは、現行のプロセスのプロセスIDに置換されます。たとえば、アクセス・ドライバのプロセスIDが12345の場合、exttab_%p.logは、exttab_12345.logとなります。

  • %aは、現行のプロセスのエージェント番号に置換されます。エージェント番号は、外部表にアクセスしている各パラレル・プロセスに割り当てられた一意の番号です。この番号には、3文字になるように、左側に0が埋められます。たとえば、3番目のパラレル・エージェントがファイルを作成する場合、bad_data_%a.badをファイル名として指定した場合、エージェントはbad_data_003.badというファイルを作成します。

  • %%は、%に置換されます。ファイル名にパーセント符号が必要な場合、この記号置換が使用されます。

%文字が検出され、前述の文字以外の文字がその後に続く場合、エラーが返されます。

%pまたは%aを使用しないで出力ファイルに対して一意のファイル名を作成し、外部表にパラレルでアクセス中の場合、出力ファイルが破損するか、エージェントがファイルに書込みをできないという問題が発生する場合があります。

BADFILE (またはDISCARDFILELOGFILE)を指定しない場合、アクセス・ドライバでは、表の名前に_%pを付けたものがファイル名として使用されます。ファイルに対して拡張子がない場合は、デフォルトの拡張子が使用されます。デフォルトの拡張子は、不良ファイルでは.bad、廃棄ファイルでは.dsc、ログ・ファイルでは.log となります。

15.2.25 condition

conditionを使用して、定数文字列とレコードのバイト範囲またはフィールドを比較します。比較のソースは、レコードのフィールドまたはレコードのバイト範囲のいずれかです。比較はバイト単位で実行されます。文字列を比較のターゲットとして指定すると、データ・ファイルの文字セットに変換されます。フィールドに文字以外のデータ型が含まれる場合、フィールド値または文字列のどちらでもデータ型変換は実行されません。conditionの構文は次のとおりです。

15.2.25.1 range start : range end

この句を使用してレコードのバイト範囲または文字範囲を記述して条件を指定します。STRING SIZES ARE句に使用する値で、rangeがバイトを示すか、文字を示すかを決定します。range startおよびrange endは、レコードへのバイト・オフセットまたは文字オフセットです。range startは、range end以下である必要があります。文字範囲の検索は、可変幅文字セットのデータに対してより固定幅文字セットのデータに対しての方が速く処理されます。範囲が、存在しないレコードの一部を指す場合、その範囲を参照しようとするとレコードは拒否されます。range start:range endは、カッコで囲む必要があります。次に例を示します。(10:13)

ノート:

データ・ファイルには、バイナリ・データ(VARCHARなどのバイナリ・カウントのあるデータ型を含む)および文字データ(可変幅文字セットが使用されているか、または文字幅が1バイトより大きいデータ)が混在しないようにする必要があります。この場合、アクセス・ドライバは、開始位置の検索時にバイナリ・データを文字データとして処理するため、フィールドの適切な開始位置を検索できない場合があります。

次に、conditionの使用例を示します。

LOAD WHEN empid != BLANKS
LOAD WHEN (10:13) = 0x'00000830'
LOAD WHEN PRODUCT_COUNT = "MISSING"

15.2.26 IO_OPTIONS句

IO_OPTIONS句によって、オペレーティング・システムがデータ・ファイルを読み取るために使用するI/Oオプションを指定できます。指定可能なオプションはDIRECTIO (デフォルト)とNODIRECTIOのみです。

DIRECTIOオプションはデフォルトで使用され、直接I/Oを使用してデータ・ファイルのオープンおよび読取りが試行されます。試行が成功した場合、オペレーティング・システムとNFSサーバー(ファイルがNFSサーバー上にあるとき)では、ファイルから読み取ったデータをキャッシュしません。これにより、特にファイルが大きい場合に、データ・ファイルの読取りパフォーマンスが向上します。読取り対象のデータ・ファイルについて直接I/Oがサポートされない場合、ファイルは開かれて読み取られますがDIRECTIOオプションは無視されます。

IO_OPTIONS句がNODIRECTIOオプションを使用して指定されている場合、データ・ファイルの読取りに直接I/Oは使用されません。

IO_OPTIONS句がまったく指定されていない場合、デフォルトのDIRECTIOオプションが使用されます。

15.2.27 DNFS_DISABLE | DNFS_ENABLE

これらのパラメータを使用して、外部表操作中の入力データ・ファイルに対するDirect NFSクライアントの使用を有効化および無効化できます。

Direct NFSクライアントは、Oracleがファイル・サーバー上のファイルにアクセスする際のパフォーマンスを向上するために、ファイル・サーバーで実装できるAPIです。

外部表では、1GBを超えるデータ・ファイルを読み取る場合にデフォルトでDirect NFSクライアント・インタフェースが使用されます。よりサイズの小さいファイルでは、オペレーティング・システムのI/Oインタフェースが使用されます。すべての入力データ・ファイルでDirect NFSクライアントを使用するには、DNFS_ENABLEを使用します。

すべてのデータ・ファイルでDirect NFSクライアントの使用を無効にするには、DNFS_DISABLEを指定します。

関連項目:

15.2.28 DNFS_READBUFFERS

DNFS_READBUFFERSを使用して、Direct NFSクライアントによって使用される読取りバッファの数を制御できます。Direct NFSクライアントは、Oracleがファイル・サーバー上のファイルにアクセスする際のパフォーマンスを向上するために、ファイル・サーバーで実装できるAPIです。

DNFS_READBUFFERSのデフォルト値は4です。

より大きい値を使用すると、Direct NFSクライアント・ファイル・サーバーからの一貫性のないI/Oに対処できますが、メモリー使用量が増大する可能性があります。

関連項目:

15.3 field_definitions句

field_definitions句では、FIELDSパラメータを使用してデータ・ファイルのフィールドに名前を付け、それらのレコード内での検索方法を指定します。

field_definitions句が省略された場合、次のことが想定されます。

  • フィールドは「,」で区切られる

  • フィールドのデータ型はCHARである

  • フィールドの最大長は255である

  • データ・ファイルのフィールドの順序は、外部表で定義されたフィールドの順序となる

  • 空白はフィールドから切り捨てられない。

次に、アクセス・パラメータを含まずに作成する外部表の例を示します。その後に、外部表をロードするために使用できるデータ・ファイルのサンプルinfo.datを示します。

CREATE TABLE emp_load (first_name CHAR(15), last_name CHAR(20), year_of_birth CHAR(4))
 ORGANIZATION EXTERNAL (TYPE ORACLE_LOADER DEFAULT DIRECTORY ext_tab_dir LOCATION ('info.dat'));

Alvin,Tolliver,1976
Kenneth,Baer,1963

field_definitions句の構文は次のとおりです。

IGNORE_CHARS_AFTER_EOR

オプションのこのパラメータは、最後のエンドオブレコードの後、かつエンドオブファイルより前に、レコードの定義に一致しない不要な文字が見つかった場合、その文字を無視するように指定します。

次の4つの条件がすべて当てはまると、エラー・メッセージが外部表のログ・ファイルに書き込まれます。

  • IGNORE_CHARS_AFTER_EORパラメータが設定されているか、フィールドが自由書式可能になっている(自由書式可能とは、フィールドが可変長であるか、フィールドがデリミタまたは囲み文字で指定されていて可変長であるかのいずれかです)。

  • 文字がファイル内の最後のエンドオブレコードの後にある。

  • アクセス・パラメータMISSING FIELD VALUES ARE NULLが設定されていない。

  • フィールドに絶対位置が設定されていない。

外部表のログ・ファイルに書き込まれるエラー・メッセージは次のとおりです。

KUP-04021: field formatting error for field Col1
KUP-04023: field start is after end of record
KUP-04101: record 2 rejected in file /home/oracle/datafiles/example.dat

CSV

外部表でカンマ区切り値形式のファイルであるデータ・ファイルにアクセスするには、FIELDS CSV句を使用します。これによって、ファイルは、通常の改行文字列(たとえば、UNIXまたはLinuxオペレーティング・システムの場合は\n、Windowsオペレーティング・システムの場合は\nまたは\r\n)を含むストリーム・レコード形式のファイルであるとみなされます。データ値にはレコード終了記号含める(埋め込む)ことができます。FIELDS CSV句の構文は次のとおりです。

FIELDS CSV [WITH EMBEDDED | WITHOUT EMBEDDED] [TERMINATED BY ','] [OPTIONALLY ENCLOSED BY '"']

FIELDS CSV句の主なポイントは次のとおりです。

  • デフォルトでは、FIELDS CSV句を使用しません。

  • WITH EMBEDDEDおよびWITHOUT EMBEDDEDオプションでは、データにレコード終了記号が含まれている(埋め込まれている)かどうかを指定します。WITH EMBEDDEDオプションがデフォルトです。

  • WITH EMBEDDEDを使用する場合、埋込みのレコード終了記号は囲む必要があり、データ・ファイル内の並列度は外部表ロードでは無効になります。

  • TERMINATED BY ','およびOPTIONALLY ENCLOSED BY '"'オプションはデフォルトのため、指定する必要はありません。これらは別の終了記号や囲み文字で上書きできます。

  • CSV句を使用する場合、フィールド・レベルでのデリミタ指定は許可されず、区切ることが可能なデータ型のみ許可されます。区切ることが可能なデータ型には、CHAR、日時、期間および数値型EXTERNALが含まれます。

  • CSV句を指定する場合、TERMINATED BYおよびENCLOSED BY句は、フィールド・レベルでは使用できません。

  • CSV句を指定する場合、デフォルトの切捨て動作はLDRTRIMです。これを上書きするには、外部表の他の切捨てオプション(NOTRIMLRTRIMLTRIMまたはRTRIM)のいずれかを指定します。

  • CSV句は、IGNORE_CHARS_AFTER_EOR句の後で、delim_spec句の前に指定する必要があります。

delim_spec句

delim_spec句を使用して、レコード内のすべてのフィールドの終了位置を識別します。すべてのフィールドに指定されるdelim_specは、特定のフィールドに対してfield_list句の一部として上書きできます。構文の詳細は、「delim_spec」を参照してください。

trim_spec句

trim_spec句を使用して、すべての文字フィールドでデフォルトとして実行される空白の切捨てタイプを指定します。すべてのフィールドに指定されるtrim_spec句は、個々のフィールドに対してtrim_spec句を指定して上書きできます。構文の詳細は、「trim_spec」を参照してください。

ALL FIELDS OVERRIDE

ALL FIELDS OVERRIDE句では、アクセス・ドライバに対し、すべてのフィールドが存在し、それらが外部表の列と同じ順序であることを示します。特殊な定義が含まれるフィールドを指定するだけで済みます。この句は、オプションのtrim_spec句の後で、オプションのMISSING FIELD VALUES ARE NULL句の前に指定する必要があります。

次に、ALL FIELDS OVERRIDE句の使用例を示します。指定する必要のあるフィールドはHIREDATEのみで、これは日付書式マスクを必要とします。他のすべてのフィールドはデフォルト値を使用します。

FIELDS TERMINATED BY "," OPTIONALLY ENCLOSED BY '"' LDRTRIM 
ALL FIELDS OVERRIDE
REJECT ROWS WITH ALL NULL FIELDS 
(
 HIREDATE CHAR(20) DATE_FORMAT DATE MASK "DD-Month-YYYY"
)

MISSING FIELD VALUES ARE NULL

MISSING FIELD VALUES ARE NULLは、位置が明示的に示されておらず、入力するのに十分なデータがないフィールドをNULLに設定します。詳細は、「MISSING FIELD VALUES ARE NULL」を参照してください。

REJECT ROWS WITH ALL NULL FIELDS

REJECT ROWS WITH ALL NULL FIELDSは、行内で参照されるすべてのフィールドがNULLの場合、その行が外部表にロードされないことを示します。このパラメータを指定しない場合、デフォルト値が使用され、すべてのフィールドがNULLの行が外部表にロードされます。このパラメータの設定は、「reject rows with all null fields」または「rows with all null fields are accepted」としてログ・ファイルに書き込まれます。

DATE_FORMAT

DATE_FORMAT句では、フィールド・レベルで日時書式マスクを一度指定することで、指定された独自のマスクのないそのタイプのすべてのフィールドにそれを適用できます。日時書式マスクは、オプションのREJECT ROWS WITH ALL NULL FIELDS句の後で、fields_list句の前に指定する必要があります。

DATE_FORMATは、日時データ型のDATETIMETIME WITH TIME ZONETIMESTAMPおよびTIMESTAMP WITH TIME ZONEで指定できます。

次に、任意のDATE型フィールドにDD-Month-YYYYの日付マスクを適用するDATE_FORMAT句の使用例を示します。

FIELDS TERMINATED BY "," OPTIONALLY ENCLOSED BY '"' LDRTRIM 
REJECT ROWS WITH ALL NULL FIELDS
DATE_FORMAT DATE MASK "DD-Month-YYYY"
 
    (
       EMPNO,
       ENAME,
       JOB,
       MGR,
       HIREDATE CHAR(20),
       SAL,
       COMM,
       DEPTNO,
       PROJNO,
       ENTRYDATE CHAR(20)
    )

NULLIF | NO NULLIF

NULLIF句は、すべての文字フィールド(CHARVARCHARVARCHARC、外部NUMBER、日時など)に適用されます。

構文は次のとおりです。

NULLIF {=|!=}{"char_string"|x'hex_string'|BLANKS}

フィールドに対する等号または不等号の指定を使用して一致した場合、フィールドはその行でNULLに設定されます。

char_stringおよびhex_stringは、一重引用符または二重引用符で囲む必要があります。

NULLIFは、フィールド・レベルで指定されると、このNULLIF句に優先します。

NULLIF句を適用しないフィールドがある場合、フィールド・レベルでNO NULLIFを指定できます(次の例を参照)。

NULLIF句は、オプションのREJECT ROWS WITH ALL NULL FIELDS句の後で、fields_list句の前に指定する必要があります。

次に、NULLIF句の使用例を示します。MGRフィールドは、NULLIF="NONE"句をそのフィールドに適用しないようにするNO NULLIFに設定されます。

FIELDS TERMINATED BY "," OPTIONALLY ENCLOSED BY '"' LDRTRIM 
REJECT ROWS WITH ALL NULL FIELDS
NULLIF = "NONE"
(
  EMPNO,
  ENAME,
  JOB,
  MGR
 )

field_list句

field_list句を使用して、データ・ファイルのフィールドおよびそのデータ型を識別します。構文の詳細は、「field_list」を参照してください。

15.3.1 delim_spec

delim_spec句を使用して、フィールドの終了位置(ENCLOSED BYを指定する場合は、開始位置)を検索します。構文は次のとおりです。

ENCLOSED BYを指定すると、アクセス・ドライバで、レコードの現在の位置から最初のデリミタまでの間のすべての空白がスキップされます。現在の位置と最初のデリミタの間のすべての空白が無視されます。次に、アクセス・ドライバでは、2番目の囲みデリミタが検索されます(または、2番目のデリミタが指定されていない場合は、最初のデリミタがもう1度検索されます)。これら2つのデリミタの間にあるすべての文字がフィールド部分とみなされます。

TERMINATED BY stringENCLOSED BY句で指定する場合、終了記号文字列は、2番目の囲みデリミタの直後に置く必要があります。2番目の囲みデリミタと終了デリミタの間の空白はスキップされます。2つのデリミタの間で空白以外の文字が検索される場合、正しく書式化されていないため行が拒否されます。

ENCLOSED BY句を使用せずにTERMINATED BYを指定する場合、レコードの現在の位置と次に検索される終了記号文字列の間にあるすべての文字がフィールド部分とみなされます。

OPTIONALLYを指定する場合は、TERMINATED BYも指定する必要があります。OPTIONALLYパラメータによって、ENCLOSED BYデリミタは、両方存在するかまたは両方存在しないかのいずれかであることが示されます。終了デリミタは、ENCLOSED BYデリミタの有無にかかわらず存在する必要があります。OPTIONALLYを指定する場合、アクセス・ドライバは、最初の空白以外の文字までのすべての空白をスキップします。最初の空白以外の文字が検索されると、アクセス・ドライバは、現在の位置に最初の囲みデリミタが含まれているかどうかを確認します。含まれている場合は、アクセス・ドライバによって2番目の囲み文字列が検索され、最初の囲みデリミタと2番目の囲みデリミタの間のすべての文字がフィールド部分とみなされます。終了デリミタは、2番目の囲みデリミタの直後に置く必要があります(2番目の囲みデリミタと終了デリミタの間にオプションで空白を置くことも可能)。最初の空白以外の文字が最初の囲み文字列ではない場合、アクセス・ドライバは終了デリミタを検索します。この場合、先頭の空白は切り捨てられます。

関連項目:

アクセス・ドライバのデフォルトの切捨て動作の詳細は、「空白の切捨て」を参照してください。LTRIMおよびRTRIMを使用すると、この動作を変更できます。

デリミタが検出された後、レコードの現在の位置は、フィールドの最後のデリミタの後に設定されます。TERMINATED BY WHITESPACEを指定した場合、レコードの現在の位置は、フィールドの後に続くすべての空白の後に設定されます。

レコードの最後のフィールドで終了記号が欠落している場合は、エラーではありません。アクセス・ドライバは、終了記号が検出された場合と同様に処理を行います。2番目の囲みデリミタが欠落している場合は、エラーとなります。

2番目の囲みに使用される文字列は、2番目の囲みを2回続けることによって、データ・フィールドに含むことができます。たとえば、フィールドが一重引用符で囲まれる場合、次の例のdon'tという単語で示すような方法で一重引用符を2つ並べて指定することによって、フィールドに一重引用符を含むことができます。

'I don''t like green eggs and ham'

囲みデリミタを使用せずに、データ・フィールドの終了文字列を引用符で囲む方法はありません。フィールドに終了デリミタを含むことができるのは、フィールド・パーサーが囲みデリミタを検出するまで終了デリミタを検索しないためです。

通常、1文字の文字列は、複数文字の文字列より速く指定できます。また、固定幅文字セットのデータは、可変幅の文字セットよりも速く検索できます。

ノート:

外部表では、文字列内のバックスラッシュ(\)の使用はサポートされていません。

15.3.1.1 例: 終了デリミタを含む外部表

次に、終了デリミタが使用されている外部表の例を示します。その後に、ロードが可能なデータ・ファイルのサンプルを示します。

CREATE TABLE emp_load (first_name CHAR(15), last_name CHAR(20), year_of_birth CHAR(4))
  ORGANIZATION EXTERNAL (TYPE ORACLE_LOADER DEFAULT DIRECTORY ext_tab_dir
                         ACCESS PARAMETERS (FIELDS TERMINATED BY WHITESPACE)
                         LOCATION ('info.dat'));

Alvin Tolliver 1976
Kenneth Baer 1963
Mary Dube 1973
15.3.1.2 例: 囲みデリミタおよび終了デリミタを含む外部表

次に、囲みデリミタと終了デリミタの両方を使用する外部表の例を示します。2番目の囲みデリミタと終了記号の間のすべての空白が無視されるのと同様に、終了文字列と最初の囲み文字列の間のすべての空白も無視されます。この例の後に、ロードが可能なデータ・ファイルのサンプルを示します。

CREATE TABLE emp_load (first_name CHAR(15), last_name CHAR(20), year_of_birth CHAR(4)) 
  ORGANIZATION EXTERNAL (TYPE ORACLE_LOADER DEFAULT DIRECTORY ext_tab_dir
                        ACCESS PARAMETERS (FIELDS TERMINATED BY "," ENCLOSED BY "("  AND ")")
                        LOCATION ('info.dat'));

(Alvin) ,   (Tolliver),(1976)
(Kenneth),  (Baer) ,(1963)
(Mary),(Dube) ,   (1973)
15.3.1.3 例: オプションの囲みデリミタを含む外部表

次に、オプションの囲みデリミタを使用する外部表の例を示します。フィールドの先頭および後続の空白を切り捨てるために、LRTRIMを使用していることに注意してください。この例の後に、ロードが可能なデータ・ファイルのサンプルを示します。

CREATE TABLE emp_load (first_name CHAR(15), last_name CHAR(20), year_of_birth CHAR(4))
  ORGANIZATION EXTERNAL (TYPE ORACLE_LOADER DEFAULT DIRECTORY ext_tab_dir
                         ACCESS PARAMETERS (FIELDS TERMINATED BY ','
                                            OPTIONALLY ENCLOSED BY '(' and ')'
                                            LRTRIM)
                         LOCATION ('info.dat'));

Alvin ,   Tolliver , 1976
(Kenneth),  (Baer), (1963)
( Mary ), Dube ,    (1973)

15.3.2 trim_spec

trim_spec句を使用して、空白をテキスト・フィールドの始めから切り捨てるか、終わりから切り捨てるか、またはその両方から切り捨てるかを指定します。空白には、空白文字およびその他の印字されない文字(タブ、LF、改行など)が含まれます。 trim_spec句の構文は次のとおりです。

フィールドから文字を切り捨てない場合は、NOTRIMを使用します。

フィールドから文字を切り捨てる場合は、LRTRIMLTRIMおよびRTRIMを使用します。LRTRIMを使用すると、先頭と後続の空白の両方が切り捨てられます。先頭の空白を切り捨てるには、LTRIMを使用します。後続の空白を切り捨てるには、RTRIMを使用します。

SQL*Loaderの切捨て機能との互換性を保つには、LDRTRIMを使用します。次の場合を除いて、NOTRIMと同様です。

  • フィールドがデリミタ付きのフィールドではない場合、空白は右から切り捨てられる。

  • フィールドがOPTIONALLY ENCLOSED BYで指定されたデリミタ付きフィールドで、オプションの囲みが特定のインスタンスで欠落している場合、空白は左から切り捨てられる。

デフォルトは、LDRTRIMです。NOTRIMを指定すると、パフォーマンスが向上します。

trim_spec句をフィールド・リストの前に指定して、デフォルトの切捨てをすべてのフィールドに設定できます。trim_specがフィールド・リストの前で指定されない場合、LDRTRIMが、デフォルトの切捨て設定となります。デフォルトの切捨ては、個々のフィールドに対してdatatype_specの一部として上書きできます。

すべてが空白のフィールドに対して切捨てを指定する場合、そのフィールドはNULLに設定されます。

次の例では、すべてのデータが固定長です。ただし、先頭に空白がある文字データはロードできません。この例の後に、ロードが可能なデータ・ファイルのサンプルを示します。

CREATE TABLE emp_load (first_name CHAR(15), last_name CHAR(20),
year_of_birth CHAR(4))
  ORGANIZATION EXTERNAL (TYPE ORACLE_LOADER DEFAULT DIRECTORY ext_tab_dir
                         ACCESS PARAMETERS (FIELDS LTRIM)
                         LOCATION ('info.dat'));

Alvin,           Tolliver,1976
Kenneth,         Baer,    1963
Mary,            Dube,    1973

15.3.3 MISSINGFIELDVALUESARENULL

MISSING FIELD VALUES ARE NULLの影響は、POSITIONがフィールド位置を明示的に示すために使用されているかどうかによって、次のように異なります。

  • デフォルトの動作では、フィールド位置が明示的に示されておらず、レコードのすべてのフィールドに十分なデータがない場合、レコードは拒否されます。この動作を変更するには、MISSING FIELD VALUES ARE NULLを使用して、使用可能なデータがないフィールドをNULLとして定義します。

  • フィールド位置が明示的に示されている場合、MISSING FIELD VALUES ARE NULLが使用されているかどうかにかかわらず、常に、値のないフィールドはNULLとして定義されます。

次の例で、2番目のレコードは、生まれた年のデータがデータ・ファイルから欠落していても、year_of_birth列に対しNULLに設定されて格納されます。MISSING FIELD VALUES ARE NULL句をアクセス・パラメータで指定しない場合、year_of_birth列の値が含まれていない2番目のレコードが拒否されます。この例の後に、ロードが可能なデータ・ファイルのサンプルを示します。

CREATE TABLE emp_load (first_name CHAR(15), last_name CHAR(20), year_of_birth INT)
  ORGANIZATION EXTERNAL (TYPE ORACLE_LOADER DEFAULT DIRECTORY ext_tab_dir
                         ACCESS PARAMETERS (FIELDS TERMINATED BY ","
                                            MISSING FIELD VALUES ARE NULL)
                         LOCATION ('info.dat'));
 
Alvin,Tolliver,1976
Baer,Kenneth
Mary,Dube,1973

15.3.4 field_list

field_list句を使用して、データ・ファイルのフィールドおよびそのデータ型を識別します。field_list句では、次のように評価します。

  • フィールドにいずれのデータ型も指定されない場合、データ型は、デリミタなしフィールドではCHAR(1)、デリミタ付きフィールドではCHAR(255)である。

  • いずれのフィールド・リストも指定されない場合、データ・ファイルのフィールドは外部表と同じ順序である。データベースの列がCHARまたはVARCHARではない場合、すべてのフィールドのデータ型は、CHAR(255)となる。データベースの列がCHARまたはVARCHARの場合、フィールドのデータ型はCHARのままであるが、その長さは255か列の長さでいずれか長い方の値となる。

  • いずれのフィールド・リストも指定されず、delim_spec句も指定されない場合、データ・ファイルのフィールドは外部表のフィールドと同じ順序である。すべてのフィールドは、CHAR(255)であり、カンマで終了する。

次の例では、field_listおよびdelim_specを含まない外部表の定義を示します。その後に、ロードが可能なデータ・ファイルのサンプルを示します。

CREATE TABLE emp_load (first_name CHAR(15), last_name CHAR(20), year_of_birth INT)
  ORGANIZATION EXTERNAL (TYPE ORACLE_LOADER DEFAULT DIRECTORY ext_tab_dir
                         ACCESS PARAMETERS (FIELDS TERMINATED BY "|")
                         LOCATION ('info.dat'));

Alvin|Tolliver|1976
Kenneth|Baer|1963
Mary|Dube|1973

field_list句の構文は次のとおりです。

field_name

field_nameは、データ・ファイルのフィールド名を識別する文字列です。文字列が引用符内にない場合、フィールド名は外部表の列名に一致され、大文字になります。

field_nameが問合せで参照される外部表の列名と一致する場合は、このフィールド値が外部表列の値に使用されます。名前が外部表で参照されたいずれの名前にも一致しない場合、フィールドはロードされません。ただし、このフィールドは句の評価(たとえば、WHENまたはNULLIF)には使用できます。

pos_spec

pos_spec句を使用して、レコード内の列の位置を指定します。構文の詳細は、「pos_spec句」を参照してください。

datatype_spec

datatype_spec句を使用して、フィールドのデータ型を指定します。datatype_specが指定されない場合、アクセス・ドライバは、データ型はCHAR(255)であると想定します。構文の詳細は、「datatype_spec句」を参照してください。

init_spec

init_spec句を使用して、フィールドがNULLになる、またはデフォルトの値を設定されるタイミングを指定します。構文の詳細は、「init_spec句」を参照してください。

LLS句

フィールドにLLSを指定した場合、ORACLE_LOADERはフィールドの値を対応する列にロードしません。かわりに、値の情報を使用して、フィールドの値を見つける場所を判別します。「LLS句」を参照してください。

15.3.5 pos_spec句

pos_spec句を使用して、レコード内の列の位置を指定します。STRING SIZES ARE IN句を設定して、pos_specがバイト位置と文字位置のどちらを参照するかを決定します。可変幅文字セットで文字位置を使用すると、固定幅文字セットで文字位置を使用するより大幅に時間がかかります。pos_specが文字位置に使用されると、バイナリ文字データとマルチバイト文字データは、同じデータ・ファイルには指定できません。指定した場合の結果は保証されません。pos_spec句の構文は次のとおりです。

15.3.5.1 start

startパラメータは、レコードの開始位置からフィールドの開始位置までのバイト数または文字数です。前のフィールド位置からの相対ではなく、レコードの絶対位置でフィールドの開始位置を設定します。

15.3.5.2 *

*パラメータで、フィールドが前のフィールドの直後のバイトまたは文字から始まることを指定します。これは、可変長フィールドの後に固定長フィールドが続く場合に有効です。このオプションは、レコードの最初のフィールドには使用できません。

15.3.5.3 increment

incrementパラメータを使用して、フィールドの開始位置を前のフィールドの終了位置からの固定のバイト数または固定の文字数で設定します。*-incrementを使用して、フィールドの開始位置をレコードの現在の位置の前に指定します。*+incrementを使用して、開始位置を現在の位置の後に移動します。

15.3.5.4 end

endパラメータを使用して、フィールドの終了バイトをレコード内の絶対バイトまたは絶対文字オフセットで指定します。startendとともに指定する場合、endは、startより小さくできません。*またはincrementendとともに指定し、startが特定のレコードのendより大きいオフセットと評価された場合、レコードは拒否されます。

15.3.5.5 length

lengthパラメータで、フィールドの終了位置を開始位置からの固定のバイト数または文字数で指定します。開始位置を*で指定すると、固定長フィールドに有効です。

次に、pos_specの使用例を示します。その後に、ロードが可能なデータ・ファイルのサンプルを示します。

CREATE TABLE emp_load (first_name CHAR(15),
                      last_name CHAR(20),
                      year_of_birth INT,
                      phone CHAR(12),
                      area_code CHAR(3),
                      exchange CHAR(3),
                      extension CHAR(4))
  ORGANIZATION EXTERNAL
  (TYPE ORACLE_LOADER
   DEFAULT DIRECTORY ext_tab_dir
   ACCESS PARAMETERS
     (FIELDS RTRIM
            (first_name (1:15) CHAR(15),
             last_name (*:+20),
             year_of_birth (36:39),
             phone (40:52),
             area_code (*-12: +3),
             exchange (*+1: +3),
             extension (*+1: +4)))
   LOCATION ('info.dat'));

Alvin          Tolliver            1976415-922-1982
Kenneth        Baer                1963212-341-7912
Mary           Dube                1973309-672-2341

15.3.6 datatype_spec句

datatype_spec句を使用して、データ型がデフォルトと異なる場合にデータ・ファイルのフィールドのデータ型を記述します。フィールドのデータ型は、外部表の対応する列のデータ型とは異なる場合があります。アクセス・ドライバで必要な変更が行われます。datatype_spec句の構文は次のとおりです。

フィールドのバイト数または文字数が0の場合、フィールドはNULLであると想定されます。オプションのDEFAULTIF句を使用して、フィールドをデフォルトの値に設定するタイミングを指定します。また、オプションのNULLIF句で、フィールドに対応付けられた列をNULLに設定するタイミングに関するその他の条件を指定します。DEFAULTIF句またはNULLIF句がTRUEの場合、これらの句を使用すると、データ・ファイルから読み込まれるすべての値が上書きされます。

関連項目:

15.3.6.1 [UNSIGNED] INTEGER [EXTERNAL] [(len)]

この句を使用して、フィールドを整数として定義します。EXTERNALを指定する場合、数値は文字列で指定します。EXTERNALを指定しない場合、数値はバイナリ・フィールドです。2進整数フィールドのlenに対する有効な値は、1、2、4および8です。lenが2進整数で指定されていない場合、デフォルトの値は、アクセス・ドライバが実行されているプラットフォーム上のsizeof(int)の値です。DATA IS {BIG | LITTLE} ENDIAN句を使用すると、データは格納される前にバイト・スワップされます。

EXTERNALを指定する場合、lenの値は、(STRING SIZES ARE IN BYTES句またはCHARACTERS句の設定に応じて)バイト数または文字数を数値で指定します。長さを指定しない場合、デフォルト値は255になります。

[UNSIGNED] INTEGER [EXTERNAL] [(len)]データ型のデフォルト値は、次のように決定されます。

  • 長さを指定しない場合、デフォルトの長さは1になります。

  • 長さを指定せず、フィールドがDELIMITED BY NEWLINE句で区切られている場合、デフォルトの長さは1になります。

  • 長さを指定せず、フィールドがDELIMITED BY句で区切られている場合、デフォルトの長さは255になります(ただし、前述のとおりデリミタがNEWLINEでない場合)。

15.3.6.2 DECIMAL [EXTERNAL]およびZONED [EXTERNAL]

DECIMAL句を使用して、フィールドがPACKED型の10進数であることを指定します。ZONED句を使用して、フィールドがZONED型の10進数であることを指定します。precisionフィールドで、数値の桁数を指定します。scaleフィールドで、数値の小数点の位置を指定します。つまり、小数点の右側にくる桁数を指定します。scaleを指定しない場合、値は0となります。

使用中の文字セットがEBCDICベースかASCIIベースかによって、ZONED型の10進数には異なるエンコーディング形式があることに注意してください。ソース・データの言語がEBCDICの場合、そのファイルのZONED型の10進数は、EBCDICエンコーディングと一致する必要があります。言語がASCIIベースの場合、その数値はASCIIエンコーディングと一致する必要があります。

EXTERNALパラメータを指定する場合、データ・フィールドは、その長さがフィールドの精度と一致する文字列です。

15.3.6.3 ORACLE_DATE

ORACLE_DATEは、Oracleバイナリ日付フォーマットの日付を含むフィールドであることを指定します。これは、Oracle Call Interface (OCI)プログラムでは、DTYDATデータ型として使用される形式です。固定長7のフィールドです。

15.3.6.4 ORACLE_NUMBER

ORACLE_NUMBERは、Oracle数値書式の数値を含むフィールドであることを指定します。COUNTEDを指定しないかぎり、フィールドは固定長(Oracle数値フィールドの最大サイズ)です。その場合、フィールドの最初のバイトには残りのフィールドのバイト数が含まれます。

ORACLE_NUMBERは、固定長22バイトのフィールドです。ORACLE_NUMBER COUNTEDフィールドの長さは、カウント・バイト用の1バイトに、カウント・バイトで指定されたバイト数を加えた長さです。

15.3.6.5 浮動小数点数

DOUBLEFLOATBINARY_DOUBLEおよびBINARY_FLOATのデータ型は、浮動小数点数です。

DOUBLEおよびFLOATは、プラットフォームで固有に使用される浮動小数点形式です。これらは、そのプラットフォームのCプログラムのDOUBLEおよびFLOATデータ型でデフォルトで使用されるものと同じデータ型です。BINARY_FLOATおよびBINARY_DOUBLEは浮動小数点数であり、実質的にInstitute for Electrical and Electronics Engineers (IEEE) Standard for Binary Floating-Point Arithmetic、IEEE規格754-1985に準拠しています。ほとんどのプラットフォームでは、固有の浮動小数点形式としてIEEE規格を使用しているため、FLOATBINARY_FLOATは、プラットフォーム上では同様となります。また、DOUBLEBINARY_DOUBLEも同様となります。

ノート:

浮動小数点数の詳細は、『Oracle Database SQL言語リファレンス』を参照してください。

15.3.6.6 DOUBLE

DOUBLE句を使用して、フィールドが、アクセス・ドライバが実行されているプラットフォーム上のC言語のDOUBLEデータ型と同じ形式であることを指定します。DATA IS {BIG | LITTLE} ENDIAN句を使用すると、データは格納される前にバイト・スワップされます。このデータ型は特定のプラットフォーム間では移植できません。

15.3.6.7 FLOAT [EXTERNAL]

FLOAT句を使用して、フィールドが、アクセス・ドライバが実行されているプラットフォーム上のC言語のFLOATデータ型と同じ形式であることを指定します。DATA IS {BIG | LITTLE} ENDIAN句を使用すると、データは格納される前にバイト・スワップされます。このデータ型は特定のプラットフォーム間では移植できません。

EXTERNALパラメータを指定する場合、フィールドは、最大長255の文字列です。参照先

15.3.6.8 BINARY_DOUBLE

BINARY_DOUBLEは、64ビットの倍精度浮動小数点数データ型です。各BINARY_DOUBLE値では、長さを示すバイトを含め9バイトを必要とします。浮動小数点数の詳細は、FLOATデータ型のノートに関する情報を参照してください。

15.3.6.9 BINARY_FLOAT

BINARY_FLOATは、32ビットの単精度浮動小数点数データ型です。各BINARY_FLOAT値では、長さを示すバイトを含め5バイトを必要とします。浮動小数点数の詳細は、FLOATデータ型のノートに関する情報を参照してください。

15.3.6.10 RAW

RAW句を使用して、ソース・データがバイナリ・データであることを指定します。RAWフィールドに対するlenは常にバイト単位です。RAWフィールドがキャラクタ列にロードされると、列に書き込まれるデータは、RAWフィールドのバイトの16進表現となります。

15.3.6.11 CHAR

CHAR句を使用して、フィールドが文字データ型であることを指定します。CHARフィールドの長さ(len)で、フィールドの最大バイト数または最大文字数を指定します。lenは、STRING SIZES ARE IN句の設定に応じて、バイト単位または文字単位になります。

CHARデータ型のフィールドに長さを指定しない場合、フィールドが区切られていないかぎり、フィールド・サイズは1になります。

  • デリミタ付きCHARフィールドでは、長さが指定されている場合、その長さが最大長として使用されます。

  • 長さが指定されていないデリミタ付きCHARフィールドでは、デフォルトの255バイトが使用されます。

  • デリミタ付きで255バイトを超えるCHARフィールドには、最大長を指定する必要があります。指定しない場合は、データ・ファイルのフィールドが最大長を超えているというエラーを受信します。

次に、CHAR句の使用例を示します。

SQL> CREATE TABLE emp_load
  2    (employee_number      CHAR(5),
  3     employee_dob         CHAR(20),
  4     employee_last_name   CHAR(20),
  5     employee_first_name  CHAR(15),
  6     employee_middle_name CHAR(15),
  7     employee_hire_date   DATE)
  8  ORGANIZATION EXTERNAL
  9    (TYPE ORACLE_LOADER
 10     DEFAULT DIRECTORY def_dir1
 11     ACCESS PARAMETERS
 12       (RECORDS DELIMITED BY NEWLINE
 13        FIELDS (employee_number      CHAR(2),
 14                employee_dob         CHAR(20),
 15                employee_last_name   CHAR(18),
 16                employee_first_name  CHAR(11),
 17                employee_middle_name CHAR(11),
 18                employee_hire_date   CHAR(10) date_format DATE mask "mm/dd/yyyy"
 19               )
 20       )
 21     LOCATION ('info.dat')
 22    );
 
Table created.
15.3.6.12 date_format_spec

date_format_spec句を使用して、特定の形式の日付データまたは時刻データ(またはその両方)が文字列フィールドに含まれることを指定します。この情報は、文字フィールドが日付データ型または時刻データ型に変換される場合、および文字列フィールドが日付列にマップされる場合のみに使用されます。

日付と時刻の書式を正しく指定する方法の詳細は、『Oracle Database SQL言語リファレンス』を参照してください。

date_format_spec句の構文は次のとおりです。

15.3.6.12.1 DATE

DATE句を使用して、文字列に日付が含まれることを指定します。

15.3.6.12.2 MASK

MASK句を使用して、データ型に対するデフォルトのグローバリゼーション書式マスクを上書きします。日付マスクを指定しない場合は、データ型に対する適切なグローバリゼーション・パラメータのデータベースのNLSパラメータ設定(セッションの設定ではない)が使用されます。NLS_DATABASE_PARAMETERSビューに、これらの設定が表示されます。

  • NLS_DATE_FORMAT (DATEデータ型)

  • NLS_TIMESTAMP_FORMAT (TIMESTAMPデータ型)

  • NLS_TIMESTAMP_TZ_FORMAT (TIMESTAMP WITH TIME ZONEデータ型)

以下の点に注意する必要があります。

  • NLS_NUMERIC_CHARACTERS初期化パラメータのデータベース設定(NLS_DATABASE_PARAMETERSビューの設定)によって、文字データ型から数値データ型への暗黙的な変換に使用される小数点区切りが制御されます。

  • デフォルトの書式では、桁区切りは使用できません。

15.3.6.12.3 TIMESTAMP

TIMESTAMP句を使用して、書式化されたタイムスタンプがフィールドに含まれることを指定します。

15.3.6.12.4 INTERVAL

INTERVAL句を使用して、フィールドに書式化された期間が含まれることを指定します。期間の型は、YEAR TO MONTHまたはDAY TO SECONDのいずれかです。

次に、複雑なDATE文字列とTIMESTAMP文字列の使用例を示します。その後に、ロードが可能なデータ・ファイルのサンプルを示します。

SQL> CREATE TABLE emp_load
  2    (employee_number      CHAR(5),
  3     employee_dob         CHAR(20),
  4     employee_last_name   CHAR(20),
  5     employee_first_name  CHAR(15),
  6     employee_middle_name CHAR(15),
  7     employee_hire_date   DATE,
  8     rec_creation_date    TIMESTAMP WITH TIME ZONE)
  9  ORGANIZATION EXTERNAL
 10    (TYPE ORACLE_LOADER
 11     DEFAULT DIRECTORY def_dir1
 12     ACCESS PARAMETERS
 13       (RECORDS DELIMITED BY NEWLINE
 14        FIELDS (employee_number      CHAR(2),
 15                employee_dob         CHAR(20),
 16                employee_last_name   CHAR(18),
 17                employee_first_name  CHAR(11),
 18                employee_middle_name CHAR(11),
 19                employee_hire_date   CHAR(22) date_format DATE mask "mm/dd/yyyy hh:mi:ss AM",
 20                rec_creation_date    CHAR(35) date_format TIMESTAMP WITH TIME ZONE mask "DD-MON-RR HH.MI.SSXFF AM TZH:TZM"
 21               )
 22       )
 23     LOCATION ('infoc.dat')
 24    );
 
Table created.
SQL> SELECT * FROM emp_load;
 
EMPLO EMPLOYEE_DOB         EMPLOYEE_LAST_NAME   EMPLOYEE_FIRST_ EMPLOYEE_MIDDLE
----- -------------------- -------------------- --------------- ---------------
EMPLOYEE_
---------
REC_CREATION_DATE
---------------------------------------------------------------------------
56    november, 15, 1980   baker                mary            alice
01-SEP-04
01-DEC-04 11.22.03.034567 AM -08:00
 
87    december, 20, 1970   roper                lisa            marie
01-JAN-02
01-DEC-02 02.03.00.678573 AM -08:00
 
 
2 rows selected.

info.dat ファイルの内容は、次のようになります。これは、2つの長いレコードです。日付フィールド(09/01/200401/01/2002)とそれに続く時刻フィールドの間には、空白が1つあります。

56november, 15, 1980  baker             mary       alice      09/01/2004 08:23:01 AM01-DEC-04 11.22.03.034567 AM -08:00
87december, 20, 1970  roper             lisa       marie      01/01/2002 02:44:55 PM01-DEC-02 02.03.00.678573 AM -08:00
15.3.6.13 VARCHARおよびVARRAW

VARCHARデータ型には、文字データが後に続くバイナリ・カウント・フィールドが含まれます。バイナリ・カウント・フィールドの値は、フィールドのバイト数または文字数のいずれかです。数値が、文字数とバイト数のどちらで解釈されるかを指定する方法の詳細は、「STRING SIZES ARE IN」を参照してください。

VARRAWデータ型には、バイナリ・データが後に続くバイナリ・カウント・フィールドが含まれます。バイナリ・カウント・フィールドの値は、バイナリ・データのバイト数です。VARRAWフィールドのデータは、DATA ISENDIAN句の影響を受けません。

ACCESS PARAMETERS句の中のVARIABLE 2句は、長さを含むバイナリ・フィールドのサイズを規定します。

オプションのlength_of_lengthフィールドは、カウント・フィールドのバイト数です。VARCHARに対するlength_of_lengthの有効な値は、1、2、4および8です。length_of_lengthを指定しない場合、値に2が使用されます。カウント・フィールドは、DATA ISENDIAN句で指定されたとおりの同じエンディアンを持ちます。

max_lenフィールドを使用して、データ・ファイルのフィールドのインスタンスの最大サイズを指定します。VARRAWフィールドでは、max_lenはバイト数です。VARCHARフィールドでは、max_lenは、STRING SIZES ARE IN句の設定に応じて、文字数またはバイト数のいずれかになります。

次に、VARCHARおよびVARRAWの使用例を示します。例の後に、データ・ファイルinfo.datの内容を示します。

CREATE TABLE emp_load
             (first_name CHAR(15),
              last_name CHAR(20),
              resume CHAR(2000),
              picture RAW(2000))
  ORGANIZATION EXTERNAL
  (TYPE ORACLE_LOADER
   DEFAULT DIRECTORY ext_tab_dir
   ACCESS PARAMETERS
     (RECORDS
        VARIABLE 2
        DATA IS BIG ENDIAN
        CHARACTERSET US7ASCII
      FIELDS (first_name VARCHAR(2,12),
              last_name VARCHAR(2,20),
              resume VARCHAR(4,10000),
              picture VARRAW(4,100000)))
    LOCATION ('info.dat'));

info.datデータ・ファイルの内容

この例で使用するデータ・ファイルの内容は次のとおりです。

0005Alvin0008Tolliver0000001DAlvin Tolliver's Resume etc. 0000001013f4690a30bc29d7e40023ab4599ffff

わかりやすくするため、カウント・バイトのバイナリ値およびRAWデータの値は、1バイナリ・バイトをイタリック体の2文字で表示していることに注意してください。実際のデータ・ファイルでは、ASCII形式ではなくバイナリ形式の値になります。したがって、この例をカット・アンド・ペーストで使用すると、エラーが返されます。

15.3.6.14 VARCHARCおよびVARRAWC

VARCHARCデータ型には、文字データが後に続く文字カウント・フィールドが含まれます。カウント・フィールドの値は、フィールドのバイト数または文字数のいずれかです。数値が、文字数とバイト数のどちらで解釈されるかを指定する方法の詳細は、「STRING SIZES ARE IN」を参照してください。オプションのlength_of_lengthは、長さが文字とバイトのどちらで解釈されるかに応じて、VARCHARCに対するカウント・フィールドのバイト数または文字数のいずれかになります。

VARCHARCに対するlength_of_lengthsの最大値は、文字列のサイズが文字単位の場合は10で、文字列のサイズがバイト単位の場合は20です。length_of_lengthのデフォルトの値は5です。

VARRAWCデータ型には、バイナリ・データが後に続く文字カウント・フィールドが含まれます。カウント・フィールドの値は、バイナリ・データのバイト数です。length_of_lengthは、カウント・フィールドのバイト数です。

max_lenフィールドを使用して、データ・ファイルのフィールドのインスタンスの最大サイズを指定します。VARRAWCフィールドでは、max_lenはバイト数です。VARCHARCフィールドでは、max_lenは、STRING SIZES ARE IN句の設定に応じて、文字数またはバイト数のいずれかになります。

次に、VARCHARCおよびVARRAWCの使用例を示します。pictureフィールドの長さは0です。これは、このフィールドがNULLに設定されていることを意味します。

CREATE TABLE emp_load
             (first_name CHAR(15),
              last_name CHAR(20),
              resume CHAR(2000),
              picture RAW (2000))
  ORGANIZATION EXTERNAL
  (TYPE ORACLE_LOADER
    DEFAULT DIRECTORY ext_tab_dir
    ACCESS PARAMETERS
      (FIELDS (first_name VARCHARC(5,12),
               last_name VARCHARC(2,20),
               resume VARCHARC(4,10000),
               picture VARRAWC(4,100000)))
  LOCATION ('info.dat'));

00007William05Ricca0035Resume for William Ricca is missing0000

15.3.7 init_spec句

init_spec句を使用して、フィールドをNULLまたはデフォルト値に設定するタイミングを指定します。init_spec句の構文は次のとおりです。

NULLIF句およびDEFAULTIF句は、フィールドに各1回のみ指定できます。これらの句を使用して、次の処理を実行できます。

  • NULLIF condition_specを指定し、TRUEと評価された場合、フィールドはNULLに設定されます。

  • DEFAULTIF condition_specを指定し、TRUEと評価された場合、フィールドの値はデフォルトの値に設定されます。デフォルトの値は、フィールドのデータ型によって次のように異なります。

    • 文字データ型の場合は、デフォルトの値は空の文字列

    • 数値データ型の場合は、デフォルトの値は0

    • 日付データ型の場合は、デフォルトの値はNULL

  • NULLIF句とDEFAULTIF句の両方をフィールドに指定する場合、まずNULLIF句が評価され、DEFAULTIF句は、NULLIF句がFALSEと評価された場合のみに評価されます。

15.3.8 LLS句

データ・ファイルのフィールドがLOBロケーション指定子(LLS)フィールドの場合、LLS句を使用してこのことを示すことができます。LLSフィールドには、ファイル名、データ・ファイル内のLOBデータのオフセットおよび長さが含まれます。SQL*Loaderでは、この情報を使用してLOB列のデータを読み取ります。ORACLE_LOADERLLS句の構文は、次のとおりです。

LLS句を使用した場合、ORACLE_LOADERはフィールドの値を対応する列にロードしません。かわりに、値の情報を使用して、フィールドの値を見つける場所を判別します。LOBは一部または全体をロードでき、任意の位置から任意の長さで開始できます。ORACLE_LOADERは、フィールドの内容がfilename.ext.nnn.mmm/であることを要求します。各要素は次のように定義されます。

  • filename.extは、LOBを含むファイルの名前です。

  • nnnは、ファイル内のLOBのバイト単位のオフセットです。

  • mmmは、LOBの長さ(バイト)です。-1の値は、LOBがNULLであることを意味します。0の値は、LOBは存在するものの、空であることを示します。

  • スラッシュ(/)は、フィールドの終端となります。

LLS句には、Oracleディレクトリ・オブジェクトを指定するオプションのDIRECTORY句があります。

  • DIRECTORYを指定した場合、ファイルがその場所に存在する必要があり、また、そのディレクトリ・オブジェクトへのREADアクセス権限が必要です。

  • DIRECTORYを指定しない場合、ファイルがデータ・ファイルと同じディレクトリ内に存在する必要があります。

次のいずれかに該当する場合、エラーが返され、行は拒否されます。

  • ファイル名に相対パスまたは絶対パスの指定が含まれています。

  • ファイルが見つからない、オフセットが無効である、または長さがファイルの終わりを超えています。

  • フィールドの内容が予期した書式ではありません。

  • LLSフィールドに関連付けられた列のデータ型がCLOBBLOBNCLOBのいずれでもない場合。

LLSフィールドが他のフィールドの句(NULLIF句など)によって参照されている場合、アクセス・パラメータ内で、その句の評価に使用される値はデータ・ファイル内の文字列であり、その文字列により示されるファイル内のデータではありません。

LLS句で示されるファイルのデータの文字セットは、データ・ファイルと同じ文字セットとみなされます。

15.4 column_transforms句

オプションのCOLUMN TRANSFORMS句を使用した変換では、データ・ファイルの列に直接マップされない外部表の列をロードする方法を指定できます。

column_transforms句の構文は次のようになります。

ノート:

COLUMN TRANSFORMS句とPREPROCESSOR句を同時に使用することはできません。

15.4.1 transform

transform句で指定された各変換では、外部表の列を識別し、次に列の値の計算方法を指定します。構文は次のとおりです。

NULL変換は、外部表の列を各行でNULLに設定します。CONSTANT変換は、外部表の列をすべての行で同じ値に設定するために使用されます。CONCAT変換は、外部表の列をデータ・ファイルからの現在のレコード内の定数文字列またはフィールド(あるいはその両方)の連結に設定するために使用されます。LOBFILE変換は、別のデータ・ファイルからのレコードのフィールドにデータをロードするために使用されます。これらの各変換については、次の項で詳しく説明します。

15.4.1.1 column_name FROM

column_nameは、ロードする外部表の列を一意に識別します。transform句で列名が参照される場合、その名前は、データ・ファイルのフィールドとしてFIELDS句で指定することはできません。

15.4.1.2 NULL

NULL変換が指定された場合、フィールドのすべての値は各レコードに対してNULLに設定されます。

15.4.1.3 CONSTANT

CONSTANT変換では、レコードの列の値として指定された文字列の値が使用されます。外部表の列が文字列型でない場合、定数文字列は列のデータ型に変換されます。この変換は各行に対して行われます。

データ型変換で使用される文字列の文字セットは、データベースの文字セットです。

15.4.1.4 CONCAT

CONCAT変換は、データ・ファイルの定数文字列とフィールドを連結して1つの文字列にします。連結の一部として使用できるフィールドは、文字データ型でfields句にリストされているフィールドのみです。他の列変換は、連結の一部として指定できません。

15.4.1.5 LOBFILE

LOBFILE変換は、外部表の列の値として内容を使用するファイルを識別します。すべてのLOBFILEは、directory object:filename形式のオプションのディレクトリ・オブジェクトおよびファイル名で識別されます。LOBFILE変換には次の規則が適用されます。

  • ディレクトリ・オブジェクトおよびファイル名は、定数文字列またはフィールド句のフィールド名のいずれかです。

  • 定数文字列が指定された場合、その文字列を使用して表の各行のLOBFILEを検索します。

  • フィールド名が指定された場合、データ・ファイル内のそのフィールドの値を使用してLOBFILEを検索します。

  • ディレクトリ・オブジェクトまたはファイル名のいずれかに対してフィールド名が指定され、そのフィールドの値がNULLの場合、LOBFILEによってロードされる列もNULLに設定されます。

  • ディレクトリ・オブジェクトが指定されない場合、外部表に対して指定されたデフォルトのディレクトリが使用されます。

  • ディレクトリ・オブジェクトに対してフィールド名が指定された場合、FROM句も指定する必要があります。

ファイル全体がLOB列の値として使用されます。複数の行で同じファイルが参照されると、各列を移入するためにファイルが再びオープンし、再び読み込まれます。

15.4.1.6 lobfile_attr_list

lobfile_attr_listは、LOBFILEの追加属性をリストします。構文は次のとおりです。

FROM句は、LOBFILEで使用されるすべてのディレクトリ・オブジェクトの名前をリストします。LOBFILEの名前のディレクトリ・オブジェクトに対して、フィールド名が指定された場合にのみ使用します。FROM句の目的は、初期化時に名前付きのディレクトリ・オブジェクトに許可されたアクセス権の種類を識別することにあります。フィールドの値に指定されたディレクトリ・オブジェクトが、リスト内のディレクトリ・オブジェクトではない場合、行は拒否されます。

CLOB属性は、LOBFILE内のデータがRAWデータではなく、文字データであることを示します。場合によって文字データは、データベース内にLOBを格納するために使用される文字セットに変換する必要があります。

CHARACTERSET属性は、LOBFILE内のデータの文字セット名を含みます。

BLOB属性は、LOBFILE内のデータが生データであることを示します。

CLOBまたはBLOBのいずれも指定されない場合、CLOBであるとみなされます。文字LOBFILEに対して文字セットが指定されない場合、データ・ファイルの文字セットであるとみなされます。

15.4.1.7 STARTOF source_field (長さ)

STARTOFキーワードを使用すると、列がソース・フィールドのデータの部分文字列になることが可能な外部表を作成できます。

長さは、部分文字列の先頭からの長さです。長さとはバイト数のことであり、変換される外部表の列は文字長セマンティクスではなく、バイト長セマンティクスを使用するとみなされます。(文字長セマンティクスを使用すると、予期しない結果になる可能性があります。)

完全な文字コードのみが移動され、文字は分割されません。したがって、部分文字列がマルチバイト・キャラクタの途中で終わると、結果の文字列は短くなります。たとえば、長さに10を指定し、10番目のバイトがマルチバイト・キャラクタの最初のバイトである場合、最初の9バイトのみが返されます。

次の例では、部署名(dname)フィールドの最初の4バイトのみが必要となる場合の、STARTOFキーワードの使用方法を示しています。

SQL> CREATE TABLE dept (deptno  NUMBER(2),
  2                    dname   VARCHAR2(14),
  3                    loc     VARCHAR2(13)
  4                         )
  5  ORGANIZATION EXTERNAL
  6  (
  7    DEFAULT DIRECTORY def_dir1
  8    ACCESS PARAMETERS
  9    (
 10      RECORDS DELIMITED BY NEWLINE
 11      FIELDS TERMINATED BY ','
 12      (
 13        deptno           CHAR(2),
 14        dname_source     CHAR(14),
 15        loc              CHAR(13)
 16      )
 17      column transforms
 18      (
 19         dname FROM STARTOF dname_source (4)
 20      )
 21    )
 22    LOCATION ('dept.dat')
 23  );
 
Table created.
 

dept表からSELECT操作を実行する場合、dnameフィールドの最初の4バイトが返されます。

SQL> SELECT * FROM dept;
 
    DEPTNO DNAME          LOC
---------- -------------- -------------
        10 ACCO           NEW YORK
        20 RESE           DALLAS
        30 SALE           CHICAGO
        40 OPER           BOSTON
 
4 rows selected.

15.5 ORACLE_LOADERアクセス・ドライバのパラレル・ロードに関する考慮点

ORACLE_LOADERアクセス・ドライバでは、大きいデータ・ファイルを、個別に処理できるチャンクに分割します。

次のファイル、レコードおよびデータ特性によって、ファイルのパラレル処理が禁止されます。

  • 順次データ・ソース(テープ・ドライブ、パイプなど)

  • 文字の境界が文字列中の任意のバイトで始まり、境界を判断できないマルチバイト文字セットのデータ

    この制限事項は、1レコード当たりのバイト数が固定のデータ・ファイルには適用されません。

  • VAR形式のレコード

PARALLEL句の指定は、大量のデータを扱う場合にのみ有効です。

15.6 ORACLE_LOADERアクセス・ドライバを使用する際のパフォーマンスのヒント

このトピックでは、ORACLE_LOADERアクセス・ドライバを使用する際のパフォーマンスのヒントについて説明します。

パフォーマンスを監視する場合、最も重要なことは、ロードの経過時間の測定です。また、CPU使用量、メモリー使用量およびI/O率の測定も重要です。

並列度を増減することによって、パフォーマンスを変更できます。並列度は、データ・ファイルの処理に起動できるアクセス・ドライバの数を示します。並列度によって、リソース使用率を低くした遅いロードと、すべてのリソースを使用した速いロードを選択できます。アクセス・ドライバは、アクセス・ドライバ専用に使用するリソース量を判断できないため、自動的にはチューニングされません。

さらに考慮する必要があるのは、アクセス・ドライバで大きなI/Oバッファを使用すると、パフォーマンスが向上するという点です(バッファのサイズは、READSIZE句をアクセス・パラメータで使用して指定できます)。共有サーバーを使用するデータベースでは、アクセス・ドライバが使用するすべてのメモリーはSystem Global Area(SGA)から割り当てられます。そのため、共有サーバー上の外部表を使用する際には注意が必要です。

また、パフォーマンスは、日付キャッシュ機能を使用して向上できる場合もあります。ロード中に予測される一意の日付の数を指定するために日付キャッシュを使用すると、入力データ内に多数の重複する日付またはタイムスタンプ値が存在する場合に日付変換が実行される回数を減らすことができます。外部表で提供される日付キャッシュ機能は、SQL*Loaderで提供されるものと同じです。詳細は、「DATE_CACHE」を参照してください。

パフォーマンスを向上させるには、並列度の変更および日付キャッシュの使用に加えて、次のことを考慮してください。

  • 固定長レコードは、文字列で終了しているレコードより速く処理される。

  • 固定長フィールドは、デリミタ付きフィールドより速く処理される。

  • シングルバイト文字セットは、最も速く処理される。

  • 固定幅文字セットは、可変幅文字セットより速く処理される。

  • 可変幅文字セットのバイト長セマンティクスは、文字長セマンティクスより早く処理される。

  • 1文字のレコード終了デリミタおよびフィールド・デリミタは、複数文字のデリミタより速く処理される。

  • 文字セットを変換するより、データ・ファイルの文字セットをデータベースの文字セットに一致させる方が速く処理される。

  • データ型を変換するより、データ・ファイルのデータ型をデータベースのデータ型に一致させる方が速く処理される。

  • 拒否された行を拒否ファイルに書き込まない場合は、オーバーヘッドが削減されるため、処理速度が速くなる。

  • 条件句(WHENNULLIFおよびDEFAULTIFを含む)を使用すると、処理速度が遅くなる。

  • アクセス・ドライバは、マルチスレッドを使用して作業をできるだけ簡素化します。

15.7 ORACLE_LOADERアクセス・ドライバ使用時の制限事項

この項では、ORACLE_LOADERアクセス・ドライバを使用する際に認識しておく必要がある制限事項について説明します。

具体的には次のとおりです。

  • 暗号化された列がある外部表のエクスポートとインポートは、サポートされていません。

  • 列処理: デフォルトでは、外部表の機能は、外部表に定義されたすべての列をフェッチします。これによって、すべての問合せに対し、一貫した結果が保証されます。ただし、パフォーマンスを考慮して、外部表内で参照される列だけを処理することができます。これによって、データ変換の量および問合せの実行で必要なデータ処理の量を最小限にします。この場合、データ型変換エラーが発生した列を含んでいたために拒否された行も、その列が参照されないかぎり、別の問合せでは拒否されません。ALTER TABLEコマンドを使用すると、この列処理動作を変更できます。

  • 外部表は、LONG列にデータをロードできません。

  • ORACLE_LOADERアクセス・ドライバのアクセス・パラメータにSQL文字列を指定できません。解決策として、外部表を読み取る文のSELECT句にDECODE句を使用できます。また、DECODE句を使用する外部表のビューを作成して、外部表ではなくそのビューから選択することもできます。

  • 外部表では、文字列内のバックスラッシュ(\)の使用はサポートされていません。詳細は、「バックスラッシュ・エスケープ文字の使用」を参照してください。

  • 外部表アクセス・パラメータにおいて列名や表名などの識別子が指定される場合、特定の値はアクセス・パラメータ・パーサーによって予約語とみなされます。予約語を識別子として使用するには、二重引用符で囲む必要があります。

15.8 ORACLE_LOADERアクセス・ドライバの予約語

外部表アクセス・パラメータにおいて列名や表名などの識別子が指定される場合、特定の値はアクセス・パラメータ・パーサーによって予約語とみなされます。

予約語を識別子として使用するには、二重引用符で囲む必要があります。ORACLE_LOADERアクセス・ドライバの予約語は、次のとおりです。

  • ALL

  • AND

  • ARE

  • ASTERISK

  • AT

  • ATSIGN

  • BADFILE

  • BADFILENAME

  • BACKSLASH

  • BENDIAN

  • BIG

  • BLANKS

  • BY

  • BYTES

  • BYTESTR

  • CHAR

  • CHARACTERS

  • CHARACTERSET

  • CHARSET

  • CHARSTR

  • CHECK

  • CLOB

  • COLLENGTH

  • COLON

  • COLUMN

  • COMMA

  • CONCAT

  • CONSTANT

  • COUNTED

  • DATA

  • DATE

  • DATE_CACHE

  • DATE_FORMAT

  • DATEMASK

  • DAY

  • DEBUG

  • DECIMAL

  • DEFAULTIF

  • DELIMITBY

  • DELIMITED

  • DISCARDFILE

  • DNFS_ENABLE

  • DNFS_DISABLE

  • DNFS_READBUFFERS

  • DOT

  • DOUBLE

  • DOUBLETYPE

  • DQSTRING

  • DQUOTE

  • DSCFILENAME

  • ENCLOSED

  • ENDIAN

  • ENDPOS

  • EOF

  • EQUAL

  • EXIT

  • EXTENDED_IO_PARAMETERS

  • EXTERNAL

  • EXTERNALKW

  • EXTPARM

  • FIELD

  • FIELDS

  • FILE

  • FILEDIR

  • FILENAME

  • FIXED

  • FLOAT

  • FLOATTYPE

  • FOR

  • FROM

  • HASH

  • HEXPREFIX

  • IN

  • INTEGER

  • INTERVAL

  • LANGUAGE

  • IS

  • LEFTCB

  • LEFTTXTDELIM

  • LEFTP

  • LENDIAN

  • LDRTRIM

  • LITTLE

  • LOAD

  • LOBFILE

  • LOBPC

  • LOBPCCONST

  • LOCAL

  • LOCALTZONE

  • LOGFILE

  • LOGFILENAME

  • LRTRIM

  • LTRIM

  • MAKE_REF

  • MASK

  • MINUSSIGN

  • MISSING

  • MISSINGFLD

  • MONTH

  • NEWLINE

  • NO

  • NOCHECK

  • NOT

  • NOBADFILE

  • NODISCARDFILE

  • NOLOGFILE

  • NOTEQUAL

  • NOTERMBY

  • NOTRIM

  • NULL

  • NULLIF

  • OID

  • OPTENCLOSE

  • OPTIONALLY

  • OPTIONS

  • OR

  • ORACLE_DATE

  • ORACLE_NUMBER

  • PLUSSIGN

  • POSITION

  • PROCESSING

  • QUOTE

  • RAW

  • READSIZE

  • RECNUM

  • RECORDS

  • REJECT

  • RIGHTCB

  • RIGHTTXTDELIM

  • RIGHTP

  • ROW

  • ROWS

  • RTRIM

  • SCALE

  • SECOND

  • SEMI

  • SETID

  • SIGN

  • SIZES

  • SKIP

  • STRING

  • TERMBY

  • TERMEOF

  • TERMINATED

  • TERMWS

  • TERRITORY

  • TIME

  • TIMESTAMP

  • TIMEZONE

  • TO

  • TRANSFORMS

  • UNDERSCORE

  • UINTEGER

  • UNSIGNED

  • VALUES

  • VARCHAR

  • VARCHARC

  • VARIABLE

  • VARRAW

  • VARRAWC

  • VLENELN

  • VMAXLEN

  • WHEN

  • WHITESPACE

  • WITH

  • YEAR

  • ZONED