8.8 RDFデータの効率的なロード

Oracle RDF Graph Adapter for Eclipse RDF4Jには、ファイルまたはコレクションから大量のRDFデータを効率的にロードするための追加または改善されたJavaメソッドが用意されています。

RDFデータのバルク・ロード

アダプタのバルク・ロード機能には、次の2つのステップが含まれます。

  1. ファイルまたは文のコレクションからステージング表へのRDFデータのロード。
  2. ステージング表からRDF記憶域表へのRDFデータのロード。

アダプタのOracleBulkUpdateHandlerクラスには、バルク・ロードを実装する2種類の方法を可能にするメソッドが用意されています。

  1. addInBulk: これらのメソッドを使用すると、RDFデータのバルク・ロードで説明されている両方のステップを1回の起動で実行できます。この方法は、ロード元のファイルまたはコレクションが1つのみの場合に適しています。
  2. prepareBulkおよびcompleteBulk: prepareBulkを1回以上起動できます。各コールでは、RDFデータのバルク・ロードのステップ1を実装します。

    後で、completeBulkを1回起動してRDFデータのバルク・ロードのステップ2を実行し、これら複数のprepareBulkコールから取得したステージング表データをロードできます。この方法は、ロード元のファイルが複数ある場合に適しています。

また、アダプタの OracleSailRepositoryConnectionクラスは、SailRepositoryConnectionクラスの次のメソッドについてバルク・ロード実装を提供します。

public void add(InputStream in,
                     String baseURI,
                     RDFFormat dataFormat,
                     Resource... contexts)

圧縮ファイルからのバルク・ロードもサポートされていますが、現在はgzipファイルのみに制限されています。