8.8 RDFデータの効率的なロード
Oracle RDF Graph Adapter for Eclipse RDF4Jには、ファイルまたはコレクションから大量のRDFデータを効率的にロードするための追加または改善されたJavaメソッドが用意されています。
RDFデータのバルク・ロード
アダプタのバルク・ロード機能には、次の2つのステップが含まれます。
- ファイルまたは文のコレクションからステージング表へのRDFデータのロード。
- ステージング表からRDF記憶域表へのRDFデータのロード。
アダプタのOracleBulkUpdateHandlerクラスには、バルク・ロードを実装する2種類の方法を可能にするメソッドが用意されています。
addInBulk: これらのメソッドを使用すると、RDFデータのバルク・ロードで説明されている両方のステップを1回の起動で実行できます。この方法は、ロード元のファイルまたはコレクションが1つのみの場合に適しています。prepareBulkおよびcompleteBulk:prepareBulkを1回以上起動できます。各コールでは、RDFデータのバルク・ロードのステップ1を実装します。後で、
completeBulkを1回起動してRDFデータのバルク・ロードのステップ2を実行し、これら複数のprepareBulkコールから取得したステージング表データをロードできます。この方法は、ロード元のファイルが複数ある場合に適しています。
また、アダプタの OracleSailRepositoryConnectionクラスは、SailRepositoryConnectionクラスの次のメソッドについてバルク・ロード実装を提供します。
public void add(InputStream in,
String baseURI,
RDFFormat dataFormat,
Resource... contexts)圧縮ファイルからのバルク・ロードもサポートされていますが、現在はgzipファイルのみに制限されています。