8.8 RDFデータの効率的なロード
Oracle RDF Graph Adapter for Eclipse RDF4Jには、ファイルまたはコレクションから大量のRDFデータを効率的にロードするための追加または改善されたJavaメソッドが用意されています。
RDFデータのバルク・ロード
アダプタのバルク・ロード機能には、次の2つのステップが含まれます。
- ファイルまたは文のコレクションからステージング表へのRDFデータのロード。
- ステージング表からRDF記憶域表へのRDFデータのロード。
アダプタのOracleBulkUpdateHandler
クラスには、バルク・ロードを実装する2種類の方法を可能にするメソッドが用意されています。
addInBulk
: これらのメソッドを使用すると、RDFデータのバルク・ロードで説明されている両方のステップを1回の起動で実行できます。この方法は、ロード元のファイルまたはコレクションが1つのみの場合に適しています。prepareBulk
およびcompleteBulk
:prepareBulk
を1回以上起動できます。各コールでは、RDFデータのバルク・ロードのステップ1を実装します。後で、
completeBulk
を1回起動してRDFデータのバルク・ロードのステップ2を実行し、これら複数のprepareBulk
コールから取得したステージング表データをロードできます。この方法は、ロード元のファイルが複数ある場合に適しています。
また、アダプタの OracleSailRepositoryConnection
クラスは、SailRepositoryConnection
クラスの次のメソッドについてバルク・ロード実装を提供します。
public void add(InputStream in, String baseURI, RDFFormat dataFormat, Resource... contexts)
圧縮ファイルからのバルク・ロードもサポートされていますが、現在はgzipファイルのみに制限されています。