5.4.2 グラフ・データのパラレル・ロード
グラフ・データのパラレル・ロードを実行するために、Java APIが提供されています。
Oracle Spatial and Graphはグラフ・データのOracle Databaseへのロードをサポートします。グラフ・データは次の方法を使用してプロパティ・グラフにロードされます。
-
頂点およびエッジは、
graph.addVertex(Object id)/graph.addEdge(Object id)
APIを使用して、増分を追加できます。 -
グラフ・データは、
OraclePropertyGraphDataLoader
APIを使用して、Oracleフラット・ファイル形式のファイルからパラレルにロードできます。 -
GraphML、GMLまたはGraphSONのプロパティ・グラフは、
GMLReader
、GraphMLReader
およびGraphSONReader
をそれぞれ使用してロードできます。
このトピックでは、Oracle定義のフラット・ファイル形式でのプロパティ・グラフのパラレル・ロードに焦点を当てています。
パラレル・データ・ロードは、頂点(またはエッジ)入力ストリームが複数のチャンクに分割され、Oracle Databaseにパラレルにロードされる場合の、データのロードへの最適化されたソリューションを提供します。この操作には、2つの主なオーバーラップ・フェーズが含まれます。
-
分割。頂点およびエッジ入力ストリームが複数のチャンクに分割され、一時入力ストリームに保存されます。チャックの数は指定した並列度によって決定されます
-
グラフのロード。各チャンクに対し、頂点(またはエッジ)に関する情報を処理し、データをプロパティ・グラフ表にロードするために、ローダー・スレッドが作成されます。
OraclePropertyGraphDataLoader
はいくつかの異なるオプションを使用してパラレル・データ・ロードをサポートします。