5.4.2 グラフ・データのパラレル・ロード

グラフ・データのパラレル・ロードを実行するために、Java APIが提供されています。

Oracle Spatial and Graphはグラフ・データのOracle Databaseへのロードをサポートします。グラフ・データは次の方法を使用してプロパティ・グラフにロードされます。

  • 頂点およびエッジは、graph.addVertex(Object id)/graph.addEdge(Object id) APIを使用して、増分を追加できます。

  • グラフ・データは、OraclePropertyGraphDataLoader APIを使用して、Oracleフラット・ファイル形式のファイルからパラレルにロードできます。

  • GraphML、GMLまたはGraphSONのプロパティ・グラフは、GMLReaderGraphMLReaderおよびGraphSONReaderをそれぞれ使用してロードできます。

このトピックでは、Oracle定義のフラット・ファイル形式でのプロパティ・グラフのパラレル・ロードに焦点を当てています。

パラレル・データ・ロードは、頂点(またはエッジ)入力ストリームが複数のチャンクに分割され、Oracle Databaseにパラレルにロードされる場合の、データのロードへの最適化されたソリューションを提供します。この操作には、2つの主なオーバーラップ・フェーズが含まれます。

  • 分割。頂点およびエッジ入力ストリームが複数のチャンクに分割され、一時入力ストリームに保存されます。チャックの数は指定した並列度によって決定されます

  • グラフのロード。各チャンクに対し、頂点(またはエッジ)に関する情報を処理し、データをプロパティ・グラフ表にロードするために、ローダー・スレッドが作成されます。

OraclePropertyGraphDataLoaderはいくつかの異なるオプションを使用してパラレル・データ・ロードをサポートします。