このトピックでは、データ処理(DP)クラスパスへのカスタムSerDeの追加プロセスについて説明します。
CREATE TABLE samples_table(id INT, city STRING, country STRING, region STRING, population INT) ROW FORMAT SERDE 'org.apache.hadoop.hive.contrib.serde2.JsonSerde';
このSerDes jarがEDPインストールにパッケージ化されていない場合、データ処理の実行時にそのHive表を読み込むことができないため、Dgraphにデータをインポートできなくなります。この問題を解決するには、カスタムSerDeをOozieデータ処理ワークフローに統合します。
カスタムSerDe jarをOozieデータ処理ワークフローに統合するには:
この結果、SerDe jarがDPクラスパス内に含まれます。つまり、DPワークフローが自動的に開始されるか、Studioによって開始されるか、またはDP CLIを実行することによって開始されるかとは関係なく、すべてのDPワークフローでSerDeが使用されるようになります。