このトピックでは、データ処理(DP)クラスパスにカスタムSerializer-Deserializer (SerDe)を追加するプロセスについて説明します。
CREATE TABLE samples_table( id INT, city STRING, country STRING, region STRING, population INT) ROW FORMAT SERDE 'org.apache.hadoop.hive.contrib.serde2.JsonSerde';
SerDe JARが、Big Data Discoveryの一部であるデータ処理パッケージとともにパッケージ化されていない場合、データ処理実行はHive表を読み取ることができないため、データをDgraphにインポートできません。 この問題を解決するために、カスタムSerDeをデータ処理ワークフローに統合できます。
SELECT *
問合せによってエラーが発行されていないことを確認します。 この問合せがHueとHive CLIから機能することを検証して、SerDeが適切に追加されたことを確認してください。
カスタムSerDe JARをデータ処理ワークフローに統合するには:
その結果、SerDe JARがデータ処理クラスパスに追加されます。 つまり、SerDeクラスは、Studioによって自動的に開始されるか、データ処理CLIを実行するかに関係なく、すべてのデータ処理ワークフローで使用されることになります。