このトピックでは、DP CLIがSnappy圧縮でHive表を処理できるようにSnappyライブラリを設定する方法について説明します。
デフォルトでは、DP CLIはSnappy圧縮でHive表を正常に処理できません。 その理由は、必要なHadoopネイティブ・ライブラリがJVMのライブラリ・パスで使用できないためです。 そのため、Hadoopのネイティブ・ライブラリをそのソースのロケーションから適切なBDDディレクトリにコピーする必要があります。
Snappyライブラリを設定するには:
このコピーが完了したら、以降のすべてのDPワークフローで、Snappy圧縮でHive表を処理できるようにする必要があります。
新しいデータ処理ノードを追加した場合は、Hadoopネイティブ・ライブラリを新しいノードに手動でコピーする必要があります。