Utilisation d'Apache Tez
Utilisez Apache Tez comme structure pour le traitement du Big Data basé sur la technologie MapReduce sur les clusters Big Data Service.
Remarque
Big Data Service 3.1.1 ou version ultérieure requiert que la source
Big Data Service 3.1.1 ou version ultérieure requiert que la source
tez-env.sh
inclue des fichiers JAR Hadoop dans la variable d'environnement CLASSPATH.# Login as tez user
sudo -u {user}
# Source the tez-env.sh inorder to set the classpath
source /etc/tez/conf/tez-env.sh
# Run tez application
hadoop jar /usr/odh/current/tez-client/tez-tests-*.jar testorderedwordcount -DUSE_TEZ_SESSION=true /tmp/tezcmdtests/input1/ /tmp/tezcmdtests-output/output1/ /tmp/tezcmdtests/input2/ /tmp/tezcmdtests-output/output2/ /tmp/tezcmdtests/input3/ /tmp/tezcmdtests-output/output3/\"".format(user=self.user)
Propriétés de configuration Tez
Tez les propriétés de configuration incluses dans Big Data Service 3.1.1 ou version ultérieure.
Configuration | Propriété | Description |
---|---|---|
tez-env |
tez_classpath_ext |
Chemins contenant les bibliothèques Hadoop pour Tez |