Configuración de Object Storage con Map Reduce

Para ejecutar un ejemplo, cree un archivo de entrada que incluya palabras con un tamaño variable y, a continuación, cargue el archivo en Object Storage.
Nota

Puede utilizar nodos de cluster de Big Data Service para la configuración del servicio y ejemplos en ejecución. Para utilizar un nodo de límite, debe crear el nodo de límite y conectarse a él.
  1. (Opcional) Para utilizar un nodo de perímetro para configurar Object Storage, cree primero un nodo de perímetro y, a continuación, conéctese al nodo.
  2. Cree un nodo Edge y, a continuación, conéctese al nodo.
  3. Cree un archivo de entrada con palabras de frecuencia variable y, a continuación, cárguelo en Object Storage.
  4. Copie la clave de API en el nodo de perímetro del nodo un0.
    sudo dcli rsync -a <un0-hostname>:/opt/oracle/bds/.oci_oos/ /opt/oracle/bds/.oci_oos/
  5. Cree un usuario con permisos suficientes y un archivo JCEKS con el valor de frase de contraseña necesario. Si va a crear un archivo JCEKS local, copie el archivo en todos los nodos y cambie los permisos de usuario.
    sudo dcli -f <location_of_jceks_file> -d <location_of_jceks_file>
    sudo dcli chown <user>:<group> <location_of_jceks_file>
  6. Agregue una de las siguientes combinaciones HADOOP_OPTS al perfil bash de usuario.
    Opción 1:
    export HADOOP_OPTS="$HADOOP_OPTS -DOCI_SECRET_API_KEY_ALIAS=<api_key_alias> 
    -DBDS_OSS_CLIENT_REGION=<api_key_region> 
    -DOCI_SECRET_API_KEY_PASSPHRASE=<jceks_file_provider>"
    

    Opción 2:

    export HADOOP_OPTS="$HADOOP_OPTS -DBDS_OSS_CLIENT_AUTH_FINGERPRINT=<api_key_fingerprint> 
    -DBDS_OSS_CLIENT_AUTH_PASSPHRASE=<jceks_file_provider> -DBDS_OSS_CLIENT_AUTH_PEMFILEPATH=<api_key_pem_file_path> 
    -DBDS_OSS_CLIENT_AUTH_TENANTID=<api_key_tenant_id> -DBDS_OSS_CLIENT_AUTH_USERID=<api_key_user_id> 
    -DBDS_OSS_CLIENT_REGION=<api_key_region>"
    
  7. (Opcional) Para verificar la conectividad de Object Storage:
    1. Cree un archivo de entrada que incluya palabras de tamaño variable y, a continuación, cargue el archivo en Object Storage.
    2. Ejecución:
      hadoop jar /usr/odh/current/hadoop-mapreduce-client/hadoop-mapreduce-examples.jar wordcount 
      -Dmapreduce.reduce.java.opts="${MAPRED_OPTS}" -Dmapreduce.map.java.opts="${MAPRED_OPTS}" 
      -Dyarn.app.mapreduce.am.command-opts="${MAPRED_OPTS}" oci://<bucket-name>@<namespace>/<input_file_name> 
      oci://<bucket-name>@<namespace>/<output_file_name>