Configurazione di Spark per accedere al metastore di Data Catalog
Configurare Spark per accedere al metastore Data Catalog.
- Accedi ad Apache Ambari.
- Nella barra degli strumenti laterale, in Servizi selezionare Spark3.
- Selezionare la scheda Configs, quindi espandere la sezione Advanced spark3-defaults.
-
Aggiungere o aggiornare la chiave
spark.sql.hive.metastore.jarscon il valore seguente:/usr/lib/oci-dcat-metastore-client/lib/integration/*:/usr/lib/oci-dcat-metastore-client/lib/*:/usr/lib/hive/lib/*:{{spark_home}}/jars/* -
Aggiungere o aggiornare la chiave
spark.sql.warehouse.dircon il percorso di storage degli oggetti per la tabella gestita. Esempio:oci://bucket-name@tenancy-name-of-bucket/path/to/managed/table/directory. - Espandere la sezione Impostazioni predefinite spark3 personalizzate.
-
Aggiungere o aggiornare la chiave
spark.driver.extraJavaOptionscon il valore seguente:-Doracle.dcat.metastore.client.show_provider_details=true -Doracle.dcat.metastore.client.custom.authentication_provider=com.oracle.pic.dcat.metastore.commons.auth.provider.UserPrincipalsCustomAuthenticationDetailsProvider -DOCI_TENANT_METADATA=ocid1.tenancy.oc1.<unique_ID> -DOCI_REGION_METADATA=<region-identifier> -DOCI_USER_METADATA=ocid1.user.oc1.<unique_ID> -DOCI_FINGERPRINT_METADATA=<user-finger-print> -DOCI_PVT_KEY_FILE_PATH=/private <key-file-path.pem> -DOCI_PASSPHRASE_METADATA="<passphase-of-the-key>" -Doci.metastore.uris=https://datacatalog.<region>.oci.oraclecloud.com:443 -Doracle.dcat.metastore.id=ocid1.datacatalogmetastore.oc1.<unique_ID> -
Aggiungere o aggiornare la chiave
spark.hadoop.fs.AbstractFileSystem.oci.implcon il valorecom.oracle.bmc.hdfs.Bmc. -
Aggiungere o aggiornare la chiave
spark.hadoop.fs.oci.client.hostnamecon l'URL dello storage degli oggetti. Esempio:https://objectstorage.<region-identifier>.oraclecloud.com. - Espandere la sezione Override sito Beehive spark3 personalizzato.
-
Aggiungere o aggiornare la chiave
hive.metastore.uriscon l'URL del metastore. Esempio:https://datacatalog.<region-identifier>.oci.oraclecloud.com:443. -
Aggiungere o aggiornare la chiave
hive.metastore.warehouse.dircon il percorso di storage degli oggetti per la tabella gestita. Esempio:oci://bucket-name@tenancy-name-of-bucket/path/to/managed/table/directory. -
Aggiungere o aggiornare la chiave
hive.metastore.warehouse.external.dircon il percorso di storage degli oggetti per la tabella esterna. Esempio:oci://bucket-name@tenancy-name-of-bucket/path/to/external/table/directory. - Espandere la sezione Advanced spark3-thrift-sparkconf.
-
Aggiungere o aggiornare la chiave
spark.sql.hive.metastore.jarscon il valore seguente:/usr/lib/oci-dcat-metastore-client/lib/integration/*:/usr/lib/oci-dcat-metastore-client/lib/*:/usr/lib/hive/lib/*:{{spark_home}}/jars/*Nota
Assicurarsi di non disporre di:{{hadoop_home}}/lib/*. - Espandere la sezione Custom spark3-thrift-sparkconf.
-
Aggiungere o aggiornare la chiave
spark.driver.extraJavaOptionscon il valore seguente:-Doracle.dcat.metastore.client.show_provider_details=true -Doracle.dcat.metastore.client.custom.authentication_provider=com.oracle.pic.dcat.metastore.commons.auth.provider.UserPrincipalsCustomAuthenticationDetailsProvider -DOCI_TENANT_METADATA=ocid1.tenancy.oc1.<unique_ID> -DOCI_REGION_METADATA=<region-identifier> -DOCI_USER_METADATA=ocid1.user.oc1.<unique_ID> -DOCI_FINGERPRINT_METADATA=<user-finger-print> -DOCI_PVT_KEY_FILE_PATH=/private <key-file-path.pem> -DOCI_PASSPHRASE_METADATA="<passphase-of-the-key>" -Doci.metastore.uris=https://datacatalog.<region>.oci.oraclecloud.com:443 -Doracle.dcat.metastore.id=ocid1.datacatalogmetastore.oc1.<unique_ID> - Selezionare Riavvia per riavviare il servizio Spark nel cluster Big Data Service.