Problèmes connus pour le service de mégadonnées

Des problèmes connus ont été identifiés dans le service de mégadonnées.

La liste déroulante de l'interface utilisateur Ranger ne liste pas tous les utilisateurs synchronisés

Détails
Même si un utilisateur est synchronisé, il se peut qu'il n'apparaisse pas dans la liste déroulante Consultation d'utilisateur lors de la création d'une politique dans l'interface utilisateur de Ranger. Ce problème est généralement causé par la valeur par défaut de la propriété ranger.db.maxrows.default.
Solution de rechange
Augmentez la valeur de ranger.db.maxrows.default pour qu'elle corresponde ou dépasse le nombre d'utilisateurs dans votre système d'exploitation ou Active Directory. Pour plus d'informations, voir Configurations avancées de Ranger.

Échec de la tâche de synchronisation des bases de données Hive lors de la spécification d'un caractère générique dans Apache Ambari

Détails
Dans les grappes du service de mégadonnées utilisant la distribution Oracle avec Apache Hadoop, si vous synchronisez les bases de données de ruche en spécifiant le caractère générique * pour la propriété Synchronize Hive Databases à l'aide d'Apache Ambari, vous recevez une erreur indiquant que la synchronisation des métadonnées Hive a échoué.
Solution de rechange
Nous sommes conscients du problème et travaillons à le résoudre. Pendant ce temps, n'utilisez pas le caractère générique * pour la propriété Synchronize Hive Databases, mais spécifiez explicitement les bases de données Hive que vous voulez synchroniser sous la forme d'une liste de valeurs séparées par des virgules, sans espaces. Par exemple : db1,db2.

Échec du redémarrage de Kafka Broker

Détails
Lors du redémarrage du courtier Kafka, le courtier Kafka peut ne pas démarrer.
Solution de rechange
Supprimez le fichier .lock manuellement :
  1. Accédez par SSH au noeud du courtier défaillant.
  2. Exécution :

    rm rf /u01/kafka-logs/.lock

La tâche Spark pourrait échouer avec une erreur 401 lors de la tentative de téléchargement des politiques Ranger-Spark

Détails
Dans une grappe hautement disponible pour le service de mégadonnées avec le plugiciel Ranger-Spark activé, lorsque vous tentez une opération sur des tables Hive à l'aide de la commande spark-submit en mode de grappe, la tâche Spark peut échouer avec une erreur 401 lors de la tentative de téléchargement des politiques Ranger-Spark. Ce problème provient d'un problème connu de jeton de délégation du côté Ranger.
Solution de rechange
Nous vous recommandons d'inclure le keytab et le principal de l'utilisateur dans la commande spark-submit. Cette approche garantit que Spark utilise le keytab et le principal fournis pour l'authentification, ce qui lui permet de communiquer avec Ranger pour télécharger des politiques sans se fier aux jetons de délégation.

Exemple :

spark-submit --master yarn --deploy-mode cluster --name SparkHiveQueryJob --keytab <keytab-path> --principal <keytab-principal> --class com.oracle.SparkHiveQuery ./SparkTests-1.0-SNAPSHOT.jar
Note

  • L'utilisateur fourni (utilisateur/principal de l'onglet de clé) doit disposer des autorisations nécessaires pour télécharger les politiques et les marqueurs Ranger. Ces autorisations peuvent être configurées à l'aide de l'interface utilisateur Ranger-admin.

    Dans Ranger, sélectionnez Modifier pour le référentiel Spark et allez à la section Ajouter de nouvelles configurations. Assurez-vous que l'utilisateur spécifié est ajouté à la fois aux listes policy.download.auth.users et tag.download.auth.users. Si ce n'est pas le cas, ajoutez l'utilisateur et enregistrez.

    Exemple :

    étincelle, jupyterhub, teinte, levrette, trino

  • Accordez les autorisations requises au même utilisateur dans les politiques Ranger-Spark pour accéder aux tables nécessaires.

Pour plus d'informations sur les plugiciels Ranger, voir Utilisation des plugiciels Ranger.