Utilisation de blocs-notes

Vous pouvez utiliser des blocs-notes pour explorer et visualiser des données. Cette section explique comment installer des blocs-notes Jupyter et utiliser des blocs-notes Big Data Studio dans Oracle Big Data.

Les blocs-notes sont des plates-formes Web destinées aux analystes de données. Il s'agit d'environnements interactifs destinés à l'exécution de code. Ils prennent en charge des bibliothèques, des analyses graphiques et des visualisations qui accélèrent les processus d'exploration et d'analyse des données.

Pour la distribution Oracle avec Apache Hadoop (ODH) et la distribution Cloudera avec Apache Hadoop (CDH), vous disposez des options de bloc-notes suivantes.

  • Les blocs-notes Jupyter sont disponibles uniquement pour ODH.
    Vous pouvez installer Jupyter sur les noeuds du cluster ODH et y accéder via un navigateur.
  • Les blocs-notes Big Data Studio sont disponibles pour ODH et CDH.

    Lorsque vous créez un cluster, Big Data Studio est installé et configuré sur chacun de ses noeuds.

Vous pouvez importer des données dans vos blocs-notes à partir de sources telles que des fichiers ou des bases de données HDFS ou Spark. Vous pouvez ensuite analyser ces données à l'aide d'environnements d'interpréteur pour toute une gamme de langages, tels que Python, PySpark et Spark.