Interpréter les résultats d'un modèle d'analyse de similarité

Lorsque vous exécutez un flux de données pour effectuer une analyse de similarité, Oracle Analytics génère un jeu de données contenant les résultats.

Actions possibles :
  • Localisez le jeu de données de sortie dans la page Données d'Oracle Analytics. Recherchez un jeu de données portant le nom spécifié à l'étape Enregistrer les données dans le flux de données. Le jeu de données contient les mêmes colonnes de sortie que celles répertoriées dans la section Sorties de l'étape Analyse de similarité de votre flux de données.

    Colonnes de jeu de données générées par le modèle d'analyse de similarité :

    • source_value - Retourne la colonne comportant une seule valeur qui a été sélectionnée dans le flux de données en tant qu'objet source. Votre distance vectorielle est mesurée par cette valeur par rapport à toutes les autres valeurs de cette colonne.
    • source_reference_column1 - Retourne la valeur sélectionnée de la colonne de référence (telle que définie dans les propriétés du noeud de flux de données) pour les enregistrements sélectionnés dans les enregistrements sources aux fins d'analyse de similarité. Cette sortie vous aidera à déterminer l'enregistrement source pour lequel vous avez trouvé les enregistrements les plus proches ou les plus éloignés.
    • results_reference_column1, 2 et 3 - Retourne la valeur des colonnes de référence respectives (telles que définies dans les propriétés du noeud de flux de données) pour les enregistrements identifiés comme étant les plus proches ou les plus éloignés par l'analyse de similarité.
    • distance - Distance calculée entre la valeur source et l'enregistrement de résultat. Autrement dit, le degré de similarité ou de différence entre les données de source_reference_col1, source_reference_col2 et source_reference_col3 et celles de result_reference1, result_reference2 et result_reference3.
    • profile_expression - Expression de toutes les colonnes utilisées dans votre modèle d'analyse de similarité concaténée en une seule chaîne. Il s'agit des colonnes pour lesquelles des valeurs ont été vectorisées par le modèle de plongement.

      Note :

      Les colonnes d'attributs que vous avez sélectionnées font partie de la chaîne de profil, tandis que les mesures des colonnes de mesure sont d'abord catégorisées dynamiquement en sections inférieure, moyenne et supérieure afin d'être correctement représentées dans les vecteurs.
  • Créez un classeur basé sur le jeu de données de sortie généré par votre flux de données d'analyse de similarité.
  • Créez des visualisations pour analyser les résultats. Par exemple :