Interprétation des résultats d'un modèle d'analyse de similarité

Lorsque vous exécutez un flux de données pour effectuer une analyse de similarité, Oracle Analytics génère un ensemble de données contenant les résultats.

Voici ce que vous pouvez faire :

Localisez l'ensemble de données de sortie sur la page des données Oracle Analytics. Recherchez un ensemble de données avec le nom spécifié à l'étape Enregistrer les données dans le flux de données. L'ensemble de données contient les mêmes colonnes de sortie que celles répertoriées dans la section Sorties de l'étape Analyse de similarité dans votre flux de données.

.png

Colonnes d'ensemble de données générées par le modèle d'analyse de similarité :
- source_value : renvoie la colonne avec une seule valeur qui a été sélectionnée dans le flux de données en tant qu'objet source. La distance vectorielle est mesurée selon cette valeur par rapport à toutes les autres valeurs de la colonne.
- source_reference_column1 : renvoie la valeur sélectionnée de la colonne de référence (comme défini dans les propriétés de noeud de flux de données) pour les enregistrements sélectionnés dans les enregistrements source pour l'analyse de similarité. Cette sortie vous aidera à déterminer l'enregistrement source pour lequel vous avez trouvé les enregistrements les plus proches ou les plus éloignés.
- results_reference_column1, 2 et 3 : renvoie la valeur des colonnes de référence respectives (comme défini dans les propriétés de noeud de flux de données) pour les enregistrements identifiés comme étant les plus proches ou les plus éloignés par l'analyse de similarité.
- distance : distance calculée entre la valeur source et l'enregistrement de résultat. Autrement dit, degré de similarité des données entre source_reference_col1, source_reference_col2 et source_reference_col3 d'un côté, et result_reference1, result_reference2 et result_reference3 de l'autre.
- profile_expression : expression concaténée (en une seule chaîne) de toutes les colonnes utilisées dans le modèle d'analyse de similarité. Il s'agit des colonnes pour lesquelles les valeurs ont été vectorisées par le modèle de plongement.
  
  Remarque :
  Les colonnes d'attribut que vous avez sélectionnées font partie de la chaîne de profil, tandis que les indicateurs des colonnes de mesure sont d'abord catégorisés de manière dynamique dans les plages basse, moyenne et haute afin d'être correctement représentés dans les vecteurs.
Créez un classeur basé sur l'ensemble de données de sortie généré par le flux de données d'analyse de similarité.
Créez des visualisations pour analyser les résultats. Par exemple :

.png

Conseil : pour des visualisations et des infos clés améliorées, ajoutez l'ensemble de données d'origine et connectez-vous aux données de sortie de modèle à l'aide de l'ID de membre. Vous disposez ainsi d'un niveau de détail supplémentaire pour mesurer la distance vectorielle par rapport à certains attributs de l'ensemble de données d'origine.