Resultaten van een model voor similariteitsanalyses interpreteren

Wanneer u een gegevensstroom uitvoert om een similariteitsanalyse uit te voeren, wordt in Oracle Analytics een gegevensset gegenereerd die de resultaten bevat.

U kunt het volgende doen:

Zoek de uitgevoerde gegevensset op de pagina 'Oracle Analytics gegevens'. Zoek naar een gegevensset met de naam die is opgegeven in de stap Gegevens opslaan in de gegevensstroom. De gegevensset bevat dezelfde uitvoerkolommen die worden vermeld in de sectie Uitvoer van de stap 'Similariteitsanalyse' in uw gegevensstroom.

.png

Gegevenssetkolommen die zijn gegenereerd door het model van de similariteitsanalyse:
- source_value: hiermee wordt de kolom geretourneerd met één waarde binnen die kolom die in de gegevensstroom is geselecteerd als het bronobject. Uw vectorafstand wordt gemeten met deze waarde ten opzichte van alle andere waarden in deze kolom.
- source_reference_column1: hiermee wordt de geselecteerde waarde van de referentiekolom (zoals ingesteld in de eigenschappen van de gegevensstroomnode) geretourneerd voor records die zijn geselecteerd in bronrecords voor de similariteitsanalyse. Met deze uitvoer wordt u nu geholpen bij de bronrecord waarvoor u de dichtstbijzijnde of verste records hebt gevonden.
- results_reference_column1, 2 en 3: hiermee wordt de waarde geretourneerd van de betreffende referentiekolommen (zoals ingesteld in de eigenschappen van de gegevensstroomnode) voor records die het dichtst of het verst zijn geïdentificeerd door een similariteitsanalyse.
- afstand: de berekende afstand tussen de bronwaarde en de resultaatrecord. Dat wil zeggen, hoe vergelijkbaar of verschillend zijn de gegevens in source_reference_col1, source_reference_col2 en source_reference_col3 met result_reference1, result_reference2 en result_reference3.
- profile_expression: de aaneengeschakelde uitdrukking van alle kolommen die in uw model voor similariteitsanalyse worden gebruikt in één string. Dit zijn de kolommen waarvoor waarden zijn gevectoriseerd door het insluitingsmodel.
  
  Opmerking:
  Attributenkolommen die u hebt geselecteerd, maken deel uit van de profielstring, terwijl metingen in metrickolommen eerst dynamisch worden gecategoriseerd in lage, gemiddelde en hoge opslagplaatsen, zodat ze goed worden weergegeven in de vectoren.
Maak een werkmap op basis van de uitvoergegevensset die is gegenereerd door de gegevensstroom van uw similariteitsanalyse.
Maak visualisaties om de resultaten te analyseren. Bijvoorbeeld:

.png

Tip: voor verbeterde visualisaties en diepgaandere inzichten voegt u de oorspronkelijke gegevensset toe en koppelt u deze aan de uitvoergegevens van het model op basis van de onderdeel-ID Hierdoor ontvangt u extra detailniveau bij het meten van de vectorafstand tot enkele van de oorspronkelijke attributen van de gegevensset.