Een model van similariteitsanalyse toepassen op uw gegevens

Gebruik een gegevensstroom om een vectorinsluitingsmodel toe te passen op een gegevensset om een similariteitsanalyse uit te voeren waarmee records worden geïdentificeerd die lijken op een bepaald record.

Controleer voordat u begint of u voldoet aan de vereisten voor het uitvoeren van dit type analyse. Zie voor meer informatie: Vereisten voor het uitvoeren van een similariteitsanalyse in Oracle Analytics.
  1. Klik op de beginpagina op Maken en vervolgens op Gegevensstroom.
  2. Selecteer in Gegevens toevoegen de gegevensset met de gegevens die u wilt analyseren en klik op Toevoegen.
    De gegevensset moet gebaseerd zijn op Oracle Database of Oracle Autonomous Data Warehouse.
  3. Selecteer in de lijst met kolommen aan de rechterkant de kolommen die u wilt analyseren. U moet een kolom met een unieke ID opnemen.

  4. Klik op Stap toevoegen naast de gegevensstap en klik vervolgens op Similariteitsanalyse.

  5. Selecteer een model dat u wilt gebruiken en klik op OK.

  6. Vouw de sectie Uitvoer uit en selecteer Profile_expression.
    Hiermee wordt een aaneengeschakelde uitvoerkolom van alle geselecteerde gegevens toegevoegd.
  7. Vouw de sectie Parameters uit.

  8. De parameters configureren:
    • Bron: klik op Een waarde selecteren en selecteer vervolgens de gegevenskolom en waarde waarmee de record die u wilt vergelijken uniek wordt geïdentificeerd met andere records in de gegevensset. U kunt bijvoorbeeld een ID opgeven en een patiënt selecteren met de ID "100002".
    • Top (dichtst bij) of Onder (verste): selecteer "Top" om de meest vergelijkbare records te zoeken of selecteer "Onder" om de minst vergelijkbare records te vinden.
    • Aantal resultaten: geef het aantal overeenkomende records op dat moet worden geretourneerd. Selecteer bijvoorbeeld "100" om de 100 meest overeenkomende records te vinden die zich het dichtst bij uw doelrecord bevinden.
    • (Optioneel) Referentiekolom 1, 2 en 3: geef een kolom of combinatie van kolommen op waarmee de records waarmee u de waarde Bron vergelijkt, uniek worden geïdentificeerd. Voor medische patiënten kunt u bijvoorbeeld "ID", "Leeftijd" en "Medicatie" selecteren. U hoeft geen selectie te maken in referentiekolommen.
    • Referentiekolommen opnemen voor profilering: kies 'Nee' als u de referentiekolommen die zijn opgegeven in Referentiekolom 1, 2 en 3 wilt uitsluiten van de profilering of kies 'Ja' als u deze wilt opnemen in de profilering.
  9. Klik op + naast de node Similariteitsanalyse in het diagram, klik vervolgens op Stap toevoegen en selecteer Gegevens opslaan.
  10. Configureer de stap 'Gegevens opslaan':

    • Gegevensset: wijzig de standaardwaarde in een zinvolle naam. Bijvoorbeeld: 'Top 10 van de similariteitsanalyse'.
    • Tabel: hiermee wijzigt u de standaardwaarde niet. In Oracle Analytics wordt een nieuwe waarde gemaakt wanneer de gegevensstroom wordt uitgevoerd op basis van de opgegeven naam van de gegevensset.
    • (Optioneel) Standaardaggregatie: hiermee wijzigt u de standaardaggregatie. U kunt dit bijvoorbeeld wijzigen in 'Gemiddeld'.
  11. Klik op Model opslaan en geef de naam op van het gegenereerde voorspellingsmodel.
  12. Klik op Opslaan en geef een naam op voor de gegevensstroom.
  13. Klik op Uitvoeren om de gegevens te analyseren en een voorspellend model te genereren.
U kunt de gegevensset die Oracle Analytics maakt vinden op de pagina Gegevensset op de pagina Gegevens. Zie voor meer informatie: Resultaten van een model voor similariteitsanalyses interpreteren.