Gebruik een gegevensstroom om een vectorinsluitingsmodel toe te passen op een gegevensset om een similariteitsanalyse uit te voeren waarmee records worden geïdentificeerd die lijken op een bepaald record.
- Klik op de beginpagina op Maken en vervolgens op Gegevensstroom.
- Selecteer in Gegevens toevoegen de gegevensset met de gegevens die u wilt analyseren en klik op Toevoegen.
De gegevensset moet gebaseerd zijn op Oracle Database of Oracle Autonomous Data Warehouse.
- Selecteer in de lijst met kolommen aan de rechterkant de kolommen die u wilt analyseren. U moet een kolom met een unieke ID opnemen.
- Klik op Stap toevoegen naast de gegevensstap en klik vervolgens op Similariteitsanalyse.
- Selecteer een model dat u wilt gebruiken en klik op OK.
- Vouw de sectie Uitvoer uit en selecteer Profile_expression.
Hiermee wordt een aaneengeschakelde uitvoerkolom van alle geselecteerde gegevens toegevoegd.
- Vouw de sectie Parameters uit.
- De parameters configureren:
- Bron: klik op Een waarde selecteren en selecteer vervolgens de gegevenskolom en waarde waarmee de record die u wilt vergelijken uniek wordt geïdentificeerd met andere records in de gegevensset. U kunt bijvoorbeeld een ID opgeven en een patiënt selecteren met de ID "100002".
- Top (dichtst bij) of Onder (verste): selecteer "Top" om de meest vergelijkbare records te zoeken of selecteer "Onder" om de minst vergelijkbare records te vinden.
- Aantal resultaten: geef het aantal overeenkomende records op dat moet worden geretourneerd. Selecteer bijvoorbeeld "100" om de 100 meest overeenkomende records te vinden die zich het dichtst bij uw doelrecord bevinden.
- (Optioneel) Referentiekolom 1, 2 en 3: geef een kolom of combinatie van kolommen op waarmee de records waarmee u de waarde Bron vergelijkt, uniek worden geïdentificeerd. Voor medische patiënten kunt u bijvoorbeeld "ID", "Leeftijd" en "Medicatie" selecteren. U hoeft geen selectie te maken in referentiekolommen.
- Referentiekolommen opnemen voor profilering: kies 'Nee' als u de referentiekolommen die zijn opgegeven in Referentiekolom 1, 2 en 3 wilt uitsluiten van de profilering of kies 'Ja' als u deze wilt opnemen in de profilering.
- Klik op + naast de node Similariteitsanalyse in het diagram, klik vervolgens op Stap toevoegen en selecteer Gegevens opslaan.
- Configureer de stap 'Gegevens opslaan':
- Gegevensset: wijzig de standaardwaarde in een zinvolle naam. Bijvoorbeeld: 'Top 10 van de similariteitsanalyse'.
- Tabel: hiermee wijzigt u de standaardwaarde niet. In Oracle Analytics wordt een nieuwe waarde gemaakt wanneer de gegevensstroom wordt uitgevoerd op basis van de opgegeven naam van de gegevensset.
- (Optioneel) Standaardaggregatie: hiermee wijzigt u de standaardaggregatie. U kunt dit bijvoorbeeld wijzigen in 'Gemiddeld'.
- Klik op Model opslaan en geef de naam op van het gegenereerde voorspellingsmodel.
- Klik op Opslaan en geef een naam op voor de gegevensstroom.
- Klik op Uitvoeren om de gegevens te analyseren en een voorspellend model te genereren.