Pomocí datového toku můžete použít model vektorového vkládání na datovou sadu k provedení analýzy podobnosti, která identifikuje záznamy podobné danému záznamu.
- Na domovské stránce klikněte na položku Vytvořit a poté klikněte na volbu Datový tok.
- V části Přidat data vyberte datovou sadu obsahující data, která chcete analyzovat, a poté klikněte na tlačítko Přidat.
Datová sada musí být založena na databázi Oracle nebo na službě Oracle Autonomous Data Warehouse.
- V seznamu sloupců na pravé straně vyberte sloupce, které chcete analyzovat. Je nutné zahrnout sloupec s jedinečným ID.
- Klikněte na možnost Přidat krok vedle kroku dat a poté klikněte na možnost Analýza podobnosti.
- Vyberte model a klikněte na tlačítko OK.
- Rozbalte oddíl Výstupy a vyberte možnost Profile_expression.
Tím se přidá zřetězený výstupní sloupec všech vybraných dat.
- Rozbalte oddíl Parametry.
- Konfigurace parametrů:
- Zdroj – Klikněte na volbu Vybrat hodnotu a poté vyberte sloupec a hodnotu dat, které jedinečným způsobem identifikují záznam, který chcete porovnat s ostatními v datové sadě. Můžete například zadat ID a vybrat pacienta s ID „100002“.
- Nahoře (nejblíže) nebo dole (nejdále) – Výběrem možnosti „Nahoře“ vyhledáte nejpodobnější záznamy, nebo volbou „Dole“ vyhledáte nejméně podobné záznamy.
- Počet výsledků – Zadejte počet odpovídajících záznamů, které se mají vrátit. Výběrem možnosti 100 například vyhledáte prvních 100 odpovídajících záznamů nejblíže vašemu cílovému záznamu.
- (Volitelné) Referenční sloupec 1, 2 a 3 – Zadejte sloupec nebo kombinaci sloupců, které jednoznačně identifikují záznamy, s nimiž porovnáváte hodnotu Zdroj. Například pro lékařské pacienty můžete vybrat „ID“, „Věk“ a „Léčba“. Není nutné provádět výběr v referenčních sloupcích.
- Zahrnout referenční sloupce pro profilování – Výběrem možnosti Ne vyloučíte referenční sloupce zadané v polích Referenční sloupec1, 2 a 3 z profilování, nebo volbou Ano je zahrnete do profilování.
- Klikněte na volbu + vedle uzlu Analýza podobnosti ve schématu, poté klikněte na volbu Přidat krok a vyberte volbu Uložit data.
- Konfigurace kroku Uložit data:
- Datová sada – Výchozí hodnotu lze změnit na smysluplnější název. Například „Analýza podobnosti – prvních 10“.
- Tabulka – Neměňte výchozí hodnotu. Služba Oracle Analytics vytvoří novou hodnotu, když je datový tok spuštěn na základě zadaného názvu datové sady.
- (Volitelné) Výchozí agregace – Změňte výchozí agregaci. Můžete ji například změnit na Průměr.
- Klikněte na tlačítko Uložit model a zadejte název generovaného modelu předpovědi.
- Klikněte na tlačítko Uložit a zadejte název datového toku.
- Kliknutím na tlačítko Spustit proveďte analýzu dat a generujte prediktivní model.