Použití modelu analýzy podobnosti na vaše data

Pomocí datového toku můžete použít model vektorového vkládání na datovou sadu k provedení analýzy podobnosti, která identifikuje záznamy podobné danému záznamu.

Před zahájením je třeba se ujistit, že máte předpoklady pro provedení tohoto typu analýzy. Viz Předpoklady pro provedení analýzy podobnosti v Oracle Analytics.
  1. Na domovské stránce klikněte na položku Vytvořit a poté klikněte na volbu Datový tok.
  2. V části Přidat data vyberte datovou sadu obsahující data, která chcete analyzovat, a poté klikněte na tlačítko Přidat.
    Datová sada musí být založena na databázi Oracle nebo na službě Oracle Autonomous Data Warehouse.
  3. V seznamu sloupců na pravé straně vyberte sloupce, které chcete analyzovat. Je nutné zahrnout sloupec s jedinečným ID.

  4. Klikněte na možnost Přidat krok vedle kroku dat a poté klikněte na možnost Analýza podobnosti.

  5. Vyberte model a klikněte na tlačítko OK.

  6. Rozbalte oddíl Výstupy a vyberte možnost Profile_expression.
    Tím se přidá zřetězený výstupní sloupec všech vybraných dat.
  7. Rozbalte oddíl Parametry.

  8. Konfigurace parametrů:
    • Zdroj – Klikněte na volbu Vybrat hodnotu a poté vyberte sloupec a hodnotu dat, které jedinečným způsobem identifikují záznam, který chcete porovnat s ostatními v datové sadě. Můžete například zadat ID a vybrat pacienta s ID „100002“.
    • Nahoře (nejblíže) nebo dole (nejdále) – Výběrem možnosti „Nahoře“ vyhledáte nejpodobnější záznamy, nebo volbou „Dole“ vyhledáte nejméně podobné záznamy.
    • Počet výsledků – Zadejte počet odpovídajících záznamů, které se mají vrátit. Výběrem možnosti 100 například vyhledáte prvních 100 odpovídajících záznamů nejblíže vašemu cílovému záznamu.
    • (Volitelné) Referenční sloupec 1, 2 a 3 – Zadejte sloupec nebo kombinaci sloupců, které jednoznačně identifikují záznamy, s nimiž porovnáváte hodnotu Zdroj. Například pro lékařské pacienty můžete vybrat „ID“, „Věk“ a „Léčba“. Není nutné provádět výběr v referenčních sloupcích.
    • Zahrnout referenční sloupce pro profilování – Výběrem možnosti Ne vyloučíte referenční sloupce zadané v polích Referenční sloupec1, 2 a 3 z profilování, nebo volbou Ano je zahrnete do profilování.
  9. Klikněte na volbu + vedle uzlu Analýza podobnosti ve schématu, poté klikněte na volbu Přidat krok a vyberte volbu Uložit data.
  10. Konfigurace kroku Uložit data:

    • Datová sada – Výchozí hodnotu lze změnit na smysluplnější název. Například „Analýza podobnosti – prvních 10“.
    • Tabulka – Neměňte výchozí hodnotu. Služba Oracle Analytics vytvoří novou hodnotu, když je datový tok spuštěn na základě zadaného názvu datové sady.
    • (Volitelné) Výchozí agregace – Změňte výchozí agregaci. Můžete ji například změnit na Průměr.
  11. Klikněte na tlačítko Uložit model a zadejte název generovaného modelu předpovědi.
  12. Klikněte na tlačítko Uložit a zadejte název datového toku.
  13. Kliknutím na tlačítko Spustit proveďte analýzu dat a generujte prediktivní model.
Datovou sadu, kterou generuje Oracle Analytics, najdete na kartě Datová sada na stránce Data. Viz Interpretace výsledků z modelu analýzy podobnosti.