Použití modelu analýzy podobnosti na vaše data

Pomocí toku dat můžete na data aplikovat analýzu podobnosti, která vám umožní identifikovat záznamy podobné danému záznamu.

Před zahájením je třeba se ujistit, že máte předpoklady pro provedení tohoto typu analýzy. Viz Předpoklady pro provedení analýzy podobnosti v Oracle Analytics.
  1. Na domovské stránce klikněte na volbu Vytvořit a poté na volbu Datový tok.
  2. V části Přidat data vyberte datovou sadu a poté klikněte na Přidat.

    Je třeba použít použít databázi Oracle nebo službu Oracle Autonomous AI Lakehouse V23ai nebo novější.

  3. V seznamu sloupců zrušte výběr sloupců, které nechcete analyzovat (ve výchozím nastavení jsou vybrány všechny). Je nutné zahrnout sloupec s jedinečným ID. Doporučujeme vybrat mezi 10 a 15 sloupci. Výběr více než 15 sloupců může nepříznivě ovlivnit výkon.

  4. Umístěte ukazatel myši na uzel datové sady, vyberte volbu Přidat krok a poté klikněte na volbu Analýza podobnosti.

  5. Vyberte model a klikněte na tlačítko OK.

  6. Rozbalte oddíl Výstupy a vyberte možnost Profile_expression.
    Tím se přidá zřetězený výstupní sloupec všech vybraných dat.
  7. Rozbalte oddíl Parametry.

  8. Konfigurace parametrů:
    • Zdroj – Klikněte na volbu Vybrat hodnotu a poté vyberte sloupec a hodnotu dat, které jedinečným způsobem identifikují záznam, který chcete porovnat s ostatními v datové sadě. Můžete například zadat ID a vybrat pacienta s ID „100002“.
    • Nahoře (nejblíže) nebo dole (nejdále) – Výběrem možnosti „Nahoře“ vyhledáte nejpodobnější záznamy, nebo volbou „Dole“ vyhledáte nejméně podobné záznamy.
    • Počet výsledků – Zadejte počet odpovídajících záznamů, které se mají vrátit. Výběrem možnosti 100 například vyhledáte prvních 100 odpovídajících záznamů nejblíže vašemu cílovému záznamu.
    • (Volitelné) Referenční sloupec 1, 2 a 3 – Zadejte sloupec nebo kombinaci sloupců, které jednoznačně identifikují záznamy, s nimiž porovnáváte hodnotu Zdroj. Například pro lékařské pacienty můžete vybrat „ID“, „Věk“ a „Léčba“. Není nutné provádět výběr v referenčních sloupcích.
    • Zahrnout referenční sloupce pro profilování – Výběrem možnosti Ne vyloučíte referenční sloupce zadané v polích Referenční sloupec1, 2 a 3 z profilování, nebo volbou Ano je zahrnete do profilování.
  9. Klikněte na volbu + vedle uzlu Analýza podobnosti ve schématu, poté klikněte na volbu Přidat krok a vyberte volbu Uložit data.
  10. Konfigurace kroku Uložit data:

    • Datová sada – Výchozí hodnotu lze změnit na smysluplnější název. Například „Analýza podobnosti – prvních 10“.
    • Tabulka – Neměňte výchozí hodnotu. Služba Oracle Analytics vytvoří novou hodnotu, když je datový tok spuštěn na základě zadaného názvu datové sady.
    • (Volitelné) Výchozí agregace – Změňte výchozí agregaci. Můžete ji například změnit na Průměr.
  11. Klikněte na tlačítko Uložit model a zadejte název generovaného modelu předpovědi.
  12. Klikněte na tlačítko Uložit a zadejte název datového toku.
  13. Kliknutím na tlačítko Spustit proveďte analýzu dat a generujte prediktivní model.
Datovou sadu, kterou generuje Oracle Analytics, najdete na kartě Datová sada na stránce Data. Viz Interpretace výsledků z modelu analýzy podobnosti.