Najčastejšie otázky týkajúce sa indexovania obsahu a dát

Táto téma obsahuje najčastejšie otázky o indexovaní sémantických modelov a obsahu katalógov.

Čo môžem indexovať?

Administrátori sa môžu rozhodnúť indexovať nasledujúce:

  • Sémantické modely - tematická oblasť, názvy a hodnoty dimenzií a názvy a hodnoty mier. Aby ste mohli modifikovať preferencie indexovania sémantického modelu, musíte byť administrátorom.
  • Obsah katalógu - zošity, analýzy, panely a zostavy. Aby ste mohli modifikovať preferencie indexovania katalógu, musíte byť administrátorom.
  • Množiny dát založené na súboroch - môžete indexovať množinu dát založenú na súboroch, aby zadaní používatelia mohli vytvárať vizualizácie s dátami danej množiny dát. Alebo môžete certifikovať množinu dát založenú na súboroch, aby zadaní používatelia mohli vyhľadávať jej dáta z domovskej stránky. Akýkoľvek používateľ môže nastaviť množinu dát založenú na súboroch, ktorá sa má indexovať alebo certifikovať.

Pozrite si časť Konfigurácia indexovania vyhľadávania dátového modelu.

Čo je to certifikovaná množina dát?

Akýkoľvek používateľ môže nahrať tabuľkový hárok na vytvorenie množiny dát, pričom nahrané tabuľkové hárky môžu mať rôznu kvalitu. Keď používateľ certifikuje zdieľanú množinu dát, znamená to, že potvrdzuje, že množina dát obsahuje dobré a spoľahlivé dáta, ktoré ostatní používatelia môžu vyhľadávať z domovskej stránky. Keď vy a používatelia, ktorí dostali prístup k množinám dát, vyhľadávate z domovskej stránky, dáta v certifikovaných množinách dát sa zobrazujú na začiatku výsledkov vyhľadávania.

Ako často mám naplánovať crawling?

Keď budú používatelia pridávať alebo modifikovať obsah katalógu, index sa bude automaticky aktualizovať. Predvolene sa crawling katalógu a sémantického modelu spúšťa raz za deň. V niektorých prípadoch môže byť potrebné zmeniť toto predvolené nastavenie po importe súboru BAR, ak neprebehlo automatické indexovanie alebo ak sa dáta aktualizujú menej často (napríklad raz za mesiac).

Môžem indexovať obsah v iných jazykoch ako v angličtine?

Áno. Môžete indexovať obsah v 28 jazykoch.

  • Sémantické modely a obsah katalógu - naraz môžete generovať indexy pre viaceré jazyky. Prejdite na stránku Index vyhľadávania, stlačte a podržte kláves Ctrl a kliknite na požadované jazyky. Takto môžete vybrať jeden alebo viaceré z 28 dostupných jazykov. Ak máte napríklad centrálu spoločnosti v Spojených štátoch a kancelárie v Taliansku, môžete vybrať voľby English a Italiano, aby sa indexy vytvorili v angličtine aj taliančine. Pozrite si časť Konfigurácia indexovania vyhľadávania dátového modelu.

  • Množiny dát - naraz môžete indexovať množinu dát pre jeden jazyk. Prejdite do dialógového okna Skontrolovať pre množinu dát a vyberte jeden z 28 dostupných jazykov. Pozrite si časť Indexovanie množiny dát.

Poznámka:

Ak sú vaše dáta v angličtine a jazyk indexovania je angličtina, nemôžete vyhľadávať dáta v inom jazyku, napríklad vo francúzštine. Ak napríklad vaše dáta zahŕňajú anglické názvy produktov (napríklad chair, desk, matches), nemôžete vyhľadávať pomocou francúzskych názvov produktov (napríklad chaise, bureau, alumettes).

Na čo treba dbať pri indexovaní tematických oblastí s veľkými tabuľkami?

Indexovať možno tabuľku akejkoľvek veľkosti, ale veľké tabuľky sa indexujú dlhšie. V prípade veľkých tematických oblastí, ktoré obsahujú množstvo tabuliek alebo veľké tabuľky, zvážte možnosť indexovať iba stĺpce, ktoré budú používatelia potrebovať vyhľadávať.

Keďže súbory indexu sú kompaktné, len zriedkavo sa prekročí ukladací priestor, ktorý má služba Oracle Analytics vyhradený na indexovanie.

Ako sú výsledky vyhľadávania zoradené?

Výsledky vyhľadávania sú zoradené v tomto poradí:

  1. Sémantický model (sémantická vrstva)
  2. Certifikované množiny dát
  3. Osobné množiny dát
  4. Položky katalógu (zošity, analýzy, panely a zostavy)

Mám použiť funkciu Neindexovať na zabezpečenie položiek katalógu?

Nie. Spoločnosť Oracle neodporúča nastavovať pole Stav crawlingu na hodnotu Neindexovať ako spôsob skrytia katalógovej položky pred používateľmi. Používatelia neuvidia položku vo výsledkoch vyhľadávania ani na domovskej stránke, ale stále k nej budú mať prístup. Namiesto toho riadne zabezpečte položku pomocou povolení.

Ako čo najefektívnejšie vytvorím index?

V záujme dosiahnutia najlepších výsledkov indexujte len tematické oblasti, dimenzie a položky katalógu a certifikujte len množiny dát, ktoré používatelia potrebujú nájsť. Indexovanie všetkých položiek vedie k príliš veľkému počtu výsledkov vyhľadávania. Spoločnosť Oracle odporúča zrušiť výber všetkých sémantických modelov a položiek katalógu a následne vybrať len tie položky, ktoré používateľ potrebuje. Potom môžete podľa potreby pridať položky do indexu.

Prečo je v databáze počas indexovania mnoho dopytov SELECT DISTINCT?

Je to pravdepodobne preto, lebo voľba indexovania sémantického modelu je nastavená na hodnotu Indexovať. Ak túto voľbu nastavíte na hodnotu Indexovať, indexujú sa metadáta a hodnoty, čo znamená, že počas indexovania sa dopyty SELECT DISTINCT spúšťajú na vyvolanie dátových hodnôt pre všetky stĺpce vo všetkých tematických oblastiach, ktoré sú nakonfigurované na indexovanie.

Ak toto systémové nastavenie nie je prijateľné alebo používatelia nepotrebujú dodatočnú funkcionalitu na vizualizáciu dátových hodnôt z panela vyhľadávania na domovskej stránke, prejdite na stránku Konzola, kliknite na položku Index vyhľadávania a voľbu indexovania nastavte na hodnotu Indexovať iba metadáta. Po nastavení tejto voľby na hodnotu Indexovať iba metadáta sa indexujú len názvy dimenzií a mier a dopyty SELECT DISTINCT sa nespúšťajú.