Наиболее часто задаваемые вопросы об индексации контента и данных

В этой теме рассматриваются наиболее часто задаваемые вопросы об индексации семантических моделей и содержимого каталогов.

Что можно индексировать?

Администраторы могут выбрать для индексации следующее:

  • Семантические модели— предметная область, имена и значения измерений, а также имена и значения показателей. Для изменения параметров индексации семантических моделей необходимо обладать правами администратора.
  • Содержимое каталога — рабочие книги, анализы, информационные панели и отчеты. Для изменения параметров индексации каталога необходимо обладать правами администратора.
  • Наборы данных на основе файлов — набор данных на основе файлов можно индексировать, чтобы указанные пользователи могли создавать визуализации с использованием данных из наборов данных. Набор данных на основе файлов можно также сертифицировать, чтобы указанные пользователи могли выполнять поиск своих данных с главной страницы. Любой пользователь может задать индексацию или сертификацию для набора данных на основе файлов.

См. раздел "Настройка индексации поиска модели данных".

Что такое сертифицированный набор данных?

Любой пользователь может загрузить электронную таблицу для создания набора данных, а загруженные электронные таблицы могут иметь различное качество. Когда пользователь сертифицирует общий набор данных, он подтверждает, что набор данных содержит корректные и надежные данные, поиск которых другие пользователи могут осуществлять с главной страницы. Когда вы и пользователи, которым предоставлен доступ к наборам данных, выполняют поиск с главной страницы, данные в сертифицированном наборе данных получают высокий рейтинг в результатах поиска.

Как часто следует планировать обход содержимого?

Индекс обновляется автоматически, когда пользователи добавляют или изменяют содержимое каталога. По умолчанию обход каталога и семантической модели выполняется один раз в день. В некоторых случаях может потребоваться изменить значение по умолчанию после импорта файла BAR, если автоматическая индексация не выполняется или если обновление данных происходит реже (например, ежемесячно).

Можно ли индексировать контент на языках, отличных от английского?

Да. Можно индексировать контент на 28 языках.

  • Семантические модели и контент каталога — можно одновременно генерировать индексы для нескольких языков. Перейдите на страницу Поисковый индекс и нажмите Ctrl-нажатие, чтобы выбрать один или несколько из 28 доступных языков. Например, если головной офис компании находится в США, а другие офисы в Италии, можно выбрать English и italiano для создания индексов на английском и итальянском языках. См. раздел "Настройка индексации поиска модели данных".

  • Наборы данных — набор данных можно проиндексировать одновременно для одного языка. Перейдите в диалоговое окно Контроль индексируемого набора данных и выберите один из 28 языков. См. раздел Индексация набора данных.

Примечание.:

Если ваши данные на английском языке и в качестве языка индексирования выбран английский, вы не можете искать данные на других языках, например на французском. Например, если ваши данные включают названия продуктов на английском языке (например chair, desk, matches), вы не можете искать их названия на французском (напримерchaise, bureau, alumettes).

Существуют ли какие-либо факторы, которые необходимо учитывать при индексации предметных областей с большими таблицами?

Можно индексировать таблицы любого размера, но индексация больших таблиц занимает больше времени. Для больших предметных областей, в которых содержится много таблиц или большие таблицы, рекомендуется индексировать только столбцы, в которых пользователям необходимо выполнять поиск.

Благодаря своей компактности объем файлов индексов редко превышает объем хранилища, резервируемый Analytics Cloud для индексации.

В каком порядке располагаются результаты поиска?

Результаты поиска перечисляются в следующем порядке:

  1. Семантическая модель (семантический слой)
  2. Сертифицированные наборы данных
  3. Личные наборы данных
  4. Элементы каталога (рабочие книги, анализы, инфопанели и отчеты)

Следует ли использовать параметр "Не индексировать" для защиты элементов каталога?

Нет. Oracle не рекомендует устанавливать в поле Статус обхода значение Не индексировать в качестве способа скрытия элемента каталога от пользователей. Пользователи не будут видеть элемент в результатах поиска или на главной странице, но по-прежнему смогут получать доступ к этому элементу. Вместо этого используйте разрешения на применение к элементу соответствующих параметров безопасности.

Как наиболее эффективно создать индекс?

Для получения наилучших результатов индексируйте только те предметные области, измерения, элементы каталога и сертифицируйте только те наборы данных, в которых пользователям необходимо выполнять поиск. При индексации всех элементов число результатов поиска становится слишком большим. Oracle рекомендует отменить выбор всех семантических моделей и элементов каталога, а затем выбрать только те элементы, которые требуются пользователю. После этого можно добавлять элементы в индекс по мере необходимости.

Почему во время индексации в базе данных имеется много запросов SELECT DISTINCT?

Это скорее всего связано с тем, что для параметра индексации семантических моделей установлено значение Индекс. При установке для этого параметра значения Индекс метаданные и значения индексируются, что означает, что во время индексации выполняются запросы SELECT DISTINCT для извлечения значений данных для всех столбцов во всех предметных областях, настроенных для индексации.

Если издержки за счет системных операций недопустимы или пользователям не требуется дополнительная функциональность для визуализации значений данных из строки поиска на главной странице, перейдите в Консоль, нажмите Поиск индекса и установите параметр индексации Индексировать только метаданные. Если этот параметр имеет значение Индексировать только метаданные, то индексируются только имена измерений и показателей, а запросы SELECT DISTINCT не выполняются.