Применение модели анализа подобия к данным

Используйте поток данных для применения векторной модели представления к набору данных для выполнения анализа подобия, который определяет записи, похожие на данную.

Перед началом убедитесь в наличии обязательных компонентов для выполнения анализа этого типа. См. раздел "Предварительные условия для выполнения анализа подобия в Oracle Analytics".
  1. На главной странице нажмите Создать, а затем — Поток данных.
  2. В области Добавить данные выберите набор данных для анализа и нажмите Добавить.
    Набор данных должен быть основан на Oracle Database или Oracle Autonomous Data Warehouse.
  3. В списке столбцов справа выберите столбцы для анализа. Необходимо включить столбец с уникальным идентификатором.

  4. Нажмите Добавить этап рядом с этапом данных и нажмите Анализ подобия.

  5. Выберите модель для использования и нажмите OK.

  6. Разверните раздел Выходные данные и выберите Profile_expression.
    Добавляется объединенный столбец вывода всех выбранных данных.
  7. Разверните раздел Параметры.

  8. Настройте параметры:
    • Источник. Нажмите Выбрать значение, затем выберите столбец и значение данных, чтобы однозначно идентифицировать запись, которую требуется сравнить с другими записями в наборе данных. Например, можно указать идентификатор и выбрать пациента с идентификатором 100002.
    • Лучшие (наиболее похожие) или худшие (наименее похожие). Выберите "Лучшие", чтобы найти наиболее похожие записи, или "Худшие", чтобы найти наименее похожие записи.
    • Число результатов. Укажите число совпадающих записей для возврата. Например, выберите 100, чтобы найти 100 лучших соответствующих записей, ближайших к целевой записи.
    • (Необязательно) Ссылочный столбец1, 2 и 3. Укажите столбец или комбинацию столбцов, однозначно идентифицирующие записи, с которыми сравнивается значение Источник. Например, для медицинских пациентов можно выбрать "Идентификатор", "Возраст" и "Медикаменты". Не требуется делать выбор в ссылочных столбцах.
    • Включить ссылочные столбцы для профилирования. Выберите "Нет", чтобы исключить из профилирования ссылочные столбцы, указанные в разделе Ссылочные столбцы 1, 2 и 3, или "Да", чтобы включить их в профилирование.
  9. Нажмите кнопку + рядом с узлом Анализ подобия на диаграмме, затем нажмите Добавить этап и выберите Сохранить данные.
  10. Настройте этап "Сохранить данные":

    • Набор данных. Измените значение по умолчанию на более понятное имя. Например, "Анализ подобия — первые 10".
    • Таблица. Не изменяйте значение по умолчанию. Oracle Analytics создает новое значение при выполнении потока данных на основе указанного имени Набора данных.
    • (Необязательно) Агрегирование по умолчанию. Измените агрегирование по умолчанию. Например, можно изменить его на среднее.
  11. Нажмите Сохранить модель и укажите имя созданной модели с предсказаниями.
  12. Нажмите Сохранить и укажите имя потока данных.
  13. Нажмите Выполнить, чтобы проанализировать данные и создать модель с предсказаниями.
Набор данных, который генерирует Oracle Analytics, можно найти на странице Данные на вкладке Набор данных. См. раздел "Интерпретация результатов из модели анализа подобия".