Используйте поток данных для применения векторной модели представления к набору данных для выполнения анализа подобия, который определяет записи, похожие на данную.
- На главной странице нажмите Создать, а затем — Поток данных.
- В области Добавить данные выберите набор данных для анализа и нажмите Добавить.
Набор данных должен быть основан на Oracle Database или Oracle Autonomous Data Warehouse.
- В списке столбцов справа выберите столбцы для анализа. Необходимо включить столбец с уникальным идентификатором.
- Нажмите Добавить этап рядом с этапом данных и нажмите Анализ подобия.
- Выберите модель для использования и нажмите OK.
- Разверните раздел Выходные данные и выберите Profile_expression.
Добавляется объединенный столбец вывода всех выбранных данных.
- Разверните раздел Параметры.
- Настройте параметры:
- Источник. Нажмите Выбрать значение, затем выберите столбец и значение данных, чтобы однозначно идентифицировать запись, которую требуется сравнить с другими записями в наборе данных. Например, можно указать идентификатор и выбрать пациента с идентификатором 100002.
- Лучшие (наиболее похожие) или худшие (наименее похожие). Выберите "Лучшие", чтобы найти наиболее похожие записи, или "Худшие", чтобы найти наименее похожие записи.
- Число результатов. Укажите число совпадающих записей для возврата. Например, выберите 100, чтобы найти 100 лучших соответствующих записей, ближайших к целевой записи.
- (Необязательно) Ссылочный столбец1, 2 и 3. Укажите столбец или комбинацию столбцов, однозначно идентифицирующие записи, с которыми сравнивается значение Источник. Например, для медицинских пациентов можно выбрать "Идентификатор", "Возраст" и "Медикаменты". Не требуется делать выбор в ссылочных столбцах.
- Включить ссылочные столбцы для профилирования. Выберите "Нет", чтобы исключить из профилирования ссылочные столбцы, указанные в разделе Ссылочные столбцы 1, 2 и 3, или "Да", чтобы включить их в профилирование.
- Нажмите кнопку + рядом с узлом Анализ подобия на диаграмме, затем нажмите Добавить этап и выберите Сохранить данные.
- Настройте этап "Сохранить данные":
- Набор данных. Измените значение по умолчанию на более понятное имя. Например, "Анализ подобия — первые 10".
- Таблица. Не изменяйте значение по умолчанию. Oracle Analytics создает новое значение при выполнении потока данных на основе указанного имени Набора данных.
- (Необязательно) Агрегирование по умолчанию. Измените агрегирование по умолчанию. Например, можно изменить его на среднее.
- Нажмите Сохранить модель и укажите имя созданной модели с предсказаниями.
- Нажмите Сохранить и укажите имя потока данных.
- Нажмите Выполнить, чтобы проанализировать данные и создать модель с предсказаниями.