При создании набора данных Oracle Analytics выполняет его профилирование на уровне столбцов для получения набора семантических рекомендаций по восстановлению или пополнению данных. При создании рабочих книг можно также включать в визуализации обогащения базы знаний, добавляя их из панели данных.
Примечание.:
Обогащение знаний, как правило, включено по умолчанию, но редакторы рабочих книг могут включать или выключать его для тех наборов данных, которыми владеют или в отношении которых имеют полномочия на редактирование. Oracle Analytics не предоставляет автоматически рекомендации по обогащению наборов данных, созданных из потока данных. В этом случае владелец или администратор набора данных должен сначала включить параметр обогащения знаний для набора данных. См. раздел "Включение обогащения знаний для наборов данных".Эти рекомендации основаны на системе, автоматически определяющей конкретный семантический тип на этапе профилирования. Например, наборы данных на основе локальных предметных областей профилируются с помощью простого образца "Первые N".
Существуют различные категории семантических типов, например географические области, определяемые по названиям городов, распознаваемые шаблоны, например номер кредитной карты, адрес электронной почты или номер социального страхования, даты и повторяющиеся шаблоны. Можно также создать собственные семантические типы.
Профилирование применяется к различным семантическим типам.
Категории семантических типов профилируются, чтобы выявить следующее:
Рекомендации по восстановлению, улучшению или обогащению набора данных определяются типом данных.
Примеры рекомендаций по семантическим типам:
Семантические типы определяются на основе массивов, найденных в данных.
Для этих семантических типов даются рекомендации:
Распознавание семантических типов определяется загруженными справочными сведениями, которые предоставляются вместе с сервисом.
Рекомендации на основе ссылок предоставляются для следующих семантических типов:
Рекомендуемые обогащения основаны на семантических типах.
Обогащения определяются в зависимости от иерархии географического положения:
В процессе профилирования для принятия решений о конкретных семантических типах используются определенные пороговые значения.
Как правило, 85% значений данных в столбце должны отвечать критериям одного семантического типа, чтобы система могла принять решение о классификации. В результате столбец, который может содержать 70 % имен и 30 % "других" значений, не соответствует требованиям к пороговым значениям, поэтому рекомендаций не будет.
Используйте пользовательские рекомендации в отношении знаний, чтобы расширить знания о системе Oracle Analytics. Пользовательские знания позволяют семантическому инструменту профилирования Oracle Analytics выявлять больше семантических типов, характерных для бизнеса, и давать более релевантные и управляемые рекомендации по обогащению. Например, можно добавить пользовательские справочные сведения, которые классифицируют рецептурный препарат по категориям препаратов USP "Анальгетики" или "Опиоиды".
Попросите администратора загрузить файлы с пользовательскими знаниями в Oracle Analytics. При обогащении наборов данных Oracle Analytics предоставляет соответствующие рекомендации на основе этих семантических данных. При создании рабочих книг можно также включать в визуализации обогащения базы знаний, добавляя их с панели данных.
Создание собственных файлов с пользовательскими знаниями
При создании семантических файлов следуйте приведенным ниже рекомендациям.
Попросите администратора загрузить ваш файл с пользовательскими знаниями в Oracle Analytics.
В этом примере показано, как добавить временные рамки бизнеса в данные продаж и включить анализ продаж по финансовым годам, если исходный набор данных не содержит финансовых данных.