В Oracle Analytics можно выполнять анализ подобия данных с использованием различных векторных моделей представления. Анализ подобия позволяет оценить, насколько похожи два или более объектов, наборов данных, документов или шаблонов на основе определенных критериев или метрик.
Например, может потребоваться ответить на следующие вопросы:
- У каких пациентов наблюдаются симптомы, схожие с симптомами данного пациента?
- Какие клиенты имеют профиль, аналогичный профилю данного клиента?
- Какие страховые требования похожи по профилю на данный страховой иск?
Как это работает?
Oracle Database V23ai или более поздняя версия поддерживает функции векторного поиска и SQL для расчета расстояния между векторами, которое используется для количественного определения степени сходства между записями данных. Oracle Analytics использует векторный поиск в фоновом режиме для выполнения анализа подобия в наборах данных.
Рекомендации по производительности
Время обработки для анализа подобия варьируется в зависимости от следующих факторов:
- Число строк в исходном наборе данных.
- Число столбцов, выбранных для использования в потоке данных. Обратите внимание, что не все столбцы в исходном наборе данных будут использоваться в модели анализа подобия. Рекомендуется использовать от 10 до 15 столбцов. Выбор более 15 столбцов может отрицательно повлиять на производительность потока данных, используемого для применения модели.
- Число виртуальных ЦП, выделенных вашему экземпляру Oracle Autonomous AI Lakehouse.
Лимит времени ожидания потоков данных составляет 2,5 часа, что определяет объем данных, которые можно обработать.