在 Oracle Analytics 中执行相似性分析概览

在 Oracle Analytics 中,您可以使用各种向量嵌入模型对数据执行相似性分析。通过相似性分析,您可以根据定义的标准或度量来衡量两个或更多对象、数据集、文档或模式的相似程度。

例如,您可能希望回答以下问题:
  • 哪些患者具有与给定患者相似的症状?
  • 哪些客户具有与给定客户相似的概要信息?
  • 哪些保险索赔的概要信息与给定保险索赔相似?

如何工作?

Oracle Database V23ai 或更高版本支持使用向量搜索和 SQL 函数来计算向量之间的距离,此距离用于量化数据记录之间的相似度。Oracle Analytics 在后台使用向量搜索对数据集执行相似性分析。

性能注意事项

相似性分析的处理时间因以下因素而异:
  • 源数据集中的行数。
  • 您选择要在数据流中使用的列数。请注意,并非源数据集中的所有列都将用于相似性分析模型。我们建议使用 10 到 15 列。选择 15 个以上的列可能会对用于应用模型的数据流的性能产生不利影响。
  • 分配给 Oracle Autonomous AI Lakehouse 实例的 ECPU 数。

数据流的超时限制为 2.5 小时,该限制决定了可以处理的数据量。