在 Oracle Analytics 中执行相似性分析概览

在 Oracle Analytics 中，您可以使用各种向量嵌入模型对数据执行相似性分析。通过相似性分析，您可以根据定义的标准或度量来衡量两个或更多对象、数据集、文档或模式的相似程度。

例如，您可能希望回答以下问题：

如何工作？

Oracle Database V23ai 或更高版本支持使用向量搜索和 SQL 函数来计算向量之间的距离，此距离用于量化数据记录之间的相似度。Oracle Analytics 在后台使用向量搜索对数据集执行相似性分析。

性能注意事项

相似性分析的处理时间因以下因素而异：

源数据集中的行数。
您选择要在数据流中使用的列数。请注意，并非源数据集中的所有列都将用于相似性分析模型。我们建议使用 10 到 15 列。选择 15 个以上的列可能会对用于应用模型的数据流的性能产生不利影响。
分配给 Oracle Autonomous AI Lakehouse 实例的 ECPU 数。

数据流的超时限制为 2.5 小时，该限制决定了可以处理的数据量。