Oracle Analyticsでの類似度分析の実行の概要

Oracle Analyticsでは、様々なベクトル埋込みモデルを使用して、データの類似度分析を実行できます。類似度分析では、定義済の基準またはメトリックに基づいて、複数のオブジェクト、データセット、ドキュメントまたはパターンの類似度(どの程度似ているか)を測定できます。

たとえば、次のような質問に答えることができます。
  • 特定の患者と類似した症状があるのはどの患者ですか。
  • 特定の顧客と類似したプロファイルを持つのはどの顧客ですか。
  • 特定の保険請求とプロファイルが類似している保険請求はどれですか。

使用方法

Oracle Database V23aiでは、ベクトル検索およびベクトル間の距離を計算するSQL関数がサポートされ、データ・レコード間の類似度を定量化するために使用されます。Oracle Analyticsは、バックグラウンドでベクトル検索を使用して、データセットに対して類似度分析を実行します。

パフォーマンスに関する考慮事項

類似度分析の処理時間は、次のものによって異なります:
  • ソース・データセット内の行数。
  • データ・フローで使用するために選択した列の数。ソース・データセットのすべての列が類似度分析モデルで使用されるわけではないことに注意してください。10列から15列の間を使用することをお薦めします。15を超える列を選択すると、モデルの適用に使用するデータ・フローのパフォーマンスに悪影響を及ぼす可能性があります。
  • Oracle Autonomous AI Lakehouseインスタンスに割り当てられているECPUの数。

データ・フローのタイムアウト制限は2.5時間であり、これによって処理可能なデータの量が決まります。