Oracle Analyticsでの類似性分析の実行の概要
Oracle Analyticsでは、様々なベクトル埋込みモデルを使用して、データの類似性分析を実行できます。 類似性分析では、定義された基準またはメトリックに基づいて、2つ以上のオブジェクト、データセット、ドキュメントまたはパターンの類似度(類似)を測定できます。
たとえば、次のような質問に答えることができます。
- 特定の患者と同様の症状を有する患者はどれですか。
- 特定の顧客と類似したプロファイルを持つのはどの顧客ですか。
- 特定の保険請求とプロファイルが類似している保険請求はどれですか。
機能
Oracle Database V23ai以降では、ベクトル検索およびSQL関数がサポートされ、ベクトル間の距離が計算されます。ベクトルは、データ・レコード間の類似度を定量化するために使用されます。 Oracle Analyticsは、バックグラウンドでベクトル検索を使用して、データセットに対して類似性分析を実行します。
パフォーマンスに関する考慮事項
類似性分析の処理時間は、次によって異なります。
- ソース・データセット内の行数。
- データ・フローで使用するために選択した列の数。 ソース・データセットのすべての列が類似度分析モデルで使用されるわけではないことに注意してください。 10列から15列の間を使用することをお薦めします。 15を超える列を選択すると、モデルの適用に使用するデータ・フローのパフォーマンスに悪影響を及ぼす可能性があります。
- Oracle Autonomous AI Lakehouseインスタンスに割り当てられているECPUの数。
データ・フローのタイムアウト制限は2.5時間で、処理可能なデータ量を指定します。