ベクトル索引

ハイブリッド・ベクトル索引

ハイブリッド・ベクトル索引(HVI)は、全文検索とセマンティック・ベクトル検索を組み合せて高品質の検索結果を得て、ドキュメントの索引付けとクエリを簡単に行うことができる新しい索引です。

ハイブリッド・ベクトル索引(HVI)は、ベクトル類似性検索と単一の索引DDLを介したテキスト検索の両方を有効にするフォームへドキュメントを変換するプロセスを簡略化します。

HVIは、ユーザーがテキスト問合せ、ベクトル類似性問合せ、またはこれらの両方のアプローチを利用するハイブリッド問合せを実行できる統合問合せAPIを提供します。これにより、ユーザーは簡単に検索エクスペリエンスをカスタマイズし、検索結果を拡張できます。

ドキュメントの表示に関する項

ベクトル索引

ベクトル索引は、高次元のベクトル・データを効率的に格納および検索するために使用される、特殊な索引付けデータ構造のクラスです。ベクトル索引は、類似する項目(類似度が2つのベクトル間の距離によって定義される)がグループ化されるようにベクトル・データを整理し、検索プロセスを非常に効率的にします。従来のデータベース索引とは異なり、ベクトル索引は、大規模なデータセットで一般的に使用され、アプリケーションの要件に応じて問合せの精度と問合せのパフォーマンスをトレードオフできる近似検索を実行します。

この機能により、AIドリブン・アプリケーションの類似性検索の効率化と問合せパフォーマンスの高速化が可能になります。さらに、ベクトル索引のスケーラビリティと高次元データのサポートにより、分析インサイトを向上させ、情報に基づいた意思決定と競争上の優位性をもたらすことができます。

ドキュメントの表示に関する項

パーティション・ローカルの近隣パーティション・ベクトル索引

この機能により、近傍パーティション・ベクトル索引のローカル索引付けが可能になり、パーティション表の検索パフォーマンスが最適化されます。この機能では、概念的にはパーティションごとに専用のベクトル索引が作成されるため、パーティション・キー・フィルタを使用する問合せでは、関連する索引パーティションのみを検索できます。その結果、ベクトル検索がより効率的になり、大規模なパーティション化されたデータセットを問い合せる際の応答時間が大幅に短縮されます。

大規模なエンタープライズ・データセットは、パフォーマンスを最適化するためにリレーショナル属性によって頻繁にパーティション化されます。ローカルの近傍パーティション・ベクトル索引を有効にすることで、ユーザーはパーティション・プルーニングによるスケーラビリティの向上、および問合せパフォーマンスの高速化というメリットが得られます。また、このアプローチはより効率的なデータ・ライフサイクル管理を実現し、大規模なエンタープライズ・ワークロードの処理に最適です。

ドキュメントの表示に関する項

永続近傍グラフ・ベクトル索引

HNSWベクトル索引は、インメモリー常駐の多層グラフ索引です。再起動時にインメモリー・グラフの再作成にかかる時間は、グラフのディスク・チェックポイント・イメージを使用することで短縮できます。この機能では、チェックポイント形式とフレームワークを追加してディスク・チェックポイントを取得し、それを使用してインメモリー常駐グラフ構造を再作成します。

再起動後の索引アクセス計画の取得には時間がかかる場合があります。優先度の高いディスク・チェックポイント・ベースのリロード実行により、再起動後に索引アクセス計画の取得にかかる時間が短縮されます。

ドキュメントの表示に関する項

近傍グラフ・ベクトル索引のトランザクション・サポート

HNSW索引は、ベクトル・データのインメモリー階層グラフ索引です。Oracle AI Database 26aiリリース更新23.4および23.5では、DMLは、ベクトル列にHNSW索引が構築されている表では許可されていませんでした。この機能により、このような表に対してトランザクションを実行できます。さらに、HNSW索引を使用するベクトル検索問合せでは、読取りスナップショットに基づいてトランザクション的に一貫性のある結果が表示されます。トランザクション的な一貫性はOracle RACでも保証され、クラスタ内のすべてのインスタンスでHNSW索引が複製され、クラスタ内の1つ以上のインスタンスでDMLが発生し、そのクラスタ内の任意のインスタンスで検索問合せを実行できます。

HNSW索引は、Oracle AI Database 26aiにおいて提供されている、最速のベクトル検索索引です。したがって、顧客はHNSW索引を使用して検索問合せを実行し、基礎となる表のリレーショナル列またはベクトル列に対してDML変更を発行する必要もあります。DMLによってインメモリーHNSW索引構造が失効する可能性があるため、このプロジェクトには特別なプロトコルが追加され、トランザクション的に一貫した結果が顧客に保証されます。

ドキュメントの表示に関する項

ハイブリッド・ベクトル検索による述語サポートの向上

ハイブリッド・ベクトル検索問合せでは、索引付き列以外の列にWHERE 句述語を追加できるようになりました。

ハイブリッド・ベクトル検索では、ベクトル距離検索とテキストベース検索を1つの問合せに結合します。ベクトル検索またはテキストベース索引の対象外となっている列にフィルタ述語をさらに追加すると役立つ場合があります。FILTER_BYフィールドは、標準のSQL演算子を使用して追加のフィルタ述語を指定する方法を提供します。

ドキュメントの表示に関する項

RAC上の複製されたHNSWベクトル索引

HNSWベクトル索引は、ベクトル・プールに十分なメモリーがあるクラスタのすべてのインスタンスでの完全な複製によって、RAC環境でサポートされるようになりました。Oracle Autonomous AI Database Serverlessデプロイメントでは、ベクトル・プールは自律的に管理されます。

様々なRACインスタンスにわたる、HNSW索引のコピーすべてで、ディスク上の、ROWIDからVIDへの同じマッピング表が共有されます。ただし、各インスタンスはインメモリー近傍グラフを個別に構築するため、問合せの処理に使用されるRACインスタンスに応じて、近似検索で異なる結果が取得される場合があります。

企業のお客様は、多くの場合、RAC環境にOracle AI Databaseを導入します。この機能により、クラスタのすべてのインスタンス間の完全な複製によって、RACのHNSWベクトル索引を作成できます。RACクラスタの任意のインスタンスで指示された問合せでは、HNSWベクトル索引計画を利用して、超高速の類似性検索を実行できます。

ドキュメントの表示に関する項

JSONのハイブリッド・ベクトル索引

ハイブリッド・ベクトル索引を使用すると、全文検索機能をセマンティック・ベクトル検索手法と統合してドキュメントを取得できるようになり、検索結果の品質が向上します。この強力な機能がJSON列をサポートするように拡張され、データの索引付けおよび問合せの柔軟性が向上しました。

JSON列にハイブリッド・ベクトル索引を作成すると、ユーザーによる様々なタイプの検索の実行を可能にする統合問合せAPIが提供されます:

  • テキスト問合せ
  • ベクトル類似性問合せ
  • 両方のアプローチを利用するハイブリッド問合せ

この汎用機能により、ユーザーは次を実行できます:

  • 検索エクスペリエンスを簡単にカスタマイズ
  • 検索結果の品質および関連性を大幅に向上

ドキュメントの表示に関する項

IVF索引のオンライン再編成

実表に対する更新によって一般ベクトル分布が変更される場合は、時間の経過とともにIVF索引の品質が低下する可能性があります。IVF索引は、DMLと問合せに使用可能なまま、再編成できるようになりました。

IVF索引は、ソース表がその索引が当初に作成された時点から大きく変化すると、バランスが崩れる可能性があります。これにより、その索引のパフォーマンスと品質に影響がある可能性があります。IVF索引のオンライン再編成では、その索引の構造を、その索引をオンラインのままにしDMLと問合せに使用可能なままにして再編成できます。

ドキュメントの表示に関する項

含まれる列でのJSON、BLOBおよびCLOBデータ型のサポート

IVF (近傍パーティション)ベクトル索引の含まれる列で、JSONBLOB またはCLOB型が使用できるようになりました。

含まれる列を使用すると、実表内の追加の非ベクトル列をIVF (近傍パーティション)ベクトル索引に格納できるようになります。追加の列を索引に格納することで、問合せの実行では、実表から基礎となる列を取得するための追加の表アクセスが不要になります。

ドキュメントの表示に関する項

近傍パーティション・ベクトル索引に含まれる列

ベクトル索引の含まれる列は、近傍パーティション・ベクトル索引内に非ベクトル列を組み込むことで、属性フィルタによる検索を高速化します。この機能により、実表からこれらの列にアクセスする必要がなくなるため、問合せの実行が最適化されます。

高度なワークロードでは、多くの場合、リレーショナル列のビジネス・データ検索とベクトル類似性検索を組み合せます。近傍パーティション・ベクトル索引に列を含めると、属性フィルタをベクトルベースの類似性検索と統合することで、エンタープライズ検索機能が大幅に強化されます。 

この統合により、次の方法で複雑な問合せを効率的に実行できます:

  1. ベクトル検索と連携して属性フィルタを直接評価
  2. コストの高い結合操作による実表アクセスの必要性を排除。

さらに、問合せに必要なすべての列が対象列として索引に含まれている場合は、索引から直接データを取得できるため、問合せのパフォーマンスが向上します。

ドキュメントの表示に関する項

グローバルIVF索引およびHNSW索引がある場合のパーティション・メンテナンス操作およびダイレクト・ロード

パーティション・メンテナンス操作を、グローバルIVF索引およびHNSW索引があるパーティション表に対して実行できるようになりました。これらの操作は、様々なメソッド(RANGELISTHASHCOMPOSITEなど)を使用してパーティション化されている表に適用できます。

パーティション・メンテナンス操作(パーティションの追加、削除、マージ、分割など)を、グローバルIVF索引およびHNSW索引がある表に対して実行できます。パーティション化の主な利点の1つは、表のサブセット(またはパーティション)に対して、分離した状態で、より柔軟にメンテナンス操作を実行でき、隣接パーティション内の行には影響がないことです。これには、ベクトルを含む表が含まれます。

ドキュメントの表示に関する項