2.1.3 AIスマート・スキャン機能拡張
Oracle Database 23aiには、セマンティックな類似性に基づいてデータを効率的に問い合せるように設計された人工知能(AI)ベクトル検索機能が組み込まれています。AIベクトル検索により、音声アシスタント、チャットボット、言語翻訳機能、レコメンデーション・システム、異常検出システムなどのアプリケーションが使用できるようになります。また、AIベクトル検索は、イメージやビデオに対する高度な検索および認識機能を円滑にします。
Oracle Database 23aiに関連して、Oracle Exadata System SoftwareにはAIスマート・スキャンが組み込まれています。これは、様々なAIベクトル問合せ操作のパフォーマンスを桁違いに向上させることができるExadata固有の最適化のコレクションです。
AIスマート・スキャンでは、大量のベクトル・データにわたって低遅延の並列スキャンを実現する最適化により、Oracle Database AI Vector Searchが自動的に高速化されます。Exadataストレージ・サーバーの超高速Exadata RDMAメモリー(XRMEM)およびExadataスマート・フラッシュキャッシュを活用して、メモリー速度でベクトル・データを処理します。また、AIスマート・スキャンでは、データ・ソースでベクトル距離計算およびtop-Kフィルタリングを実行し、不要なネットワーク・データ転送およびデータベース・サーバー処理を回避します。
Oracle Exadata System Softwareリリース25.1.0のAIスマート・スキャンには、次の機能拡張が含まれています:
-
top-Kフィルタリングのパフォーマンスおよび効率は、各ストレージ・サーバーで実行中のtop-Kセットを維持することで向上します。
Oracle Exadata System Softwareリリース25.1.0より前のAIスマート・スキャンでは、処理されるデータの各リージョンについて、top-Kの結果がデータベース・サーバーに返されます。
Oracle Exadata System Softwareリリース25.1.0では、各ストレージ・サーバーは、AIスマート・スキャンのtop-K操作ごとに実行中のセットを維持します。操作が進むにつれて、各ストレージ・サーバーは、以前に返された結果を改善する結果のみを返します。実行中のtop-K以外の結果はフィルタで除外され、データベース・サーバーには送信されません。この方法では、処理のためにデータベース・サーバーに送信するデータがはるかに少なくなり、ストレージ・ネットワークのトラフィックが減少し、top-K検索のパフォーマンスが向上します。
-
AIスマート・スキャンでは、INT8またはBINARYディメンションのベクトルがサポートされます。
Oracle Exadata System Softwareリリース25.1.0より前のAIスマート・スキャンでは、高精度(FLOAT32またはFLOAT64)ディメンションのベクトルがサポートされていました。高精度ディメンションのベクトルは、非常に正確なベクトル比較および検索操作を容易にしますが、より多くのメモリーと処理能力を必要とします。
Oracle Exadata System Softwareリリース25.1.0では、AIスマート・スキャンが拡張され、INT8またはBINARYディメンションのベクトルがサポートされます。INT8またはBINARYディメンションを使用するベクトルは、適度な精度と引き換えに効率およびパフォーマンスを大幅に向上させます。
たとえば、FLOAT32と比較すると、BINARYディメンションのベクトルは32倍小さく、距離計算は最大40倍高速になります。しかし、検索精度への影響は最小限であり、Massive Text Embedding Benchmark (MTEB)を使用した一部の評価では、検索品質に6%の差しか示されていません。また、INT8ディメンションのベクトルは、FLOAT32の4分の1のサイズ(4倍圧縮)であり、一部のMTEB評価では、それらの間の検索品質にほとんど差がないことが示されています。
-
AIスマート・スキャンは、ベクタル距離を投影します。
Oracle Exadata System Softwareリリース25.1.0より前のAIスマート・スキャンでは、不要なベクトル・データをデータベース・サーバーに送信しないように、ベクトル距離計算に基づいてフィルタリング操作を実行していました。しかし、問合せの一部としてベクトル距離が選択(投影)されると、そのベクトル距離計算がデータベース・サーバーで実行されました。
Oracle Exadata System Softwareリリース25.1.0では、投影されたベクトル距離について、AIスマート・スキャンはストレージ・サーバー内でCPU集中型のベクトル距離計算を実行し、計算された値をデータベース・サーバーに送り返します。この最適化により、ベクトル距離計算のために大量のベクトル・データをデータベース・サーバーに送信する必要がなくなり、ストレージ・ネットワークのトラフィックが減少し、ベクトル距離投影による問合せのパフォーマンスが向上します。