リリース更新23.6の機能

AI Vector Search: 新規ベクトル距離メトリック

AI Vector Searchは23.6で拡張され、ジャッカード距離と呼ばれる新しいベクトル距離メトリックが含まれています。

この機能により、ユーザーはベクトル間の別の距離メトリックも使用できます。

ドキュメントの表示に関する項

ハイブリッド・ベクトル索引

ハイブリッド・ベクトル索引(HVI)は、全文検索とセマンティック・ベクトル検索を組み合せて高品質の検索結果を得て、ドキュメントの索引付けとクエリを簡単に行うことができる新しい索引です。

ハイブリッド・ベクトル索引(HVI)は、ベクトル類似性検索と単一の索引DDLを介したテキスト検索の両方を有効にするフォームへドキュメントを変換するプロセスを簡略化します。

HVIは、ユーザーがテキスト問合せ、ベクトル類似性問合せ、またはこれらの両方のアプローチを利用するハイブリッド問合せを実行できる統合問合せAPIを提供します。これにより、ユーザーは簡単に検索エクスペリエンスをカスタマイズし、検索結果を拡張できます。

ドキュメントの表示に関する項

パーティション・ローカルの近隣パーティション・ベクトル索引

この機能により、近傍パーティション・ベクトル索引のローカル索引付けが可能になり、パーティション表の検索パフォーマンスが最適化されます。この機能では、概念的にはパーティションごとに専用のベクトル索引が作成されるため、パーティション・キー・フィルタを使用する問合せでは、関連する索引パーティションのみを検索できます。その結果、ベクトル検索がより効率的になり、大規模なパーティション化されたデータセットを問い合せる際の応答時間が大幅に短縮されます。

大規模なエンタープライズ・データセットは、パフォーマンスを最適化するためにリレーショナル属性によって頻繁にパーティション化されます。ローカルの近傍パーティション・ベクトル索引を有効にすることで、ユーザーはパーティション・プルーニングによるスケーラビリティの向上、および問合せパフォーマンスの高速化というメリットが得られます。また、このアプローチはより効率的なデータ・ライフサイクル管理を実現し、大規模なエンタープライズ・ワークロードの処理に最適です。

ドキュメントの表示に関する項

永続近傍グラフ・ベクトル索引

HNSWベクトル索引は、インメモリー常駐の多層グラフ索引です。再起動時にインメモリー・グラフの再作成にかかる時間は、グラフのディスク・チェックポイント・イメージを使用することで短縮できます。この機能では、チェックポイント形式とフレームワークを追加してディスク・チェックポイントを取得し、それを使用してインメモリー常駐グラフ構造を再作成します。

再起動後の索引アクセス計画の取得には時間がかかる場合があります。優先度の高いディスク・チェックポイント・ベースのリロード実行により、再起動後に索引アクセス計画の取得にかかる時間が短縮されます。

ドキュメントの表示に関する項

疎ベクトル

疎ベクトルは通常、多数のディメンションを持つベクトルですが、一部のディメンションにゼロ以外の値があります。これらのベクトルは、SPLADEやBM25などのスパース・エンコーディング・モデルによって生成されることがよくあります。概念的には、疎ベクトルの各ディメンションは、特定の語彙からのキーワードを表します。特定のドキュメントでは、ベクトルのゼロ以外のディメンション値は、そのドキュメントに表示されるキーワード(およびそのバリエーション)に対応します。

SPLADEやBM25などのモデルによって生成される疎ベクトルは、多くの場合、ドメイン外の検索におけるキーワードの感度と有効性の観点から、BERTなどのモデルの密ベクトルを上回ります。この優れたパフォーマンスは、特に法律や学術研究など、正確なキーワード・マッチングが重要なアプリケーションで役立ちます。また、疎ベクトルはハイブリッド・ベクトル検索によく使用されます。ここでは、密ベクトルとともに使用して、セマンティック検索とキーワード検索を結合し、より関連性の高い検索結果を提供できます。

ドキュメントの表示に関する項

近傍グラフ・ベクトル索引のトランザクション・サポート

HNSW索引は、ベクトル・データのインメモリー階層グラフ索引です。23.4および23.5では、ベクトル列にHNSW索引が構築された表ではDMLが許可されませんでした。この機能により、このような表に対してトランザクションを実行できます。さらに、HNSW索引を使用するベクトル検索問合せでは、読取りスナップショットに基づいてトランザクション的に一貫性のある結果が表示されます。トランザクション的な一貫性はOracle RACでも保証され、クラスタ内のすべてのインスタンスでHNSW索引が複製され、クラスタ内の1つ以上のインスタンスでDMLが発生し、そのクラスタ内の任意のインスタンスで検索問合せを実行できます。

HNSW索引は、Oracleが23aiで提供する最速のベクトル検索索引です。したがって、顧客はHNSW索引を使用して検索問合せを実行し、基礎となる表のリレーショナル列またはベクトル列に対してDML変更を発行する必要もあります。DMLによってインメモリーHNSW索引構造が失効する可能性があるため、このプロジェクトには特別なプロトコルが追加され、トランザクション的に一貫した結果が顧客に保証されます。

ドキュメントの表示に関する項

特徴抽出アルゴリズムのベクトル形式出力

特徴抽出アルゴリズムは、低いディメンションの潜在的な領域での予測を表す一連の特徴を生成します。通常、出力は数値で密です。通常はベクトル型表現が選択されます。

特徴抽出アルゴリズムは、リレーショナル・データをベクトル化するための原則的なアプローチを表します。ベクトル化表現は類似性検索に使用できます。

ドキュメントの表示に関する項

GoldenGate JSONリレーショナル二面性ビューのレプリケーション

この機能により、開発者はOracle GoldenGateテクノロジを使用して、リレーショナル表ではなくJSONドキュメントとしてJSONリレーショナル二面性ビュー・データをOracle DatabaseからターゲットのOracleまたはOracle以外のデータベースにレプリケートできます。

JSONデータのレプリケーションは、Oracle以外のデータベースからOracle Databaseへの高可用性、フェイルオーバーおよびリアルタイム移行の重要な機能です。

MongoDB (ドキュメント・データベース)やRedis (NoSQLキー/値ストア)などのOracle以外のデータベースへのOracle GoldenGateレプリケーションは、JSONリレーショナル二面性ビューからJSONドキュメントをレプリケートでき、シンプルで高性能です。

開発者は、複雑なJSONやSQL変換を記述してリレーショナルやドキュメント・ベースの更新のデータを形成したり、ターゲット・データベースでアプリケーション・オブジェクトを再構築するという負担を追う必要がありません。

ドキュメントの表示に関する項

JSONリレーショナル二面性ビュー: 非表示フィールドと生成されたフィールド

二面性ビューのデータは、ビューのドキュメントにはない非表示フィールドにマップできます。生成されたフィールドでは、非表示フィールドの値を使用できます。

二面性ビューでサポートされているドキュメントは、基礎となるすべての列(特に他のフィールド値の計算にのみ必要な列)のフィールドを必要としない場合、より単純になります。
 

ドキュメントの表示に関する項

JSONリレーショナル二面性ビュー: 計算値を含むフィールドの追加

二面性ビューは、フィールドがリレーショナル表の列にマップされるオブジェクトを含むJSONドキュメントを生成します。値が自動的に計算されるオブジェクト・フィールドを追加できます。

計算フィールドを追加することでデータベースがオブジェクトを自動的に拡張する場合、このような計算を複数の別個のクライアント・アプリケーションで実行する必要はありません。また、フィールド計算では、結果オブジェクトに公開されない格納済データを参照できます(これはリダクションに似た機能です)。

ドキュメントの表示に関する項

JSONコレクション・ビュー

JSONコレクション・ビューは、DATAという名前のJSON型の列でJSONオブジェクトを公開する特別な読取り専用データベース・ビューです。

JSONコレクション・ビューは、概念的にはJSONリレーショナル二面性ビューに近いものですが、読取り専用であるため制限が少なくなります。

ドキュメントの表示に関する項

JSONレプリケーション

CREATE/ALTER TABLE文のlogical_replication_clauseが拡張され、サプリメンタル・ロギングでの部分的なJSON更新の無効化および有効化が可能になります。

部分的なJSON更新では、レプリケートまたは変更が必要なデータが少なくなるため、レプリケーションの効率が向上します。変更は、更新されたデータをすべて送信するのではなく、リモート側でレプリケートできます。この機能を使用すると、同じハードウェアでパフォーマンスが向上するため、ハードウェア・コストが削減されます。

ドキュメントの表示に関する項

JSON検索索引パスのサブセット化

JSON検索索引の作成時に、索引付けに含めるフィールドまたは索引付けから除外するフィールド(パスのサブセット化)を指定できます。

パスのサブセット化によって、検索索引のサイズが小さくなり、パフォーマンスが向上します。

ドキュメントの表示に関する項

JSONコレクション表のレプリケーション・サポート

JSONコレクション表は、GoldenGateを使用して論理レプリケーションに対して有効にできます。レプリケーションは、JSONリレーショナル二面性ビューおよびMongoDBなどのサード・パーティ製品との間でサポートされます。

レプリケーションは、Oracle Database間で機能する基本的なデータベース機能です。また、MongoDBなどのサード・パーティ・データベースからOracle Databaseへのオンライン移行を容易にするためにも使用されます。

ドキュメントの表示に関する項

CONSTRAINT_NOVALIDATE、データ・ポンプ・インポートのTRANSFORMパラメータ

Oracle Data PumpのTRANSFORMパラメータ・オプションCONSTRAINT_NOVALIDATEを使用すると、検証プリファレンスを設定できます。オプションには、YまたはNの2つがあります。Yに設定すると、インポート時に制約は検証されません。

インポート中にソースで有効な制約の検証は不要です。移行プロセスが遅くなる可能性があります。インポート後に検証を実行できます。

ドキュメントの表示に関する項

Autonomous Databaseのインポート操作中の統計収集の無効化

DATA_OPTIONS=DISABLE_STATS_GATHERINGパラメータ・オプションは、インポート・ジョブ中の統計収集を無効にします。

統計収集は、大規模なインポート操作のパフォーマンスに影響を与える可能性があります。このパラメータは、インポート・ジョブ中の統計収集を無効にします。このパラメータは、オンプレミスおよびユーザー管理クラウド・サービスのインポート操作でもサポートされています。Autonomous Database以外の環境では統計収集は自動ではありませんが、このパラメータは役立ちます。Oracle Data Pumpインポート・ジョブ中のデータ・ロードなど、DML操作に関する環境統計をOracle Autonomous Databaseが自動的に収集するかどうかを制御します。

ドキュメントの表示に関する項

Oracle Data Redactionの機能拡張

このリリースには、既存の機能の最適化や以前の制限の削除など、Oracle Data Redactionに対する様々な機能拡張が含まれています。

Oracle Data Redactionのこのような機能拡張により、全体的なエクスペリエンスが向上します。

ドキュメントの表示に関する項

データ・ポンプ・インポートのパラレル索引作成パラメータ

Oracle Data Pump Importのコマンドライン・モードのONESTEP_INDEXパラメータは、索引作成の同時実行性を最適化し、ジョブ全体の並列度とのバランスをとります。これは、INDEX_THRESHOLDパラメータと組み合せて実行します。

索引作成は、移行プロセスにおいて重要なステップです。大規模な索引作成のパラレル処理を有効にし、大規模な索引作成のニーズとインポート・ジョブ全体のパラレル処理のバランスを取ることで、データ・ポンプ・インポート・ジョブに割り当てられたパラレル・リソースの使用効率を向上させます。これにより、インポート時間を大幅に短縮することで、論理移行プロセスがより効果的になります。さらに、ソース・ダンプファイルから大規模な索引定義を抽出し、インポート・ジョブ外でこれらの大規模な索引を作成する追加のステップに関連する労力を削減されます。

ドキュメントの表示に関する項

セッションレス・トランザクション

トランザクションを管理するには、接続およびセッション・リソースをそのライフサイクル全体でトランザクションに関連付ける必要があります。したがって、セッションまたは接続は、トランザクションが終了した後にのみ解放できます。その結果、セッション/接続の利用率が低下しやすくなります。セッションレス・トランザクションでは、トランザクションを開始した後、そのライフサイクル中にトランザクションを柔軟に一時停止したり再開できます。セッションまたは接続を解放してプールに戻すと、他のトランザクションで再利用できるため、実質的にトランザクションとセッション/接続が多重化されます。

セッションレス・トランザクションは、アプリケーションがセッション/接続(単一インスタンスまたはRAC)間でトランザクションを一時停止および再開する機能を提供するため、外部トランザクション・マネージャを必要とせず、アプリケーションでコミットおよびリカバリ・プロトコルを調整しなくても済みます。データベースは、コミットおよびリカバリを含むトランザクション・ライフサイクルを管理します。アプリケーション・パフォーマンスとスループットでは、必要なクライアント/サーバーのラウンドトリップが少なくなるため、コミット・レイテンシが短縮されます。外部調整が不要なため、セッションレス・トランザクションを使用すると、中間層またはアプリケーション層のインフラストラクチャが大幅に簡素化され、外部調整トランザクション(XAなど)と比較するとダウンタイムが大幅に減少します。

ドキュメントの表示に関する項

XMLTYPE_STORAGE_CLAUSE、データ・ポンプ・インポートのTRANSFORMパラメータ

トランスポータブル・バイナリXMLにより、XMLデータ記憶域が簡略化され、転送が容易になります。XMLデータのエンコードまたはデコードに使用されるメタデータは、中央表には格納されません。

XMLTYPE_STORAGE_CLAUSEは、オプションTRANSPORTABLE BINARY XMLまたはBINARY XMLを取りるようになりました。リリース23aiの新しい推奨記憶域タイプであるTRANSPORTABLE BINARY XML XMLTypeを使用して、自己完結型バイナリ形式でデータを格納することをお薦めします。

BINARY XML (トランスポータブルではない)格納XMLTypeを使用して、XMLデータ専用に設計されている事後解析バイナリ形式でデータを格納します。バイナリXMLは、簡潔で事後解析型であり、XML Schema対応のXMLデータです。バイナリXMLはトランスポータブルではなく、XMLデータのエンコードまたはデコードに使用されるメタデータを中央表に効率的に格納します。

データ・ポンプでは、ソース・データベースのXMLType格納形式(オブジェクト・リレーショナル、バイナリXMLまたはCLOB)に関係なく、タイプXMLTypeのデータをエクスポートおよびインポートできます。Oracle Data Pumpでは、XMLデータをトランスポータブル・バイナリXMLとしてエクスポートおよびインポートするため、ソース・データベースとターゲット・データベースでは、データに対して異なるXMLType記憶域モデルを使用できます。

ドキュメントの表示に関する項