23.2 PL/SQLプロシージャCTX_QUERY.RESULT_SETを使用したJSONファセット検索
JSON検索索引を作成している場合、PL/SQLプロシージャCTX_QUERY.result_set
を使用して、JSONデータに対してファセット検索を実行することもできます。この検索は、たとえばSQLファンクションcontains
で複数の個別問合せを使用するのではなく、様々な種類の検索ヒットをすべて一度に生成するように最適化されています。
プロシージャCTX_QUERY.result_set
を使用して検索するには、結果セット・ディスクリプタ(RSD)を渡します。これにより、(事前定義済演算子フィールド$query
、$search
および$facet
を含むJSONオブジェクトとして)索引付けされたJSONデータから検索するJSON値と、そのグループ化または集計方法が指定されます。取得および処理できる値は、JSONスカラーまたはJSONのスカラーの配列のいずれかです。
(演算子フィールド$query
は、SODA query-by-example (QBE)問合せでも使用されます。演算子$contains
を、フィールド$query
の値内に、Oracle SQL条件json_textcontains
で提供されるのと同様の全文照合のために使用できます。)
RSDフィールドは、出力結果セットに含める内容を指定する順序付きテンプレートとして機能します。(検出されたJSONデータに加えて、結果セットには通常、検索ヒットしたrowidといくつかのカウントのリストが含まれています。)
$facet
フィールド値はファセット・オブジェクトのJSON配列です。それぞれのオブジェクトが、特定のパスにあるJSONデータを定義し、場合によっては一部の条件を満たし、そのデータに適用する集計操作を定義しています。
ファセット・データは、演算子$count
、$min
、$max
、$avg
および$sum
を使用して集計できます。たとえば、$sum
は、ターゲット・データ値の合計を返します。集計演算子は、パスによって対象指定されたすべてのスカラー値に適用するか、または様々な値範囲で定義されたそのような値のバケットに個別に適用できます。
最後に、演算子$uniqueCount
を使用して、指定のパスでの個別値の出現回数を取得できます。
たとえば、次の$facet
値について考えてみます。
[ {"$uniqueCount" : "zebra.name"},
{"$sum" : {"path" : "zebra.price",
"bucket : [{"$lt" : 3000},
{"$gte" : 3000}]},
{"$avg" : "zebra.rating"} ]
問合せ結果が返されると、出力内のフィールド$facet
の値は3つのオブジェクトの配列であり、次のフィールドが含まれています。
-
zebra.name
— 各zebra名の出現回数。 -
zebra.price
— 2つのバケット(3000未満の価格と3000以上の価格)で表したzebra価格の合計。 -
zebra.rating
— すべてのzebra評価の平均。(評価のないzebraは無視されます。)
[ {"zebra.name" : [ {"value":"Zigs",
"$uniqueCount:2},
{"value":"Zigzag",
"$uniqueCount:1},
{"value":"Storm",
"$uniqueCount:1} ]},
{"zebra.price" : [ {"value":1000,
"$uniqueCount:2},
{"value":3000,
"$uniqueCount:2},
{"value":2000,
"$uniqueCount:1} ]},
{"zebra.rating" : {"$avg":4.66666666666666666667}} ]