例4: カバー索引を使用したデータのソート
州(state)がCAで、居住市(city)がSantaclaraで、収入(income)が1000から10000までであるユーザーのID (id)と収入(income)をフェッチします。その結果を、ユーザーの収入(income)を基準にソートします。
SELECT id, income FROM Users u WHERE u.address.state = "CA" AND
u.address.city= "Santaclara" AND 1000 < income and income < 10000
ORDER BY income
問合せ実行計画:
{
"iterator kind" : "RECEIVE",
"distribution kind" : "ALL_SHARDS",
"order by fields at positions" : [ 1 ],
"input iterator" :
{
"iterator kind" : "SELECT",
"FROM" :
{
"iterator kind" : "TABLE",
"target table" : "users",
"row variable" : "$$u",
"index used" : "idx_state_city_income",
"covering index" : true,
"index row variable" : "$$u_idx",
"index scans" : [
{
"equality conditions" : {"address.state":"CA","address.city":"Santaclara"},
"range conditions" : { "income" : { "start value" : 1000, "start inclusive" : false, "end value" : 10000, "end inclusive" : false } }
}
]
},
"FROM variable" : "$$u_idx",
"SELECT expressions" : [
{
"field name" : "id",
"field expression" :
{
"iterator kind" : "FIELD_STEP",
"field name" : "#id",
"input iterator" :
{
"iterator kind" : "VAR_REF",
"variable" : "$$u_idx"
}
}
},
{
"field name" : "income",
"field expression" :
{
"iterator kind" : "FIELD_STEP",
"field name" : "income",
"input iterator" :
{
"iterator kind" : "VAR_REF",
"variable" : "$$u_idx"
}
}
}
]
}
}
問合せ実行計画の説明:
- この問合せ計画のルート・イテレータは、SELECTイテレータである単一の子(入力イテレータ)がある、RECEIVEイテレータです。この例でのRECEIVEイテレータの唯一のプロパティは、値がALL_SHARDSであるdistribution kindです。
- この結果は、
income
を基準にソートする必要があります。incomeはidx_state_city_income
索引に含まれています。したがって、この例では、別個のSORT演算子は必要ありません。ソートは、RECEIVE演算子で、そのプロパティorder by fields at positions
(配列)を使用して実行されます。この配列の値は、SELECT式でのソートするフィールドの位置によって異なります。
この例では、ORDER BYは、SELECT式内の2番目のフィールドである"order by fields at positions" : [ 1 ]
income
フィールドを使用して実行されます。そのため、イテレータのorder by fields at position
プロパティで1と示されています。ノート:
SELECT式内のフィールドの順序が異なる場合、前述の値は変わります。たとえば、問合せがSELECT income, id FROM Users u WHERE u.address.state = "CA" AND u.address.city= "Santaclara"AND 1000 < income and income < 10000 ORDER BY incomeである場合は、income
フィールドがSELECT式内の最初のフィールドであるため、順序基準フィールドはorder by fields at positions : [0 ]になります。 - ここでは索引
idx_state_city_income
が使用されています。また、この例では、索引のエントリのみを使用して問合せを評価可能であるため、これはカバー索引です。 - 索引スキャン・プロパティには、実行する索引スキャンを定義する、開始条件と停止条件が含まれています。
この問合せでは、1つの索引スキャンのみが実行されます。等価条件(equality conditions)は、その問合せからのu.address.state = "CA"およびu.address.city = "Santaclara"という条件に対応しています。この索引スキャンは、"index scans" : [ { "equality conditions" : {"address.state":"CA","address.city":"Santaclara"}, "range conditions" : { "income" : { "start value" : 1000, "start inclusive" : false, "end value" : 10000, "end inclusive" : false } } } ]
address.state
フィールドの値がCAでありaddress.cityフィールドがSantaclaraと等しい最初のエントリから開始されます。具体的に述べると、開始索引エントリで、address.state
フィールドの値がCAである必要があります。後続のすべてのエントリでそのaddress.state
フィールドの値がCAである必要があり、state値が異なるエントリが検出されるとすぐにスキャンが停止されます。ここにはincomeフィールドに適用する範囲条件があります。 - index row variableは
$$u_idx
であり、これは、TABLEイテレータによって生成されるすべての索引エントリを対象とする、変数の名前です。索引スキャンによって新しい索引エントリが生成されるたびに、$$u_idx
変数がそのエントリにバインドされます。 - FROMイテレータがTABLEイテレータである場合、FROM variableは、TABLEイテレータのindex row variableまたはrow variableのどちらか(使用されている索引がカバーかどうかで異なる)と同じになります。この例では、SELECT式内のすべてのフィールドは索引エントリの使用によってのみ評価可能であるため索引はカバーであり、FROM variableはindex row variable (
$$u_idx
)と同じになります。 - このindex row variable (
$$u_idx
)は、SELECT式の他の句を実装するイテレータによって参照されます。 - このSELECT式では、2つのフィールド(
id
およびincome
)がフェッチされます。これらは、SELECT式の句にある2つのフィールド名およびフィールド式に対応しています。
このSELECT式によってフェッチされるフィールドごとに、フィールド式がFIELD_STEPイテレータによって計算されます。FIELD_STEPイテレータでは、その入力イテレータで生成されたレコードからフィールド(前述の{ "field name" : "id", "field expression" : { "iterator kind" : "FIELD_STEP", "field name" : "#id", "input iterator" : { "iterator kind" : "VAR_REF", "variable" : "$$u_idx" } } }
id
)の値が抽出され返されます。このSELECT式でフェッチされるフィールドごとに同じことが実行されます。