Lad os først prøve FORCE INDEX
for at vælge enten ef
eller fe
. Tidspunkterne er for korte til at få et klart billede af, hvad der er hurtigere, men `EXPLAIN viser en forskel:
Tvinger intervallet til filetime
først. (Bemærk:Rækkefølgen i WHERE
har ingen indflydelse.)
mysql> EXPLAIN SELECT COUNT(*), AVG(fsize)
FROM files FORCE INDEX(fe)
WHERE ext = 'gif' AND filetime >= '2015-01-01'
AND filetime < '2015-01-01' + INTERVAL 1 MONTH;
+----+-------------+-------+-------+---------------+------+---------+------+-------+-----------------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+-------+-------+---------------+------+---------+------+-------+-----------------------+
| 1 | SIMPLE | files | range | fe | fe | 14 | NULL | 16684 | Using index condition |
+----+-------------+-------+-------+---------------+------+---------+------+-------+-----------------------+
Tvinger ext
med lav kardinalitet først:
mysql> EXPLAIN SELECT COUNT(*), AVG(fsize)
FROM files FORCE INDEX(ef)
WHERE ext = 'gif' AND filetime >= '2015-01-01'
AND filetime < '2015-01-01' + INTERVAL 1 MONTH;
+----+-------------+-------+-------+---------------+------+---------+------+------+-----------------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+-------+-------+---------------+------+---------+------+------+-----------------------+
| 1 | SIMPLE | files | range | ef | ef | 14 | NULL | 538 | Using index condition |
+----+-------------+-------+-------+---------------+------+---------+------+------+-----------------------+
Det er klart, rows
siger ef
er bedre. Men lad os tjekke med Optimizer-sporet. Outputtet er ret omfangsrigt; Jeg viser kun de interessante dele. Ingen FORCE
er nødvendig; sporet viser begge muligheder og vælg derefter den bedste.
...
"potential_range_indices": [
...
{
"index": "fe",
"usable": true,
"key_parts": [
"filetime",
"ext",
"did",
"filename"
]
},
{
"index": "ef",
"usable": true,
"key_parts": [
"ext",
"filetime",
"did",
"filename"
]
}
],
...
"analyzing_range_alternatives": {
"range_scan_alternatives": [
{
"index": "fe",
"ranges": [
"2015-01-01 00:00:00 <= filetime < 2015-02-01 00:00:00"
],
"index_dives_for_eq_ranges": true,
"rowid_ordered": false,
"using_mrr": false,
"index_only": false,
"rows": 16684,
"cost": 20022, <-- Here's the critical number
"chosen": true
},
{
"index": "ef",
"ranges": [
"gif <= ext <= gif AND 2015-01-01 00:00:00 <= filetime < 2015-02-01 00:00:00"
],
"index_dives_for_eq_ranges": true,
"rowid_ordered": false,
"using_mrr": false,
"index_only": false,
"rows": 538,
"cost": 646.61, <-- Here's the critical number
"chosen": true
}
],
...
"attached_conditions_computation": [
{
"access_type_changed": {
"table": "`files`",
"index": "ef",
"old_type": "ref",
"new_type": "range",
"cause": "uses_more_keyparts" <-- Also interesting
}
}
Med fe
(intervalkolonnen først), området kunne bruges, men det estimerede scanning gennem 16684 rækker, der fiskede efter ext='gif'
.
Med ef
(lav kardinalitet ext
for det første) kunne den bruge begge kolonner i indekset og bore mere effektivt ned i BTree. Derefter fandt den anslået 538 rækker, som alle er nyttige til forespørgslen - ingen yderligere filtrering nødvendig.
Konklusioner:
INDEX(filetime, ext)
brugte kun den første kolonne.INDEX(ext, filetime)
brugte begge kolonner.- Sæt kolonner involveret i
=
test først i indekset uanset kardinalitet . - Forespørgselsplanen går ikke ud over den første 'område'-kolonne.
- "Kardinalitet" er irrelevant for sammensatte indekser og denne type forespørgsel .
("Brug af indeksbetingelse" betyder, at Storage Engine (InnoDB) vil bruge kolonner i indekset ud over den, der bruges til filtrering.)