sql >> Database teknologi >  >> RDS >> Mysql

Højere kardinalitetskolonne først i et indeks, når det involverer et interval?

Lad os først prøve FORCE INDEX for at vælge enten ef eller fe . Tidspunkterne er for korte til at få et klart billede af, hvad der er hurtigere, men `EXPLAIN viser en forskel:

Tvinger intervallet til filetime først. (Bemærk:Rækkefølgen i WHERE har ingen indflydelse.)

mysql> EXPLAIN SELECT COUNT(*), AVG(fsize)
    FROM files FORCE INDEX(fe)
    WHERE ext = 'gif' AND filetime >= '2015-01-01'
                      AND filetime <  '2015-01-01' + INTERVAL 1 MONTH;
+----+-------------+-------+-------+---------------+------+---------+------+-------+-----------------------+
| id | select_type | table | type  | possible_keys | key  | key_len | ref  | rows  | Extra                 |
+----+-------------+-------+-------+---------------+------+---------+------+-------+-----------------------+
|  1 | SIMPLE      | files | range | fe            | fe   | 14      | NULL | 16684 | Using index condition |
+----+-------------+-------+-------+---------------+------+---------+------+-------+-----------------------+

Tvinger ext med lav kardinalitet først:

mysql> EXPLAIN SELECT COUNT(*), AVG(fsize)
    FROM files FORCE INDEX(ef)
    WHERE ext = 'gif' AND filetime >= '2015-01-01'
                      AND filetime <  '2015-01-01' + INTERVAL 1 MONTH;
+----+-------------+-------+-------+---------------+------+---------+------+------+-----------------------+
| id | select_type | table | type  | possible_keys | key  | key_len | ref  | rows | Extra                 |
+----+-------------+-------+-------+---------------+------+---------+------+------+-----------------------+
|  1 | SIMPLE      | files | range | ef            | ef   | 14      | NULL |  538 | Using index condition |
+----+-------------+-------+-------+---------------+------+---------+------+------+-----------------------+

Det er klart, rows siger ef er bedre. Men lad os tjekke med Optimizer-sporet. Outputtet er ret omfangsrigt; Jeg viser kun de interessante dele. Ingen FORCE er nødvendig; sporet viser begge muligheder og vælg derefter den bedste.

             ...
             "potential_range_indices": [
                ...
                {
                  "index": "fe",
                  "usable": true,
                  "key_parts": [
                    "filetime",
                    "ext",
                    "did",
                    "filename"
                  ]
                },
                {
                  "index": "ef",
                  "usable": true,
                  "key_parts": [
                    "ext",
                    "filetime",
                    "did",
                    "filename"
                  ]
                }
              ],

...

              "analyzing_range_alternatives": {
                "range_scan_alternatives": [
                  {
                    "index": "fe",
                    "ranges": [
                      "2015-01-01 00:00:00 <= filetime < 2015-02-01 00:00:00"
                    ],
                    "index_dives_for_eq_ranges": true,
                    "rowid_ordered": false,
                    "using_mrr": false,
                    "index_only": false,
                    "rows": 16684,
                    "cost": 20022,               <-- Here's the critical number
                    "chosen": true
                  },
                  {
                    "index": "ef",
                    "ranges": [
                      "gif <= ext <= gif AND 2015-01-01 00:00:00 <= filetime < 2015-02-01 00:00:00"
                    ],
                    "index_dives_for_eq_ranges": true,
                    "rowid_ordered": false,
                    "using_mrr": false,
                    "index_only": false,
                    "rows": 538,
                    "cost": 646.61,               <-- Here's the critical number
                    "chosen": true
                  }
                ],

...

          "attached_conditions_computation": [
            {
              "access_type_changed": {
                "table": "`files`",
                "index": "ef",
                "old_type": "ref",
                "new_type": "range",
                "cause": "uses_more_keyparts"   <-- Also interesting
              }
            }

Med fe (intervalkolonnen først), området kunne bruges, men det estimerede scanning gennem 16684 rækker, der fiskede efter ext='gif' .

Med ef (lav kardinalitet ext for det første) kunne den bruge begge kolonner i indekset og bore mere effektivt ned i BTree. Derefter fandt den anslået 538 rækker, som alle er nyttige til forespørgslen - ingen yderligere filtrering nødvendig.

Konklusioner:

  • INDEX(filetime, ext) brugte kun den første kolonne.
  • INDEX(ext, filetime) brugte begge kolonner.
  • Sæt kolonner involveret i = test først i indekset uanset kardinalitet .
  • Forespørgselsplanen går ikke ud over den første 'område'-kolonne.
  • "Kardinalitet" er irrelevant for sammensatte indekser og denne type forespørgsel .

("Brug af indeksbetingelse" betyder, at Storage Engine (InnoDB) vil bruge kolonner i indekset ud over den, der bruges til filtrering.)




  1. Brug af Substr med Instr til at udtrække en streng i Oracle

  2. Stop (lang) kørende SQL-forespørgsel i PostgreSQL, når session eller anmodninger ikke længere eksisterer?

  3. Hvordan kontrollerer jeg NLS_LANG for klienten?

  4. MariaDB GROUP_CONCAT()