sql >> Database teknologi >  >> RDS >> Sqlserver

SQL, Hjælpetabel over tal

Heh... undskyld jeg er så sent på at svare på et gammelt indlæg. Og ja, jeg var nødt til at svare, fordi det mest populære svar (på det tidspunkt, det rekursive CTE-svar med link til 14 forskellige metoder) i denne tråd er, ummm... ydeevne udfordret i bedste fald.

For det første er artiklen med de 14 forskellige løsninger fint til at se de forskellige metoder til at oprette en tal-/optællingstabel på farten, men som påpeget i artiklen og i den citerede tråd, er der en meget vigtigt citat...

"forslag vedrørende effektivitet og ydeevne er ofte subjektive. Uanset hvordan en forespørgsel bruges, bestemmer den fysiske implementering effektiviteten af ​​en forespørgsel. Derfor er det i stedet for at stole på uvildige retningslinjer, bydende nødvendigt, at du tester forespørgslen og afgør, hvilken der klarer sig bedst."

Ironisk nok indeholder artiklen i sig selv mange subjektive udsagn og "biased guidelines" såsom "en rekursiv CTE kan generere en nummerliste temmelig effektivt " og "Dette er en effektiv metode af at bruge WHILE-løkke fra et nyhedsgruppeindlæg af Itzik Ben-Gen" (som jeg er sikker på, at han postede kun for sammenligningsformål). Kom nu folkens... Bare det at nævne Itziks gode navn kan få nogle stakkels sludder til rent faktisk at bruge den forfærdelige metode. Forfatteren bør praktisere det, han prædiker, og bør lave en lille præstationstest, før han kommer med sådanne latterligt ukorrekte udsagn, især i lyset af enhver skalerbarhed.

Med tanken om rent faktisk at lave nogle test, før du fremsætter subjektive påstande om, hvad en kode gør, eller hvad nogen "kan lide", her er en kode, du kan lave din egen test med. Opsæt profiler for den SPID, du kører testen fra, og tjek det selv ud... bare lav en "Search'n'Replace" af nummeret 1000000 for dit "favorit"-nummer og se...

--===== Test for 1000000 rows ==================================
GO
--===== Traditional RECURSIVE CTE method
   WITH Tally (N) AS 
        ( 
         SELECT 1 UNION ALL 
         SELECT 1 + N FROM Tally WHERE N < 1000000 
        ) 
 SELECT N 
   INTO #Tally1 
   FROM Tally 
 OPTION (MAXRECURSION 0);
GO
--===== Traditional WHILE LOOP method
 CREATE TABLE #Tally2 (N INT);
    SET NOCOUNT ON;
DECLARE @Index INT;
    SET @Index = 1;
  WHILE @Index <= 1000000 
  BEGIN 
         INSERT #Tally2 (N) 
         VALUES (@Index);
            SET @Index = @Index + 1;
    END;
GO
--===== Traditional CROSS JOIN table method
 SELECT TOP (1000000)
        ROW_NUMBER() OVER (ORDER BY (SELECT 1)) AS N
   INTO #Tally3
   FROM Master.sys.All_Columns ac1
  CROSS JOIN Master.sys.ALL_Columns ac2;
GO
--===== Itzik's CROSS JOINED CTE method
   WITH E00(N) AS (SELECT 1 UNION ALL SELECT 1),
        E02(N) AS (SELECT 1 FROM E00 a, E00 b),
        E04(N) AS (SELECT 1 FROM E02 a, E02 b),
        E08(N) AS (SELECT 1 FROM E04 a, E04 b),
        E16(N) AS (SELECT 1 FROM E08 a, E08 b),
        E32(N) AS (SELECT 1 FROM E16 a, E16 b),
   cteTally(N) AS (SELECT ROW_NUMBER() OVER (ORDER BY N) FROM E32)
 SELECT N
   INTO #Tally4
   FROM cteTally
  WHERE N <= 1000000;
GO
--===== Housekeeping
   DROP TABLE #Tally1, #Tally2, #Tally3, #Tally4;
GO

Mens vi er i gang, er her tallene, jeg får fra SQL Profiler for værdierne 100, 1000, 10000, 100000 og 1000000...

SPID TextData                                 Dur(ms) CPU   Reads   Writes
---- ---------------------------------------- ------- ----- ------- ------
  51 --===== Test for 100 rows ==============       8     0       0      0
  51 --===== Traditional RECURSIVE CTE method      16     0     868      0
  51 --===== Traditional WHILE LOOP method CR      73    16     175      2
  51 --===== Traditional CROSS JOIN table met      11     0      80      0
  51 --===== Itzik's CROSS JOINED CTE method        6     0      63      0
  51 --===== Housekeeping   DROP TABLE #Tally      35    31     401      0

  51 --===== Test for 1000 rows =============       0     0       0      0
  51 --===== Traditional RECURSIVE CTE method      47    47    8074      0
  51 --===== Traditional WHILE LOOP method CR      80    78    1085      0
  51 --===== Traditional CROSS JOIN table met       5     0      98      0
  51 --===== Itzik's CROSS JOINED CTE method        2     0      83      0
  51 --===== Housekeeping   DROP TABLE #Tally       6    15     426      0

  51 --===== Test for 10000 rows ============       0     0       0      0
  51 --===== Traditional RECURSIVE CTE method     434   344   80230     10
  51 --===== Traditional WHILE LOOP method CR     671   563   10240      9
  51 --===== Traditional CROSS JOIN table met      25    31     302     15
  51 --===== Itzik's CROSS JOINED CTE method       24     0     192     15
  51 --===== Housekeeping   DROP TABLE #Tally       7    15     531      0

  51 --===== Test for 100000 rows ===========       0     0       0      0
  51 --===== Traditional RECURSIVE CTE method    4143  3813  800260    154
  51 --===== Traditional WHILE LOOP method CR    5820  5547  101380    161
  51 --===== Traditional CROSS JOIN table met     160   140     479    211
  51 --===== Itzik's CROSS JOINED CTE method      153   141     276    204
  51 --===== Housekeeping   DROP TABLE #Tally      10    15     761      0

  51 --===== Test for 1000000 rows ==========       0     0       0      0
  51 --===== Traditional RECURSIVE CTE method   41349 37437 8001048   1601
  51 --===== Traditional WHILE LOOP method CR   59138 56141 1012785   1682
  51 --===== Traditional CROSS JOIN table met    1224  1219    2429   2101
  51 --===== Itzik's CROSS JOINED CTE method     1448  1328    1217   2095
  51 --===== Housekeeping   DROP TABLE #Tally       8     0     415      0

Som du kan se, er den rekursive CTE-metode kun den næstværste til While Loop for Duration og CPU og har 8 gange hukommelsestrykket i form af logiske læsninger end While Loop . Det er RBAR på steroider og bør undgås, for enhver pris, for enhver enkelt række beregninger ligesom en While Loop bør undgås. Der er steder, hvor rekursion er ret værdifuldt, men dette ER IKKE et af dem .

Som sidebjælke er Mr. Denny helt i top... et permanent tal- eller tal-bord i korrekt størrelse er vejen at gå til de fleste ting. Hvad betyder korrekt størrelse? Nå, de fleste bruger en Tally-tabel til at generere datoer eller til at lave opdelinger på VARCHAR(8000). Hvis du opretter en 11.000 rækker Tally-tabel med det korrekte klyngeindeks på "N", vil du have rækker nok til at oprette mere end 30 års datoer (jeg arbejder en del med realkreditlån, så 30 år er et nøgletal for mig ) og helt sikkert nok til at håndtere en VARCHAR(8000) split. Hvorfor er "rigtig størrelse" så vigtigt? Hvis Tally-bordet bliver brugt meget, passer det nemt i cachen, hvilket gør det lynhurtigt uden meget pres på hukommelsen overhovedet.

Sidst men ikke mindst ved alle, at hvis du opretter en permanent Tally-tabel, er det ikke meget ligegyldigt, hvilken metode du bruger til at bygge den, fordi 1) den kun bliver lavet én gang og 2) hvis den er noget i retning af en 11.000 række tabel, vil alle metoderne køre "godt nok". Så hvorfor al den indigination fra min side over, hvilken metode jeg skal bruge???

Svaret er, at en eller anden stakkels fyr/pige, der ikke ved bedre og bare skal have sit arbejde gjort, kan se noget som den rekursive CTE-metode og beslutte at bruge den til noget, der er meget større og meget hyppigere brugt end at bygge en permanent Tally-tabel, og jeg forsøger at beskytte disse personer, serverne deres kode kører på, og det firma, der ejer dataene på disse servere . Ja... det er så stor en sag. Det burde også være for alle andre. Lær den rigtige måde at gøre tingene på i stedet for "god nok". Udfør nogle test, før du poster eller bruger noget fra et indlæg eller en bog... det liv, du redder, kan faktisk være dit eget, især hvis du tror, ​​at en rekursiv CTE er vejen at gå for sådan noget.;-)

Tak fordi du lyttede...



  1. Sådan bruger du cPanel MySQL Database Wizard

  2. Tabelopslag i SortCL-kompatible IRI-job

  3. Hurtige tips til reparation og gendannelse af SQL-database uden sikkerhedskopiering

  4. Hvordan bruger man en Oracle Ref Cursor fra C# ODP.NET som en ReturnValue Parameter uden at bruge en lagret funktion eller procedure?