Retention Rate er defineret som antallet af kunder, der fortsætter med at bruge et produkt/service. Det er vanskeligt at beregne kohortefastholdelsesanalyse. Sådan beregner du fastholdelsesraten i SQL til kundefastholdelsesanalyse. Du kan bruge den til at beregne tilbageholdelsesraten i MySQL, PostgreSQL, SQL Server og Oracle. Vi vil også se på SQL-forespørgslen for kundefastholdelse. Fastholdelsesraten måles som antallet af tilbagevendende brugere med et regelmæssigt interval, f.eks. hver uge eller måned, grupperet efter deres tilmeldingsuge.
Vi beregner fastholdelse efter ugentlig kohorte i SQL og ender med en tabel som nedenstående, der viser antallet af kunder, der er logget ind igen efter første tilmelding for et par uger siden, for hver uge efter tilmelding.
Hvordan beregner man retentionsrate i SQL?
Her er trinene til at beregne tilbageholdelsesraten i SQL. Lad os sige, at du har følgende tabel, der gemmer user_id og login_date for hver brugers besøg.
mysql> create table login(login_date date,user_id int, id int not null auto_increment, primary key (id)); mysql> insert into login(login_date,user_id) values('2020-01-01',10),('2020-01-02',12),('2020-01-03',15), ('2020-01-04',11),('2020-01-05',13),('2020-01-06',9), ('2020-01-07',21),('2020-01-08',10),('2020-01-09',10), ('2020-01-10',2),('2020-01-11',16),('2020-01-12',12), ('2020-01-13',10),('2020-01-14',18),('2020-01-15',15), ('2020-01-16',12),('2020-01-17',10),('2020-01-18',18), ('2020-01-19',14),('2020-01-20',16),('2020-01-21',12), ('2020-01-22',21),('2020-01-23',13),('2020-01-24',15), ('2020-01-25',20),('2020-01-26',14),('2020-01-27',16), ('2020-01-28',15),('2020-01-29',10),('2020-01-30',18); mysql> select * from login; +------------+---------+----+ | login_date | user_id | id | +------------+---------+----+ | 2020-01-01 | 10 | 1 | | 2020-01-02 | 12 | 2 | | 2020-01-03 | 15 | 3 | | 2020-01-04 | 11 | 4 | | 2020-01-05 | 13 | 5 | | 2020-01-06 | 9 | 6 | | 2020-01-07 | 21 | 7 | | 2020-01-08 | 10 | 8 | | 2020-01-09 | 10 | 9 | | 2020-01-10 | 2 | 10 | | 2020-01-11 | 16 | 11 | | 2020-01-12 | 12 | 12 | | 2020-01-13 | 10 | 13 | | 2020-01-14 | 18 | 14 | | 2020-01-15 | 15 | 15 | | 2020-01-16 | 12 | 16 | | 2020-01-17 | 10 | 17 | | 2020-01-18 | 18 | 18 | | 2020-01-19 | 14 | 19 | | 2020-01-20 | 16 | 20 | | 2020-01-21 | 12 | 21 | | 2020-01-22 | 21 | 22 | | 2020-01-23 | 13 | 23 | | 2020-01-24 | 15 | 24 | | 2020-01-25 | 20 | 25 | | 2020-01-26 | 14 | 26 | | 2020-01-27 | 16 | 27 | | 2020-01-28 | 15 | 28 | | 2020-01-29 | 10 | 29 | | 2020-01-30 | 18 | 30 | +------------+---------+----+
Vi vil lave ugentlig kohorteanalyse. Afhængigt af dit produkt/tjeneste kan du ændre det til månedligt/dagligt.
Vi vil bruge MySQL til at beregne retention rate i SQL. Du kan også beregne churn rate for PostgreSQL.
1. Bucket-besøg efter uge
For at beregne fastholdelsesraten i SQL vil vi først gruppere hvert besøg efter dets login-uge.
mysql> SELECT user_id, week(login_date) AS login_week FROM login GROUP BY user_id,week(login_date); +---------+------------+ | user_id | login_week | +---------+------------+ | 2 | 1 | | 9 | 1 | | 10 | 0 | | 10 | 1 | | 10 | 2 | | 10 | 4 | | 11 | 0 | | 12 | 0 | | 12 | 2 | | 12 | 3 | | 13 | 1 | | 13 | 3 | | 14 | 3 | | 14 | 4 | | 15 | 0 | | 15 | 2 | | 15 | 3 | | 15 | 4 | | 16 | 1 | | 16 | 3 | | 16 | 4 | | 18 | 2 | | 18 | 4 | | 20 | 3 | | 21 | 1 | | 21 | 3 | +---------+------------+
Se også, hvordan man beregner ugentlige aktive brugere (WAU) i MySQL.
2. Beregn FØRSTE UGE med login for hver bruger
Dernæst, for at beregne tilbageholdelsesraten i SQL, skal vi beregne den første uges login for hver bruger. Vi vil blot bruge MIN-funktionen og GRUPPER BY til at beregne den første login-uge for hver bruger
mysql> SELECT user_id, min(week(login_date)) AS first_week FROM login GROUP BY user_id; +---------+------------+ | user_id | first_week | +---------+------------+ | 2 | 1 | | 9 | 1 | | 10 | 0 | | 11 | 0 | | 12 | 0 | | 13 | 1 | | 14 | 3 | | 15 | 0 | | 16 | 1 | | 18 | 2 | | 20 | 3 | | 21 | 1 | +---------+------------+
3. Flet de 2 tabeller for login_week og first_week
Dernæst får vi login_week og first_week side om side for hver bruger ved at bruge forespørgslen nedenfor, med en INNER JOIN, til at beregne fastholdelsesraten i SQL.
mysql> select a.user_id,a.login_week,b.first_week as first_week from (SELECT user_id, week(login_date) AS login_week FROM login GROUP BY user_id,week(login_date)) a, (SELECT user_id, min(week(login_date)) AS first_week FROM login GROUP BY user_id) b where a.user_id=b.user_id; +---------+------------+------------+ | user_id | login_week | first_week | +---------+------------+------------+ | 2 | 1 | 1 | | 9 | 1 | 1 | | 10 | 0 | 0 | | 10 | 1 | 0 | | 10 | 2 | 0 | | 10 | 4 | 0 | | 11 | 0 | 0 | | 12 | 0 | 0 | | 12 | 2 | 0 | | 12 | 3 | 0 | | 13 | 1 | 1 | | 13 | 3 | 1 | | 14 | 3 | 3 | | 14 | 4 | 3 | | 15 | 0 | 0 | | 15 | 2 | 0 | | 15 | 3 | 0 | | 15 | 4 | 0 | | 16 | 1 | 1 | | 16 | 3 | 1 | | 16 | 4 | 1 | | 18 | 2 | 2 | | 18 | 4 | 2 | | 20 | 3 | 3 | | 21 | 1 | 1 | | 21 | 3 | 1 | +---------+------------+------------+
4. Beregn ugenummer
Herfra er det nemt at beregne retention rate i SQL. Dernæst beregner vi forskellen mellem login_week og first_week for at beregne week_number (antal uge)
mysql> select a.user_id,a.login_week,b.first_week as first_week, a.login_week-first_week as week_number from (SELECT user_id, week(login_date) AS login_week FROM login GROUP BY user_id,week(login_date)) a, (SELECT user_id, min(week(login_date)) AS first_week FROM login GROUP BY user_id) b where a.user_id=b.user_id; +---------+------------+------------+-------------+ | user_id | login_week | first_week | week_number | +---------+------------+------------+-------------+ | 2 | 1 | 1 | 0 | | 9 | 1 | 1 | 0 | | 10 | 0 | 0 | 0 | | 10 | 1 | 0 | 1 | | 10 | 2 | 0 | 2 | | 10 | 4 | 0 | 4 | | 11 | 0 | 0 | 0 | | 12 | 0 | 0 | 0 | | 12 | 2 | 0 | 2 | | 12 | 3 | 0 | 3 | | 13 | 1 | 1 | 0 | | 13 | 3 | 1 | 2 | | 14 | 3 | 3 | 0 | | 14 | 4 | 3 | 1 | | 15 | 0 | 0 | 0 | | 15 | 2 | 0 | 2 | | 15 | 3 | 0 | 3 | | 15 | 4 | 0 | 4 | | 16 | 1 | 1 | 0 | | 16 | 3 | 1 | 2 | | 16 | 4 | 1 | 3 | | 18 | 2 | 2 | 0 | | 18 | 4 | 2 | 2 | | 20 | 3 | 3 | 0 | | 21 | 1 | 1 | 0 | | 21 | 3 | 1 | 2 | +---------+------------+------------+-------------+
5. Drej resultatet
Til sidst skal vi dreje resultatet for at beregne retention rate i SQL og generere kohorte-tabel. I vores pivottabel vil vi have en række for hver første_uge værdi og én kolonne for hvert ugenummer indeholdende antallet af brugere, der har tilbage efter 'n' uger til at bruge dit produkt/tjeneste. Til dette bruger vi følgende forespørgsel.
mysql> select first_week, SUM(CASE WHEN week_number = 0 THEN 1 ELSE 0 END) AS week_0, SUM(CASE WHEN week_number = 1 THEN 1 ELSE 0 END) AS week_1, SUM(CASE WHEN week_number = 2 THEN 1 ELSE 0 END) AS week_2, SUM(CASE WHEN week_number = 3 THEN 1 ELSE 0 END) AS week_3, SUM(CASE WHEN week_number = 4 THEN 1 ELSE 0 END) AS week_4, SUM(CASE WHEN week_number = 5 THEN 1 ELSE 0 END) AS week_5, SUM(CASE WHEN week_number = 6 THEN 1 ELSE 0 END) AS week_6, SUM(CASE WHEN week_number = 7 THEN 1 ELSE 0 END) AS week_7, SUM(CASE WHEN week_number = 8 THEN 1 ELSE 0 END) AS week_8, SUM(CASE WHEN week_number = 9 THEN 1 ELSE 0 END) AS week_9 from ( select a.user_id,a.login_week,b.first_week as first_week,a.login_week-first_week as week_number from (SELECT user_id, week(login_date) AS login_week FROM login GROUP BY user_id,week(login_date)) a,(SELECT user_id, min(week(login_date)) AS first_week FROM login GROUP BY user_id) b where a.user_id=b.user_id ) as with_week_number group by first_week order by first_week; +------------+--------+--------+--------+--------+--------+--------+--------+--------+--------+--------+ | first_week | week_0 | week_1 | week_2 | week_3 | week_4 | week_5 | week_6 | week_7 | week_8 | week_9 | +------------+--------+--------+--------+--------+--------+--------+--------+--------+--------+--------+ | 0 | 4 | 1 | 3 | 2 | 2 | 0 | 0 | 0 | 0 | 0 | | 1 | 5 | 0 | 3 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | | 2 | 1 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | | 3 | 2 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | +------------+--------+--------+--------+--------+--------+--------+--------+--------+--------+--------+
Nu ved vi, hvordan man beregner retention rate i SQL. Du kan også ovenstående forespørgsler for at beregne fastholdelsesraten i MySQL, PostgreSQL.
Endelig kan du bruge et datavisualiseringsværktøj til at plotte ovenstående retentionskohorteanalyse i en tabel. Her er en kohortefastholdelsestabel, der er oprettet ved hjælp af Ubiq.
Forresten, hvis du vil oprette pivottabeller, diagrammer og dashboards fra MySQL-databasen, kan du prøve Ubiq. Vi tilbyder en 14-dages gratis prøveperiode.