sql >> Database teknologi >  >> RDS >> Mysql

Vil du fjerne dubletter med kun en MySQL-forespørgsel?

Overvej følgende testcase:

CREATE TABLE mytb (url_id int, url_addr varchar(100));

INSERT INTO mytb VALUES (1, 'www.google.com');
INSERT INTO mytb VALUES (2, 'www.microsoft.com');
INSERT INTO mytb VALUES (3, 'www.apple.com');
INSERT INTO mytb VALUES (4, 'www.google.com');
INSERT INTO mytb VALUES (5, 'www.cnn.com');
INSERT INTO mytb VALUES (6, 'www.apple.com');

Hvor vores testtabel nu indeholder:

SELECT * FROM mytb;
+--------+-------------------+
| url_id | url_addr          |
+--------+-------------------+
|      1 | www.google.com    |
|      2 | www.microsoft.com |
|      3 | www.apple.com     |
|      4 | www.google.com    |
|      5 | www.cnn.com       |
|      6 | www.apple.com     |
+--------+-------------------+
5 rows in set (0.00 sec)

Så kan vi bruge multiple-tabellen DELETE syntaks som følger:

DELETE t2
FROM   mytb t1
JOIN   mytb t2 ON (t2.url_addr = t1.url_addr AND t2.url_id > t1.url_id);

... som vil slette duplikerede poster og kun efterlade den første url baseret på url_id :

SELECT * FROM mytb;
+--------+-------------------+
| url_id | url_addr          |
+--------+-------------------+
|      1 | www.google.com    |
|      2 | www.microsoft.com |
|      3 | www.apple.com     |
|      5 | www.cnn.com       |
+--------+-------------------+
3 rows in set (0.00 sec)

OPDATERING - Yderligere til nye kommentarer ovenfor:

Hvis de dublet-URL'er ikke vil have det samme format, kan du bruge REPLACE() funktion til at fjerne www. eller http:// dele. For eksempel:

DELETE t2
FROM   mytb t1
JOIN   mytb t2 ON (REPLACE(t2.url_addr, 'www.', '') = 
                   REPLACE(t1.url_addr, 'www.', '') AND 
                   t2.url_id > t1.url_id);


  1. Hvordan bruger man ANY i stedet for IN i en WHERE-klausul med Rails?

  2. Hvad er forskellen mellem Non-Repeatable Read og Phantom Read?

  3. CURDATE() Eksempler – MySQL

  4. MySQL 8.0 - Klienten understøtter ikke godkendelsesprotokol anmodet af serveren; overveje at opgradere MySQL-klienten