Prøv trinene beskrevet i denne artikel:Fjernelse af dubletter fra en PostgreSQL-database.
Den beskriver en situation, hvor du skal håndtere enorme mængder data, som ikke er muligt at group by
.
En simpel løsning ville være denne:
DELETE FROM foo
WHERE id NOT IN (SELECT min(id) --or max(id)
FROM foo
GROUP BY hash)
Hvor hash
er noget, der bliver duplikeret.