sql >> Database teknologi >  >> RDS >> PostgreSQL

Undgå duplikerede indsættelser uden entydig begrænsning i måltabellen?

CDC-komponenterne i den betalte version af Talend Studio for Data Integration adresserer uden tvivl dette.

I Open Studio kan du rulle din egen Change data capture baseret på den sammensatte, unikke nøgle (fornavn, efternavn, dob, køn).

  • Brug tUniqueRow på data, der kommer fra stage_geno_patients, unikke på følgende kolonner:fornavn, efternavn, dob, køn
  • Før det ind i et tMap
  • Tilføj endnu en forespørgsel som input til tMap, for at udføre opslag i forhold til tabellen bag "patients_test", for at finde et match på fornavn, efternavn, dob, køn. Det opslag skal "Genindlæse for hver række" ved at slå op mod værdier fra iscenesættelsesrækken
  • I tilfælde af ikke-match, skal du opdage det og derefter foretage en indsættelse af iscenesættelsesrækken af ​​data i tabellen bag "patienter_test"

Q:Vil du også opdatere oplysninger? Eller er målet kun at udføre unikke indsættelser, hvor dataene ikke allerede er til stede?




  1. SQL-forespørgsel til trætabel

  2. Genstart primære nøglenumre for eksisterende rækker efter at have slettet det meste af en stor tabel

  3. SQL Server:fascineret af GETDATE()

  4. Anvend en enkelt udløserprocedure på mange forskellige tabeller