det kan virke, men der kan være falske matches, uden nogen måde at forhindre dem på, fordi du kun har en algoritmeløsning. Dit bedste bud er at oprette en alias tabel. Inkluder alle varianter, der nogensinde er fundet for hvert firmanavn, og en FK til det rigtige firmas ID. Inkluder også en række for det faktiske navn.
AliasID CompanyID CompanyAlias
------- --------- ------------
1 1 Company X, Inc <<--actual real company name
2 1 Company X Inc
3 1 Company X
Hvis et nøjagtigt navnematch ikke findes i denne tabel, når du importerer data, kan du bruge din foreslåede algoritme eller en anden, eller bruge et menneskeligt input osv. til at finde et match eller generere et nyt firma. Indsæt på det tidspunkt i aliastabellen. Hvis du finder ud af, at dit match var forkert af en eller anden grund, kan du ændre aliastabellen for at lave den korrekte mapping. Hvis du kun går med en algoritme, skal du inkludere undtagelser, og din algoritme vil vokse sig stor og langsom. Med denne tabel og et godt indeks bør det være hurtigt at finde dine matches.