sql >> Database teknologi >  >> RDS >> Mysql

levenshstein alternativ

Hvis du kun er bundet til MySQL, er der ikke en nem løsning.

Normalt løses dette ved at bruge specialiseret ngram-indeksering til hurtig kandidatopslagsfiltrering og derefter beregne livsthein kun på 10-50 kandidater, hvilket er hurtigere end at beregne levensthein for alle par.

Specialiserede fuldtekstsøgemaskiner som Solr/Lucene har dette indbygget.

PostgreSQL har pg_trgm bidragsmodul (http://www.postgresql.org/docs/9.0/static/pgtrgm.html), som fungerer som en charme.

Du kan endda simulere dette i MySQL ved hjælp af fuldtekstindeksering, men du skal indsamle ord fra alle dine dokumenter, konvertere dem til ngrams, oprette fuldtekstindekser på dem og hacke dem alle sammen for hurtigt at slå op. Hvilket bringer alle mulige slags problemer med redundans, synkronisering...ikke din tid værd.




  1. Hvordan man vælger baseret på værdien af ​​en anden SELECT

  2. Implementering af Secure Multicloud MySQL-replikering på AWS og GCP med VPN

  3. Hvordan sender jeg værdi til en lagret procedureparameter i OLE DB-kildekomponent?

  4. MYSQL tilføjer ikke info til min database