Jeg bruger en lignende tilgang med sorterede sæt til at implementere fuldtekstindeksering. Den overordnede tilgang er god, selvom der er et par ret simple forbedringer, du kan lave.
- I stedet for at bruge tilfældigt genererede nøgler, kan du bruge forespørgslen (eller en kort form heraf) som nøglen. Det giver dig mulighed for at genbruge de sæt, der allerede er blevet beregnet, hvilket kan forbedre ydeevnen markant, hvis du har forespørgsler på tværs af to store sæt, der almindeligvis kombineres på lignende måder.
- Håndtering af titel som en komplet streng vil resultere i et meget stort antal enkelte medlemssæt. Det kan være bedre at indeksere individuelle ord i titlen og filtrere de endelige resultater for et nøjagtigt match, hvis du virkelig har brug for det.