HyperLogLog
bruges til at tælle unikke varer. Den kan tælle et stort antal genstande med lidt hukommelse. Den returnerede kardinalitet er dog IKKE nøjagtig, men tilnærmet med en standard error
.
0,81 % er standard error
, IKKE den falske positive. For eksempel kan du ringe til PFCOUNT HLL
for at få det omtrentlige antal unikke elementer, du lægger i HyperLogLog
. Det returnerede tal skal være i området [10000 * (1 - 0.81%), 10000 * (1 + 0.81%)]
.
PFADD
returnerer 1, hvis den estimerede kardinalitet ændres efter udførelse af kommandoen. Det returnerer 0, ellers. Det har intet at gøre med false positive
.
Det ser ud til, at du har brug for et Bloom-filter, som kan fortælle dig, om en vare allerede findes i et datasæt, med falsk positiv. Du kan implementere et Bloom Filter
med Redis, selvfølgelig. Og der burde være et eller andet open source-projekt til det.