sql >> Database teknologi >  >> NoSQL >> Redis

Hvad er en god strategi til at gruppere lignende ord?

Tag et kig på "fuzzy matching". Nogle gode værktøjer i tråden nedenfor, der beregner ligheder mellem strenge.

Jeg er især glad for difflib-modulet

>>> get_close_matches('appel', ['ape', 'apple', 'peach', 'puppy'])
['apple', 'ape']
>>> import keyword
>>> get_close_matches('wheel', keyword.kwlist)
['while']
>>> get_close_matches('apple', keyword.kwlist)
[]
>>> get_close_matches('accept', keyword.kwlist)
['except']

https://stackoverflow.com/questions/682367/good-python-modules-for-fuzzy-string-comparison



  1. Spark-on-HBase:DataFrame-baseret HBase-stik

  2. $strLenBytes vs $strLenCP i MongoDB:Hvad er forskellen?

  3. Mongoose -- Force collection navn

  4. Gå i dvale med MongoDB