Jeg ville bruge Apache Solr . Jeg tror, det er mere fleksibelt end Sphinx. Solr understøtter fuldtekstsøgning, og jeg tror, at der er tilføjelser til semantisk understøttelse (såsom siren ). Solr er den serveriserede version af Lucene.
Solr understøtter et SynonymFilter:http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters#SynonymFilter
Dette indlæg diskuterer nogle strategier til optimering af indholdshentning http://www.lucidimagination.com/devzone/technical-articles/optimizing-findability-lucene-and-solr