Lucene对俄语的支持很差.
RussianAnalyzer(lucene-contrib的一部分)质量很差.
用于Snowball的RussianStemmer模块更糟糕.它不能识别Unicode字符串中的俄语文本,显然假设必须使用Unicode和KOI8-R的某些奇怪组合.
你知道更好的解决方案吗?