词干是标记系统所需要的.我使用美味,我没有时间管理和修剪我的标签.我对我的博客更加小心,但它并不完美.我为嵌入式系统编写软件,如果它们包括词干,它将更加实用(对用户有帮助).
例如:
Parse
Parser
Parsing
对于我所投入的任何系统,所有这些都意味着同样的事情.
理想情况下,某处有一个BSD许可的词干分析器,但如果没有,我在哪里可以学习常见的算法和技术?
除了BSD词干分析器之外,还有哪些其他开源许可的词干分析器?
-亚当
Snowball stemmer(C&Java)我用它的Python绑定,PyStemmer
看看用python编写的nltk工具包.它有一个非常实用的词干器.