看来,进行基本情感分析的最简单,最天真的方法是使用贝叶斯分类器(通过我在SO上找到的内容证实).有任何反驳或其他建议吗?
带有一袋单词表示的贝叶斯分类器是最简单的统计方法.通过转向更高级的分类器和要素表示,您可以获得更好的结果,代价是更复杂.
统计方法不是城里唯一的游戏.更加了解文本结构的基于规则的方法是另一个主要选择.从我所看到的,这些实际上并不像统计方法那样好.
我推荐Manning和Schütze的统计自然语言处理基础第16章,文本分类.
我想不出更简单,更天真的方式来做情感分析,但你可能会考虑使用支持向量机而不是朴素贝叶斯(在一些机器学习工具包中,这可以是替代品).看看Bo Pang,Lillian Lee和Shivakumar Vaithyanathan撰写的"竖起大拇指?使用机器学习技术的情感分类",这是关于这些技术的最早的论文之一,并提供了一系列相关技术的准确结果表,从客户的角度来看,没有任何一个比任何其他更复杂.