我正在使用NLTK设计Python中的文本分类器。每个句子中考虑的特征之一就是它的情感。我想对具有正面或负面情绪的句子比没有任何情绪(中性句子)的句子加权。将电影评论语料库与朴素贝叶斯分类器一起使用只会导致正面和负面的标签。我尝试在nltk.sentiment.utils中使用demo_liu_hu_lexicon,但是该函数不返回任何值,而是将其打印到输出中,并且非常慢。有谁知道图书馆根据情感对句子赋予某种权重?
谢谢!
尝试textblob模块:
from textblob import TextBlob text = ''' These laptops are horrible but I've seen worse. How about lunch today? The food was okay. ''' blob = TextBlob(text) for sentence in blob.sentences: print(sentence.sentiment.polarity) # -0.7 # 0.0 # 0.5
它使用nltk库确定极性-这是一种从-1到1的浮动测量方式。中性句子的极性为零。您应该能够直接从nltk获得相同的度量。