我在文本文件中有一个10k字的列表,如下所示:
G15 KDN C30A动作标准气刷空气稀释
我正在尝试使用此代码将它们转换为较低的套件令牌,以便使用GenSim进行后续处理:
data = [line.strip() for line in open("C:\corpus\TermList.txt", 'r')] texts = [[word for word in data.lower().split()] for word in data]
我得到以下回调:
AttributeErrorTraceback (most recent call last)in () 1 data = [line.strip() for line in open("C:\corpus\TermList.txt", 'r')] ----> 2 texts = [[word for word in data.lower().split()] for word in data] 3 AttributeError: 'list' object has no attribute 'lower'
关于我做错了什么以及如何纠正它的任何建议将不胜感激!!! 谢谢!!
尝试:
data = [line.strip() for line in open("C:\corpus\TermList.txt", 'r')] texts = [[word.lower() for word in text.split()] for text in data]
您试图将.lower()应用于数据,这是一个列表.
.lower()只能应用于字符串.