11赞

将文本数据存储在熊猫框架中，如何使用sklearn实现简单分类

作者：LEEstarmmmmm | 2023-09-10 01:39

如何解决《将文本数据存储在熊猫框架中，如何使用sklearn实现简单分类》经验，为你挑选了1个好方法。

我有一个框架，在A列中存储文本评论，在B列中存储评分（1到5）。

id .....review ..............rating          
1  .....That was awful ......1...

例如，我需要基于word：occurrances词汇表等功能创建一个简单的（基于算法的）分类器，该分类器可以预测等级> 3或<3（假设如果等级> 3和0，如果<）

我不擅长Python和机器学习，因此我被Google搜索的所有示例所困扰。

请解释一下如何在该示例案例中提取特征，如何训练模型等等，或者为该案例提供出色的导师（我无法将sklearn导师转换为我的案例）。

1> Bunny_Ross..：

您可以在scikit中非常轻松地执行此操作。

假设您有X和y数据：

X = ['the food was really delicious', 'the food was really terrible']
y = [5,2]

使用，CountVectorizer您可以将数据转换为2行代码中的数字：

from sklearn.feature_extraction.text import CountVectorizer
x_data = CountVectorizer().fit_transform(X)

这会将您的数据完全转换为计数，然后可以将其输入所需的任何算法中：

from sklearn.neighbors import KNeighbors
clf = KNeighbors().fit(x_data, y)

推荐阅读

程序员
类的超类不匹配

如何解决《类的超类不匹配》经验，为你挑选了1个好方法。 ... [详细]
程序员
在本地范围内重新定义typedef

如何解决《在本地范围内重新定义typedef》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何拦截提交按钮点击？

如何解决《如何拦截提交按钮点击？》经验，为你挑选了1个好方法。 ... [详细]
程序员
模拟设备背光对人类图像感知的影响

如何解决《模拟设备背光对人类图像感知的影响》经验，为你挑选了0个好方法。 ... [详细]
程序员
"哎呀,发生错误!代码:201601301501048 .."在TYPO3 7.6中

如何解决《"哎呀,发生错误!代码:201601301501048.."在TYPO37.6中》经验，为你挑选了2个好方法。 ... [详细]
程序员
Android - 删除主页和导航按钮

如何解决《Android-删除主页和导航按钮》经验，为你挑选了0个好方法。 ... [详细]
程序员
OrientDB如何在一个查询中获取顶点及其边的结果集

如何解决《OrientDB如何在一个查询中获取顶点及其边的结果集》经验，为你挑选了1个好方法。 ... [详细]
程序员
启动Jboss Wildfly 9.02服务器时出现并发超时异常

如何解决《启动JbossWildfly9.02服务器时出现并发超时异常》经验，为你挑选了2个好方法。 ... [详细]
程序员
在Iex中是否有默认启用千位分组(100_000)的Switch

如何解决《在Iex中是否有默认启用千位分组(100_000)的Switch》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何调整SVG剪辑路径的大小？

如何解决《如何调整SVG剪辑路径的大小？》经验，为你挑选了0个好方法。 ... [详细]
程序员
pandas - 按列名掩盖数据帧

如何解决《pandas-按列名掩盖数据帧》经验，为你挑选了1个好方法。 ... [详细]
程序员
比较传递null int String和Integer构造函数

如何解决《比较传递nullintString和Integer构造函数》经验，为你挑选了2个好方法。 ... [详细]
程序员
QString - 嵌入16位的UTF8？

如何解决《QString-嵌入16位的UTF8？》经验，为你挑选了0个好方法。 ... [详细]
程序员
滑动效果像inshorts新闻应用程序

如何解决《滑动效果像inshorts新闻应用程序》经验，为你挑选了1个好方法。 ... [详细]
程序员
AngularJS - 在私有函数中使用'this'

如何解决《AngularJS-在私有函数中使用'this'》经验，为你挑选了1个好方法。 ... [详细]
程序员
隐藏另一个布局的浮动操作按钮

如何解决《隐藏另一个布局的浮动操作按钮》经验，为你挑选了1个好方法。 ... [详细]
程序员
从ec2 Linux AMI连接到RDS MySQL实例-找不到mysql命令

如何解决《从ec2LinuxAMI连接到RDSMySQL实例-找不到mysql命令》经验，为你挑选了0个好方法。 ... [详细]
程序员
以编程方式重启app？

如何解决《以编程方式重启app？》经验，为你挑选了1个好方法。 ... [详细]
程序员
AWS是否支持RDS Insance的自动扩展

如何解决《AWS是否支持RDSInsance的自动扩展》经验，为你挑选了2个好方法。 ... [详细]
程序员
用于HTTP通信的出站通道适配器与出站网关

如何解决《用于HTTP通信的出站通道适配器与出站网关》经验，为你挑选了1个好方法。 ... [详细]

LEEstarmmmmm

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章