Python Pandas 如何shuffle（打乱）数据

作者：大大炮 | 2022-12-26 18:21

这篇文章主要介绍了PythonPandas如何shuffle（打乱）数据，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧

在Python里面，使用Pandas里面的DataFrame来存放数据的时候想要把数据集进行shuffle会许多的方法，本文介绍两种比较常用而且简单的方法。

应用情景：

我们有下面以个DataFrame

我们可以看到BuyInter的数值是按照0,-1,-1,2,2,2,3,3,3,3这样排列的，我们希望不保持这个次序，但是同时列属性又不能改变，即如下效果：

实现方法：

最简单的方法就是采用pandas中自带的 sample这个方法。

假设df是这个DataFrame

df.sample(frac=1)

这样对可以对df进行shuffle。其中参数frac是要返回的比例，比如df中有10行数据，我只想返回其中的30%,那么frac=0.3。

有时候，我们可能需要打混后数据集的index（索引）还是按照正常的排序。我们只需要这样操作

df.sample(frac=1).reset_index(drop=True)

-------------------------------------分割线--------------------------------------------------------------

其实，sklearn(机器学习的库）中也有shuffle的方法。

from sklearn.utils import shuffle
df = shuffle(df)

另外，numpy库中也有进行shuffle的方法（不建议）

df.iloc[np.random.permutation(len(df))]

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持。

推荐阅读

程序员
如何将键盘按键连接到操作

如何解决《如何将键盘按键连接到操作》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么要用QT编译OpenCV？

如何解决《为什么要用QT编译OpenCV？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如果我使用hashMap.values().remove()从HashMap中删除一个值,它会从地图中删除完整的键/值记录吗？

如何解决《如果我使用hashMap.values().remove()从HashMap中删除一个值,它会从地图中删除完整的键/值记录吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Fortran的参数语句是否类似于C/C++的#define语句？

如何解决《Fortran的参数语句是否类似于C/C++的#define语句？》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何在android中的视图上方添加阴影

如何解决《如何在android中的视图上方添加阴影》经验，为你挑选了2个好方法。 ... [详细]
程序员
比较Go中的指针

如何解决《比较Go中的指针》经验，为你挑选了1个好方法。 ... [详细]
程序员
将Google地图徽标移到底部的自定义界面上方.JavaScript的

如何解决《将Google地图徽标移到底部的自定义界面上方.JavaScript的》经验，为你挑选了0个好方法。 ... [详细]
程序员
对于类似于GIS细化算法(egrthin,GRASS GIS)的栅格对象,R中是否存在细化或骨架化算法？

如何解决《对于类似于GIS细化算法(egrthin,GRASSGIS)的栅格对象,R中是否存在细化或骨架化算法？》经验，为你挑选了0个好方法。 ... [详细]
程序员
AttributeError:'module'对象没有属性'MutableMapping'

如何解决《AttributeError:'module'对象没有属性'MutableMapping'》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java integer ++我没有改变这个值

如何解决《Javainteger++我没有改变这个值》经验，为你挑选了4个好方法。 ... [详细]
程序员
Travis报告了Gemfile.lock损坏的奇怪消息

如何解决《Travis报告了Gemfile.lock损坏的奇怪消息》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何测试我的.Net客户端使用的TLS版本

如何解决《如何测试我的.Net客户端使用的TLS版本》经验，为你挑选了3个好方法。 ... [详细]
程序员
如何在Visual Studio Intellisense中记录JavaScript配置对象

如何解决《如何在VisualStudioIntellisense中记录JavaScript配置对象》经验，为你挑选了1个好方法。 ... [详细]
程序员
C递归不会递归

如何解决《C递归不会递归》经验，为你挑选了1个好方法。 ... [详细]
程序员
静态constexpr变量的自我初始化是否格式良好？

如何解决《静态constexpr变量的自我初始化是否格式良好？》经验，为你挑选了1个好方法。 ... [详细]
程序员
iOS以编程方式取消TouchID身份验证对话框

如何解决《iOS以编程方式取消TouchID身份验证对话框》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么对同一函数的两个绑定返回不同的值

如何解决《为什么对同一函数的两个绑定返回不同的值》经验，为你挑选了0个好方法。 ... [详细]
程序员
简单的HttpURLConnection POST文件multipart/form-data从android到google blobstore

如何解决《简单的HttpURLConnectionPOST文件multipart/form-data从android到googleblobstore》经验，为你挑选了3个好方法。 ... [详细]
程序员
如果没有运行测试,如何使Jenkins构建失败？

如何解决《如果没有运行测试,如何使Jenkins构建失败？》经验，为你挑选了0个好方法。 ... [详细]
程序员
从专业课程中获取ClassTag

如何解决《从专业课程中获取ClassTag》经验，为你挑选了1个好方法。 ... [详细]

大大炮

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章