在R中随机抽样数据帧为3组

作者：重庆制造漫画社 | 2023-09-11 13:30

如何解决《在R中随机抽样数据帧为3组》经验，为你挑选了1个好方法。

目标:将数据帧随机分成3个样本.

一个样本有60%的行

其他两个样本有20%的行

样品不应与其他样品重复(即样品无需更换).

这是一个笨重的解决方案:

allrows <- 1:nrow(mtcars)

set.seed(7)
trainrows <- sample(allrows, replace = F, size = 0.6*length(allrows))
test_cvrows <- allrows[-trainrows]
testrows <- sample(test_cvrows, replace=F, size = 0.5*length(test_cvrows))
cvrows <- test_cvrows[-which(test_cvrows %in% testrows)]

train <- mtcars[trainrows,]
test <- mtcars[testrows,]
cvr <- mtcars[cvrows,]

必须有一些更容易的东西,也许在一个包中. dplyr有sample_frac功能,但似乎针对单个样本,而不是分成多个.

关闭,但不是这个问题的答案: R中有多个概率的随机样本

1> Ben Bolker..：

你需要分区准确吗？如果不,

set.seed(7)
ss <- sample(1:3,size=nrow(mtcars),replace=TRUE,prob=c(0.6,0.2,0.2))
train <- mtcars[ss==1,]
test <- mtcars[ss==2,]
cvr <- mtcars[ss==3,]

应该这样做.

或者,正如@Frank在评论中所说,您可以split()将原始数据保留为列表的元素:

mycars <- setNames(split(mtcars,ss), c("train","test","cvr"))

我会用'split`不输"的轨道EM`mycars = setNames(分割(mtcars,SS),C( "火车", "测试", "CVR"))`

推荐阅读

程序员
更有效的方法来编写这个算法？

如何解决《更有效的方法来编写这个算法？》经验，为你挑选了3个好方法。 ... [详细]
程序员
Java toString()没有打印正确的变量

如何解决《JavatoString()没有打印正确的变量》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么这个循环被认为是数据竞争[Golang]

如何解决《为什么这个循环被认为是数据竞争[Golang]》经验，为你挑选了1个好方法。 ... [详细]
程序员
我试图创建新的JDBC资源时,在glassfish中类java.lang.RuntimeException

如何解决《我试图创建新的JDBC资源时,在glassfish中类java.lang.RuntimeException》经验，为你挑选了1个好方法。 ... [详细]
程序员
从逗号分隔的字符串中获取特定值

如何解决《从逗号分隔的字符串中获取特定值》经验，为你挑选了1个好方法。 ... [详细]
程序员
在C中反转字符串的最快方法

如何解决《在C中反转字符串的最快方法》经验，为你挑选了1个好方法。 ... [详细]
程序员
谷歌图片搜索说api不再可用

如何解决《谷歌图片搜索说api不再可用》经验，为你挑选了3个好方法。 ... [详细]
程序员
在Django 1.8中创建基于登录和注销类的视图

如何解决《在Django1.8中创建基于登录和注销类的视图》经验，为你挑选了1个好方法。 ... [详细]
程序员
指向函数成员的指针:`R(*C ::*)(Args ...)`是什么意思？

如何解决《指向函数成员的指针:`R(*C::*)(Args)`是什么意思？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android中的视频编辑API

如何解决《Android中的视频编辑API》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何从源本地构建和安装Puppet模块？

如何解决《如何从源本地构建和安装Puppet模块？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Lucene按分数排序然后修改日期

如何解决《Lucene按分数排序然后修改日期》经验，为你挑选了1个好方法。 ... [详细]
程序员
xcode使用了错误的node.js版本

如何解决《xcode使用了错误的node.js版本》经验，为你挑选了3个好方法。 ... [详细]
程序员
有条件地删除Matplotlib饼图中的标签

如何解决《有条件地删除Matplotlib饼图中的标签》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用快速/ multer时更改文件名

如何解决《使用快速/multer时更改文件名》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么我从"Haskell中的函数编程"一书中复制的haskell代码无法成功解释？

如何解决《为什么我从"Haskell中的函数编程"一书中复制的haskell代码无法成功解释？》经验，为你挑选了1个好方法。 ... [详细]
程序员
SparkError:XXXX任务的序列化结果总大小(2.0 GB)大于spark.driver.maxResultSize(2.0 GB)

如何解决《SparkError:XXXX任务的序列化结果总大小(2.0GB)大于spark.driver.maxResultSize(2.0GB)》经验，为你挑选了0个好方法。 ... [详细]
程序员
Android SDK Manager不会下载软件包

如何解决《AndroidSDKManager不会下载软件包》经验，为你挑选了1个好方法。 ... [详细]
程序员
克隆卡在检查源上

如何解决《克隆卡在检查源上》经验，为你挑选了1个好方法。 ... [详细]
程序员
服务工作者额外打电话

如何解决《服务工作者额外打电话》经验，为你挑选了1个好方法。 ... [详细]

重庆制造漫画社

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章