当前位置:  开发笔记 > 编程语言 > 正文

R中的条件数据帧突变与magrittr和dplyr

如何解决《R中的条件数据帧突变与magrittr和dplyr》经验,为你挑选了3个好方法。

我想使用magrittr和dplyr的简洁性来根据其他列中的值在列的子集中的行之间复制单个值.这是一个简单的例子; 我想将这个想法应用于长数据管道中具有多个条件的大型数据集的许多列.

拿数据帧df <- data.frame(a = 1:5, b = 6:10, x = 11:15, y = 16:20):

a   b   x   y

1   6   11  16
2   7   12  17
3   8   13  18
4   9   14  19
5   10  15  20

对于那里的行a = 5,我想替换行中的值xy那里的值b = 7,给出:

a   b   x   y

1   6   11  16
2   7   12  17
3   8   13  18
4   9   14  19
5   10  12  17

此尝试失败:

foo <- function(x){ifelse(df$a == 5, df[df$b == 7, .(df$x)], x)}
df %<>%  mutate_each(funs(foo), x, y)

我能得到的最接近的是:

bar <- function(x){ifelse(df$a == 5, df[df$b == 7, "x"], x)}
df %<>%  mutate_each(funs(bar), x, y)

但这是不正确的,因为它用值取代两个值x,而不是xy.

感谢您的建议.



1> LyzandeR..:

你可以使用mutate_eachreplace:

df %>% mutate_each(funs(replace(., a==5, nth(., which(b==7)))), x, y)

输出:

  a  b  x  y
1 1  6 11 16
2 2  7 12 17
3 3  8 13 18
4 4  9 14 19
5 5 10 12 17

或者根据@docendodiscimus的评论,它可以进一步缩短(也可能[更好which):

df %>% mutate_each(funs(replace(., a==5, .[b==7])), x, y)


谢谢,但我想将此方法应用于可能在其他地方定义的大量列,因此这将很快变得难以处理.

2> Rentrop..:

只是提到data.table解决方案将是:

require(data.table)
setDT(df)[a == 5, c("x", "y") := df[b == 7, .SD, .SDcols = c("x", "y")]]

> df
   a  b  x  y
1: 1  6 11 16
2: 2  7 12 17
3: 3  8 13 18
4: 4  9 14 19
5: 5 10 12 17

或者,您也可以使用:

cols <- c("x", "y")
setDT(df)[a == 5, (cols) := df[b == 7, .SD, .SDcols = cols]]
# or 
cols <- c("x", "y")
setDT(df)[a == 5, (cols) := df[b == 7, cols, with = FALSE]]


`DT < - setDT(df)`几乎没有意义......因为`df`现在也是一个data.table并且已经通过引用更新了.
我冒昧地改善了你的答案.希望你不介意.

3> talat..:

如果您的主要要求是在较长的dplyr-pipe中应用该函数,则可以执行类似以下示例的操作:

foo <- function(df, cols = c("x", "y")) {
  df[df$a == 5, cols] <- df[df$b == 7, cols]
  df
}

df %>% ... %>% foo(c("x", "y")) %>% ... 
#  a  b  x  y
#1 1  6 11 16
#2 2  7 12 17
#3 3  8 13 18
#4 4  9 14 19
#5 5 10 12 17

推荐阅读
放ch养奶牛
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有