我想使用magrittr和dplyr的简洁性来根据其他列中的值在列的子集中的行之间复制单个值.这是一个简单的例子; 我想将这个想法应用于长数据管道中具有多个条件的大型数据集的许多列.
拿数据帧df <- data.frame(a = 1:5, b = 6:10, x = 11:15, y = 16:20)
:
a b x y 1 6 11 16 2 7 12 17 3 8 13 18 4 9 14 19 5 10 15 20
对于那里的行a = 5
,我想替换行中的值x
和y
那里的值b = 7
,给出:
a b x y 1 6 11 16 2 7 12 17 3 8 13 18 4 9 14 19 5 10 12 17
此尝试失败:
foo <- function(x){ifelse(df$a == 5, df[df$b == 7, .(df$x)], x)} df %<>% mutate_each(funs(foo), x, y)
我能得到的最接近的是:
bar <- function(x){ifelse(df$a == 5, df[df$b == 7, "x"], x)} df %<>% mutate_each(funs(bar), x, y)
但这是不正确的,因为它用值取代两个值x
,而不是x
和y
.
感谢您的建议.
你可以使用mutate_each
和replace
:
df %>% mutate_each(funs(replace(., a==5, nth(., which(b==7)))), x, y)
输出:
a b x y 1 1 6 11 16 2 2 7 12 17 3 3 8 13 18 4 4 9 14 19 5 5 10 12 17
或者根据@docendodiscimus的评论,它可以进一步缩短(也可能[
更好which
):
df %>% mutate_each(funs(replace(., a==5, .[b==7])), x, y)
只是提到data.table
解决方案将是:
require(data.table) setDT(df)[a == 5, c("x", "y") := df[b == 7, .SD, .SDcols = c("x", "y")]] > df a b x y 1: 1 6 11 16 2: 2 7 12 17 3: 3 8 13 18 4: 4 9 14 19 5: 5 10 12 17
或者,您也可以使用:
cols <- c("x", "y") setDT(df)[a == 5, (cols) := df[b == 7, .SD, .SDcols = cols]] # or cols <- c("x", "y") setDT(df)[a == 5, (cols) := df[b == 7, cols, with = FALSE]]
如果您的主要要求是在较长的dplyr-pipe中应用该函数,则可以执行类似以下示例的操作:
foo <- function(df, cols = c("x", "y")) { df[df$a == 5, cols] <- df[df$b == 7, cols] df } df %>% ... %>% foo(c("x", "y")) %>% ... # a b x y #1 1 6 11 16 #2 2 7 12 17 #3 3 8 13 18 #4 4 9 14 19 #5 5 10 12 17