如何使用dplyr获取数据表的两列平均值?例如,如果我的数据如下所示:
dt <- data.table(A=1:5, B=c(1,4,NA,6,8))
我想创建一个新列"Avg",它是每行的A列和B列的平均值:
dt %>% mutate(Avg=mean(c(A, B), na.rm=T))
但是这段代码并没有给我正确的结果.这该怎么做?非常感谢你.
如果你想用dplyr实现这个,我建议使用这个函数rowwise()
:
R> library(dplyr) R> dt <- data.table(A=1:5, B=c(1,4,NA,6,8)) R> j <- dt %>% rowwise() %>% mutate(Avg=mean(c(A, B), na.rm=T)) R> j Source: local data frame [5 x 3] Groups:A B Avg (int) (dbl) (dbl) 1 1 1 1.0 2 2 4 3.0 3 3 NA 3.0 4 4 6 5.0 5 5 8 6.5
怎么样
dt %>% mutate(Avg=rowMeans(cbind(A, B), na.rm=T))
mean
没有矢量化.它将所有输入折叠为单个值.如果你制作一个矩阵cbind()
,你可以用rowMeans
它来做.