5赞

使用dplyr创建包含多个分类/因子变量的汇总比例表

作者：小妖694_807 | 2023-09-08 15:22

如何解决《使用dplyr创建包含多个分类/因子变量的汇总比例表》经验，为你挑选了2个好方法。

我正在尝试创建一个表,用另一个变量汇总几个分类变量(使用频率和比例).我想使用dplyr包来做到这一点.

之前的Stack Overflow讨论部分涉及我正在寻找的内容: 使用dplyr的相对频率/比例和计算某个组的相对频率.

使用mtcars数据集,如果我只想查看gear按am类别的比例,这就是输出的样子:

    mtcars %>%
    group_by(am, gear) %>%
    summarise (n = n()) %>%
    mutate(freq = n / sum(n))

    #   am gear  n      freq
    # 1  0    3 15 0.7894737
    # 2  0    4  4 0.2105263
    # 3  1    4  8 0.6153846
    # 4  1    5  5 0.3846154

但是,我实际上不仅要在同一个表中查看gearsby am,还要分别查看carbby am和cylby am.如果我将代码修改为:

    mtcars %>%
    group_by (am, gear, carb, cyl) %>%
    summarise (n = n()) %>%
    mutate(freq = n / sum(n))

我得到的频率的每个组合am,gear,carb,和cyl.这不是我想要的.有没有办法用dplyr做到这一点？

编辑

此外,如果有人知道生成我想要的表的方法,但是am作为列的类别(如经典的2x2表格式),这将是一个额外的好处.这是我所指的一个例子.它来自我之前的一篇出版物.我想在R中生成这个表,这样我就可以使用RMarkdown将它直接输出到word文档:

在此输入图像描述

1> Heroka..：

解决此问题的一种方法是将数据转换为长(呃)格式.然后,您可以使用相同的代码来计算您想要的结果,并使用一个额外的group_by:

library(reshape2)
library(dplyr)

m_mtcars <- melt(mtcars,measure.vars=c("gear","carb","cyl"))

res <- m_mtcars %>%
  group_by(am, variable, value) %>%
  summarise (n = n()) %>%
  mutate(freq = n / sum(n))

在此基础上,可以使用更多重新整形和一些字符串格式化来获得所需的输出

#make an 'export' variable
res$export <- with(res, sprintf("%i (%.1f%%)", n, freq*100))

#reshape again
output <- dcast(variable+value~am, value.var="export", data=res, fill="missing") #use drop=F to prevent silent missings 
#'silent missings'
output$variable <- as.character(output$variable)
#make 'empty lines' 
empties <- data.frame(variable=unique(output$variable), stringsAsFactors=F)
empties[,colnames(output)[-1]] <- ""

#bind them together
output2 <- rbind(empties,output)
output2 <- output2[order(output2$variable,output2$value),]

#optional: 'remove' variable if value present

output2$variable[output2$value!=""] <- ""

这导致:

   variable value          0         1
2      carb                           
7               1  3 (15.8%) 4 (30.8%)
8               2  6 (31.6%) 4 (30.8%)
9               3  3 (15.8%)   missing
10              4  7 (36.8%) 3 (23.1%)
11              6    missing  1 (7.7%)
12              8    missing  1 (7.7%)
3       cyl                           
13              4  3 (15.8%) 8 (61.5%)
14              6  4 (21.1%) 3 (23.1%)
15              8 12 (63.2%) 2 (15.4%)
1      gear                           
4               3 15 (78.9%)   missing
5               4  4 (21.1%) 8 (61.5%)
6               5    missing 5 (38.5%)

2> Gopala..：

使用tidyr/dplyr组合,您可以这样做:

library(tidyr)
library(dplyr)

mtcars %>%
  gather(variable, value, gear, carb, cyl) %>%
  group_by(am, variable, value) %>%
  summarise (n = n()) %>%
  mutate(freq = n / sum(n))

推荐阅读

程序员
如何在Symfony2中使用Beip与Liip\FunctionalTestBundle？

如何解决《如何在Symfony2中使用Beip与Liip\FunctionalTestBundle？》经验，为你挑选了0个好方法。 ... [详细]
程序员
在transformClassesWithDexForDebug上Gradle构建缓慢

如何解决《在transformClassesWithDexForDebug上Gradle构建缓慢》经验，为你挑选了4个好方法。 ... [详细]
程序员
Java代理 - 无法正确地从HTTP GET/POST请求交换数据

如何解决《Java代理-无法正确地从HTTPGET/POST请求交换数据》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在Django 1.9中传递callable

如何解决《如何在Django1.9中传递callable》经验，为你挑选了1个好方法。 ... [详细]
程序员
谷歌地理编码api不如使用地址的谷歌地图准确

如何解决《谷歌地理编码api不如使用地址的谷歌地图准确》经验，为你挑选了0个好方法。 ... [详细]
程序员
以数组形式访问返回的值

如何解决《以数组形式访问返回的值》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么AppDelegate.swift窗口是可选的？

如何解决《为什么AppDelegate.swift窗口是可选的？》经验，为你挑选了2个好方法。 ... [详细]
程序员
Webpack错误 - 无法解析文件或目录

如何解决《Webpack错误-无法解析文件或目录》经验，为你挑选了1个好方法。 ... [详细]
程序员
指定的LocalDB实例不存在

如何解决《指定的LocalDB实例不存在》经验，为你挑选了0个好方法。 ... [详细]
程序员
Q_OBJECT和moc进行继承

如何解决《Q_OBJECT和moc进行继承》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在目录中的所有文件中搜索字符串？我出现了内存异常

如何解决《如何在目录中的所有文件中搜索字符串？我出现了内存异常》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Swift中讨论,将来会有新的声明语法吗？

如何解决《在Swift中讨论,将来会有新的声明语法吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法从iframe中找到FileHiddenName

如何解决《无法从iframe中找到FileHiddenName》经验，为你挑选了1个好方法。 ... [详细]
程序员
错误:当我尝试创建签名APK时,可疑命名空间和前缀组合[NamespaceTypo]

如何解决《错误:当我尝试创建签名APK时,可疑命名空间和前缀组合[NamespaceTypo]》经验，为你挑选了2个好方法。 ... [详细]
程序员
推断Pandas DataFrame

如何解决《推断PandasDataFrame》经验，为你挑选了1个好方法。 ... [详细]
程序员
Facebook应用程序是否有通用URI方案,适用于所有移动设备？

如何解决《Facebook应用程序是否有通用URI方案,适用于所有移动设备？》经验，为你挑选了0个好方法。 ... [详细]
程序员
铁路支付通过payumoney

如何解决《铁路支付通过payumoney》经验，为你挑选了0个好方法。 ... [详细]
程序员
Java获取下一个枚举值或从第一个开始

如何解决《Java获取下一个枚举值或从第一个开始》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用cmp在Python中排序()

如何解决《使用cmp在Python中排序()》经验，为你挑选了1个好方法。 ... [详细]
程序员
X不是Y的成员类型

如何解决《X不是Y的成员类型》经验，为你挑选了2个好方法。 ... [详细]

小妖694_807

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章