20赞

分组聚集与dplyr,tidyr,purrr

作者：Chloemw | 2023-09-06 13:20

如何解决《分组聚集与dplyr,tidyr,purrr》经验，为你挑选了1个好方法。

我正在尝试收集两个不同变量的数据,每个变量分布在几个列上,并由另外两个变量分组.这是问题所在.我有几个基因,几个样本.每个样本具有三种不同的可能基因型,每种基因型具有相关的频率.我想整理这个以获得基因,样本,基因型,频率的单一列.

我有一个hackjob解决方案,涉及创建listcolumns,传播它们,然后使用purrr :: map函数提取列.它很丑陋,不是真正的可扩展性,频率在转换回数字之前转换为字符,不理想.

有没有更好的方法来解决这个问题？

library(tidyverse) 
# or, separately load dplyr, tibble, tidyr, purrr

# Here's what I have
have <- data_frame(gene=rep(c("gX", "gY"), each=2),
                   sample=rep(c("s1", "s2"), 2),
                   genotype1=c("AA", "AA", "GG", "GG"),
                   genotype2=c("AC", "AC", "GT", "GT"),
                   genotype3=c("CC", "CC", "TT", "TT"),
                   freq1=c(.8,.9, .7, .6),
                   freq2=c(.15,.1, .2, .35),
                   freq3=c(.05,0, .1, .05))
have
#> # A tibble: 4 × 8
#>    gene sample genotype1 genotype2 genotype3 freq1 freq2 freq3
#>                       
#> 1    gX     s1        AA        AC        CC   0.8  0.15  0.05
#> 2    gX     s2        AA        AC        CC   0.9  0.10  0.00
#> 3    gY     s1        GG        GT        TT   0.7  0.20  0.10
#> 4    gY     s2        GG        GT        TT   0.6  0.35  0.05







# Here's what I want. 
# Do a multicolumn gather grouped by gene and sample
want <- have %>%
  group_by(gene, sample) %>%
  summarize(x1=list(c(genotype=genotype1, freq=freq1)),
            x2=list(c(genotype=genotype2, freq=freq2)),
            x3=list(c(genotype=genotype3, freq=freq3))) %>%
  ungroup() %>%
  gather(key, value, x1, x2, x3) %>%
  mutate(genotype=map_chr(value, "genotype"),
         freq=map_chr(value, "freq") %>% as.numeric) %>%
  select(-key, -value) %>%
  arrange(gene, sample, genotype)
want
#> # A tibble: 12 × 4
#>     gene sample genotype  freq
#>           
#> 1     gX     s1       AA  0.80
#> 2     gX     s1       AC  0.15
#> 3     gX     s1       CC  0.05
#> 4     gX     s2       AA  0.90
#> 5     gX     s2       AC  0.10
#> 6     gX     s2       CC  0.00
#> 7     gY     s1       GG  0.70
#> 8     gY     s1       GT  0.20
#> 9     gY     s1       TT  0.10
#> 10    gY     s2       GG  0.60
#> 11    gY     s2       GT  0.35
#> 12    gY     s2       TT  0.05

    
  




  
  
  

    

      

        Daniel..
         6
      
      
你可以使用to_long()从sjmisc包,这一次收集多个列:

to_long(have, keys = "genos", values = c("genotype", "freq"),
       c("genotype1", "genotype2", "genotype3"),
       c("freq1", "freq2", "freq3"))

##  A tibble: 12 × 5
##     gene sample     genos genotype  freq
##                
## 1     gX     s1 genotype1       AA  0.80
## 2     gX     s2 genotype1       AA  0.90
## 3     gY     s1 genotype1       GG  0.70
## 4     gY     s2 genotype1       GG  0.60
## 5     gX     s1 genotype2       AC  0.15
## 6     gX     s2 genotype2       AC  0.10
## 7     gY     s1 genotype2       GT  0.20
## 8     gY     s2 genotype2       GT  0.35
## 9     gX     s1 genotype3       CC  0.05
## 10    gX     s2 genotype3       CC  0.00
## 11    gY     s1 genotype3       TT  0.10
## 12    gY     s2 genotype3       TT  0.05


to_long() 需要键值和值列的名称,然后是每个应该收集的向量的多个列名.


1> Daniel..：
你可以使用to_long()从sjmisc包,这一次收集多个列:

to_long(have, keys = "genos", values = c("genotype", "freq"),
       c("genotype1", "genotype2", "genotype3"),
       c("freq1", "freq2", "freq3"))

##  A tibble: 12 × 5
##     gene sample     genos genotype  freq
##                
## 1     gX     s1 genotype1       AA  0.80
## 2     gX     s2 genotype1       AA  0.90
## 3     gY     s1 genotype1       GG  0.70
## 4     gY     s2 genotype1       GG  0.60
## 5     gX     s1 genotype2       AC  0.15
## 6     gX     s2 genotype2       AC  0.10
## 7     gY     s1 genotype2       GT  0.20
## 8     gY     s2 genotype2       GT  0.35
## 9     gX     s1 genotype3       CC  0.05
## 10    gX     s2 genotype3       CC  0.00
## 11    gY     s1 genotype3       TT  0.10
## 12    gY     s2 genotype3       TT  0.05


to_long() 需要键值和值列的名称,然后是每个应该收集的向量的多个列名.



    

    

    
        推荐阅读
        
            
                                
                    
                        程序员
                        无法读取非ASCII内容
                    

                    
                                                
                        如何解决《无法读取非ASCII内容》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        转移/减少java杯中的冲突 - 悬空其他问题
                    

                    
                                                
                        如何解决《转移/减少java杯中的冲突-悬空其他问题》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        什么是cp:在Unix中无法统计错误,我在尝试将东西从一个文件夹复制到另一个文件夹时出现此错误
                    

                    
                                                
                        如何解决《什么是cp:在Unix中无法统计错误,我在尝试将东西从一个文件夹复制到另一个文件夹时出现此错误》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何将参数传递给Dockerfile？
                    

                    
                                                
                        如何解决《如何将参数传递给Dockerfile？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何在分类机器学习算法中发现新类？
                    

                    
                                                
                        如何解决《如何在分类机器学习算法中发现新类？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何检查re.sub()是否已在python中成功替换？
                    

                    
                                                
                        如何解决《如何检查re.sub()是否已在python中成功替换？》经验，为你挑选了2个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何最小化来自imageView TVOS Focus CollectionView Swift的阴影
                    

                    
                                                
                        如何解决《如何最小化来自imageViewTVOSFocusCollectionViewSwift的阴影》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        IllegalArgumentException:不支持addAccount
                    

                    
                                                
                        如何解决《IllegalArgumentException:不支持addAccount》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何检查字符串的最后一个字符是否等于Swift中的"a"
                    

                    
                                                
                        如何解决《如何检查字符串的最后一个字符是否等于Swift中的"a"》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        字符/数字的乘法可以更高效吗？
                    

                    
                                                
                        如何解决《字符/数字的乘法可以更高效吗？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        Jetty Websockets-应该如何使用sendPing和sendPong？
                    

                    
                                                
                        如何解决《JettyWebsockets-应该如何使用sendPing和sendPong？》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        Graphicsmagick C++ API
                    

                    
                                                
                        如何解决《GraphicsmagickC++API》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        用Angular设置Express
                    

                    
                                                
                        如何解决《用Angular设置Express》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        (Jade或Slim)类似于React的语法？
                    

                    
                                                
                        如何解决《(Jade或Slim)类似于React的语法？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        在Selenium Opera Webdriver中启用Opera Turbo
                    

                    
                                                
                        如何解决《在SeleniumOperaWebdriver中启用OperaTurbo》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        有没有办法让Delphi VCL表格大小而不改变BorderStyle？
                    

                    
                                                
                        如何解决《有没有办法让DelphiVCL表格大小而不改变BorderStyle？》经验，为你挑选了2个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        RxJava：观察套接字发出的消息
                    

                    
                                                
                        如何解决《RxJava：观察套接字发出的消息》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        SBT目录结构.什么是"项目"？
                    

                    
                                                
                        如何解决《SBT目录结构.什么是"项目"？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        谷歌地图有角度
                    

                    
                                                
                        如何解决《谷歌地图有角度》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        了解R中的P值-轻松
                    

                    
                                                
                        如何解决《了解R中的P值-轻松》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                

            
        
    

    
        吐了个 "CAO" !
        
            
                吐个槽吧,看都看了
            
            
                
                                        会员登录 | 用户注册
























    

    
        
            
            
                
                    
                
            

            
                Chloemw            

            
                这个屌丝很懒，什么也没留下！            
            
            

                                
                    
                    关注作者
                            

        
    


    
        Tags | 热门标签
        
            
                                
                    actionscrip
                
                                
                    bash
                
                                
                    c#
                
                                
                    c++
                
                                
                    c语言
                
                                
                    erlang
                
                                
                    flutter
                
                                
                    go
                
                                
                    golang
                
                                
                    java
                
                                
                    javascript
                
                                
                    lua
                
                                
                    node.js
                
                                
                    perl
                
                                
                    php
                
                                
                    python
                
                                
                    scala
                
                                
                    typescript
                
                                
            
        
    


    
        RankList | 热门文章
        
            
                                
                    1使用imageMapster调整响应式图像映射:我是否误解了scaleMap的作用？
                
                                
                    2在Oracle SQL中将xpath值选择为单独的行
                
                                
                    3TFS将两个变更集合并到同一分支中
                
                                
                    4"使用PDO和MS SQL,活动结果不包含任何字段"
                
                                
                    5我想在div onClick函数中为图像禁用onClick事件？
                
                                
                    6使用ORDER BY更新
                
                                
                    7更改文件夹中文件的文件扩展名？
                
                                
                    8在C++中定义具有相同签名的两个函数
                
                                
                    9bcrypt和随机生成的盐
                
                                
                    10NSNetworkManager.ResolveListener消息Android
                
                                
                    11如何在不弄乱布局的情况下为div添加边框？
                
                                
                    12为什么我们不能在java中用"this"关键字创建一个对象？
                
                                
                    13ViewDoesNotExist即使它确实存在
                
                                
                    14Chrome与这个JS崩溃了
                
                                
                    15不推荐使用<td>宽度,如何设置一行中单个单元格的宽度？
                
                                
                    16Java静态变量变为null
                
                                
                    17将调试视图与Windows服务一起使用
                
                                
                    18内联类构造函数,以避免vc内存崩溃
                
                                
                    19如何处理两个重叠的Twitter Bootstrap模式
                
                                
                    20Android:使用服务,对话框等片段的预期用途