9赞

重塑异常数据集

作者：勤奋的瞌睡猪_715 | 2023-09-06 14:36

如何解决《重塑异常数据集》经验，为你挑选了1个好方法。

我遇到了一个不寻常的数据集我需要重塑,但正常的reshape/tidyr包似乎没有办法解决它.虽然可以使用子集和rbind重新整形数据集,但必须有一种更直接的方法来解决此问题.

数据集如下所示:

ID  Item.1  Item.1.Value    Item.2  Item.2.Value    Item.3  Item.3.Value
001     A         3             C         7     
002     B         4             
003     A         2             B         1             F         5
004     C        10             L         3

每次观察包含20次测量的集合中的1-3次测量.此外,相同的测量类型可以出现在不同观察的多个列中.

我需要将其更改为:

ID  Item    Item.Value
001  A      3
001  C      7
002  B      4
003  A      2
003  B      1
003  F      5
004  C      10
004  L      3

我的部分问题是我不知道初始表配置的传统术语.

谢谢!

1> eipi10..：

我不会称之为"不寻常"的数据集,但增加额外复杂程度的事实是,在ID列之后,其余列都是Item-Value对.下面是使用基数reshape和tidyverse函数将数据从"宽"格式重新整形为"长"格式的方法.

为了重现性,这里是我开始使用的数据框:

df = structure(list(ID = c("001", "002", "003", "004"), Item.1 = structure(c(1L, 
2L, 1L, 3L), .Label = c("A", "B", "C"), class = "factor"), Item.1.Value = c(3L, 
4L, 2L, 10L), Item.2 = structure(c(3L, 1L, 2L, 4L), .Label = c("", 
"B", "C", "L"), class = "factor"), Item.2.Value = c(7L, NA, 1L, 
3L), Item.3 = c(NA, NA, "F", NA), Item.3.Value = c(NA, NA, 5L, 
NA)), .Names = c("ID", "Item.1", "Item.1.Value", "Item.2", "Item.2.Value", 
"Item.3", "Item.3.Value"), row.names = c(NA, -4L), class = "data.frame")

基本`reshape`方法

dfr = reshape(df, varying=list(seq(2,ncol(df),2),seq(3,ncol(df),2)), direction="long", 
              idvar="ID", timevar=NULL, v.names=c("Item","Value"))
dfr = dfr[!is.na(dfr$Value),]
dfr = dfr[order(dfr$ID),]

dfr

       ID Item Value
001.1 001    A     3
001.2 001    C     7
002.1 002    B     4
003.1 003    A     2
003.2 003    B     1
003.3 003    F     5
004.1 004    C    10
004.2 004    L     3

`tidyverse` 方法

我不确定这是否是最简洁或最优雅的方式,所以如果你有更好的方法,请告诉我.

library(tidyverse)

dfr = map2_df(seq(2,ncol(df),2), seq(3,ncol(df),2), 
     ~ setNames(df[, c(1,.x,.y)], c("ID","Item","Value"))) %>%
  filter(!is.na(Value)) %>%
  arrange(ID)

   ID Item Value
1 001    A     3
2 001    C     7
3 002    B     4
4 003    A     2
5 003    B     1
6 003    F     5
7 004    C    10
8 004    L     3

推荐阅读

程序员
Indexing是否会使Pandas数据帧更快？

如何解决《Indexing是否会使Pandas数据帧更快？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Swift - 'sharedApplication不可用.' 相反,使用基于视图控制器的解决方案

如何解决《Swift-'sharedApplication不可用.'相反,使用基于视图控制器的解决方案》经验，为你挑选了0个好方法。 ... [详细]
程序员
二元运算符'<'不能应用两个T操作数

如何解决《二元运算符'<'不能应用两个T操作数》经验，为你挑选了1个好方法。 ... [详细]
程序员
AppCompat工具栏未显示

如何解决《AppCompat工具栏未显示》经验，为你挑选了1个好方法。 ... [详细]
程序员
将状态栏添加到JavaFX应用程序的推荐方法是什么？

如何解决《将状态栏添加到JavaFX应用程序的推荐方法是什么？》经验，为你挑选了1个好方法。 ... [详细]
程序员
git:'credential-osxkeychain'不是git命令.看'git --help'

如何解决《git:'credential-osxkeychain'不是git命令.看'git--help'》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在Matplotlib中制作带有一个图例的MxN饼图和删除的y轴标题

如何解决《如何在Matplotlib中制作带有一个图例的MxN饼图和删除的y轴标题》经验，为你挑选了1个好方法。 ... [详细]
程序员
Visual Studio Build Error"csc.exe"退出,代码为-532462766

如何解决《VisualStudioBuildError"csc.exe"退出,代码为-532462766》经验，为你挑选了1个好方法。 ... [详细]
程序员
.net表单身份验证 - 手动设置HttpContext.Current.User在自定义AuthorizeAttribute中不起作用

如何解决《.net表单身份验证-手动设置HttpContext.Current.User在自定义AuthorizeAttribute中不起作用》经验，为你挑选了0个好方法。 ... [详细]
程序员
将标题图像连接到导航栏

如何解决《将标题图像连接到导航栏》经验，为你挑选了1个好方法。 ... [详细]
程序员
画布游戏帧速率下降（30fps），也随机出现卡顿/颠簸

如何解决《画布游戏帧速率下降（30fps），也随机出现卡顿/颠簸》经验，为你挑选了1个好方法。 ... [详细]
程序员
在YARN-Cluster模式下运行时找不到Hive表

如何解决《在YARN-Cluster模式下运行时找不到Hive表》经验，为你挑选了1个好方法。 ... [详细]
程序员
批处理:在Set/p输入中使用Spaces的奇数问题

如何解决《批处理:在Set/p输入中使用Spaces的奇数问题》经验，为你挑选了1个好方法。 ... [详细]
程序员
paint函数无限地重新循环

如何解决《paint函数无限地重新循环》经验，为你挑选了1个好方法。 ... [详细]
程序员
(Rails)何时使用ActiveRecord的.where和.select

如何解决《(Rails)何时使用ActiveRecord的.where和.select》经验，为你挑选了1个好方法。 ... [详细]
程序员
带有多个DBContext的EF 7迁移

如何解决《带有多个DBContext的EF7迁移》经验，为你挑选了1个好方法。 ... [详细]
程序员
将对象正确移动到废纸篓

如何解决《将对象正确移动到废纸篓》经验，为你挑选了1个好方法。 ... [详细]
程序员
node js callback()函数没有定义？

如何解决《nodejscallback()函数没有定义？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Postgresql序列与串行

如何解决《Postgresql序列与串行》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何为PHP CLI启用颜色？

如何解决《如何为PHPCLI启用颜色？》经验，为你挑选了1个好方法。 ... [详细]

勤奋的瞌睡猪_715

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章

重塑异常数据集

基本reshape方法

tidyverse 方法

基本`reshape`方法

`tidyverse` 方法