如何将因子的数据帧转换为数字？

作者：135369一生真爱_890 | 2023-09-08 17:26

如何解决《如何将因子的数据帧转换为数字？》经验，为你挑选了3个好方法。

我有一个包含所有因子值的数据框

V1 V2 V3
 a  b  c
 c  b  a
 c  b  c
 b  b  a

如何将数据框中的所有值转换为具有数值的新值(a到1,b到2,c到3等等)

1> A5C1D2H2I1M1..：

我会尝试:

> mydf[] <- as.numeric(factor(as.matrix(mydf)))
> mydf
  V1 V2 V3
1  1  2  3
2  3  2  1
3  3  2  3
4  2  2  1

2> akrun..：

转换factor为numeric给出整数值.但是,如果factor列的级别指定为c('b', 'a', 'c', 'd')或c('c', 'b', 'a'),则整数值将按此顺序排列.为了避免这种情况,我们可以levels通过factor再次调用来指定(更安全)

df1[] <- lapply(df1, function(x) 
                as.numeric(factor(x, levels=letters[1:3])))

如果我们使用data.table,一种选择是使用set.对于大型数据集,它会更有效.转换为matrix可能会造成内存问题.

library(data.table)
setDT(df1)
for(j in seq_along(df1)){
 set(df1, i=NULL, j=j, 
     value= as.numeric(factor(df1[[j]], levels= letters[1:3])))
 }

3> Rich Scriven..：

这种方法与Ananda相似,但使用的是unlist()代替factor(as.matrix()).由于您的所有列都已经是因子,unlist()因此将它们组合成具有适当级别的一个因子向量.

那么让我们来看看我们unlist()的数据框架会发生什么.

unlist(df, use.names = FALSE)
#  [1] a c c b b b b b c a c a
# Levels: a b c

现在我们可以简单地运行as.integer()(或c())上面的代码,因为因子的整数值与您想要的映射匹配.因此,以下内容将重新评估您的整个数据框架.

df[] <- as.integer(unlist(df, use.names = FALSE))
## note that you can also just drop the factor class with c()
## df[] <- c(unlist(df, use.names = FALSE))
df
#   V1 V2 V3
# 1  1  2  3
# 2  3  2  1
# 3  3  2  3
# 4  2  2  1

注意: use.names = FALSE没有必要.但是,删除names属性将使此过程更有效.

数据:

df <- structure(list(V1 = structure(c(1L, 3L, 3L, 2L), .Label = c("a", 
"b", "c"), class = "factor"), V2 = structure(c(1L, 1L, 1L, 1L
), .Label = "b", class = "factor"), V3 = structure(c(2L, 1L, 
2L, 1L), .Label = c("a", "c"), class = "factor")), .Names = c("V1", 
"V2", "V3"), class = "data.frame", row.names = c(NA, -4L))

推荐阅读

程序员
比较数组对象是否相等

如何解决《比较数组对象是否相等》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Python Pandas中连接大量CSV文件(30,000)

如何解决《在PythonPandas中连接大量CSV文件(30,000)》经验，为你挑选了1个好方法。 ... [详细]
程序员
在"if"中遇到"return"时不返回值的方法

如何解决《在"if"中遇到"return"时不返回值的方法》经验，为你挑选了1个好方法。 ... [详细]
程序员
NoReverseMatch Django教程1.8第4章

如何解决《NoReverseMatchDjango教程1.8第4章》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在按钮内居中对齐离子图标？

如何解决《如何在按钮内居中对齐离子图标？》经验，为你挑选了1个好方法。 ... [详细]
程序员
将大量自定义数据添加到jpg图像文件中

如何解决《将大量自定义数据添加到jpg图像文件中》经验，为你挑选了0个好方法。 ... [详细]
程序员
Java Server包装器（tanuki）-启动失败：等待JVM发出的信号超时

如何解决《JavaServer包装器（tanuki）-启动失败：等待JVM发出的信号超时》经验，为你挑选了1个好方法。 ... [详细]
程序员
特定键的映射中的值的总和

如何解决《特定键的映射中的值的总和》经验，为你挑选了1个好方法。 ... [详细]
程序员
像Lmax Disruptor一样可以批量观察

如何解决《像LmaxDisruptor一样可以批量观察》经验，为你挑选了1个好方法。 ... [详细]
程序员
woocommerce webhooks没有解雇

如何解决《woocommercewebhooks没有解雇》经验，为你挑选了0个好方法。 ... [详细]
程序员
while循环使用嵌套的if语句--C

如何解决《while循环使用嵌套的if语句--C》经验，为你挑选了1个好方法。 ... [详细]
程序员
IPython Notebook：在下一步之前“实时”显示循环图像

如何解决《IPythonNotebook：在下一步之前“实时”显示循环图像》经验，为你挑选了0个好方法。 ... [详细]
程序员
Cython中的并行性不起作用

如何解决《Cython中的并行性不起作用》经验，为你挑选了1个好方法。 ... [详细]
程序员
C＃错误CS1061：类型“ System.Collections.Generic.List <int>”不包含“长度”的定义

如何解决《C＃错误CS1061：类型“System.Collections.Generic.List<int>”不包含“长度”的定义》经验，为你挑选了1个好方法。 ... [详细]
程序员
Gstreamer:为什么在显示某些过滤器之前我需要一个视频转换？

如何解决《Gstreamer:为什么在显示某些过滤器之前我需要一个视频转换？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Reactive Banana 1.0.0 - MomentIO()Monad中的单元测试

如何解决《ReactiveBanana1.0.0-MomentIO()Monad中的单元测试》经验，为你挑选了0个好方法。 ... [详细]
程序员
等到回调

如何解决《等到回调》经验，为你挑选了1个好方法。 ... [详细]
程序员
寻找设计模式以减少虚拟方法过载

如何解决《寻找设计模式以减少虚拟方法过载》经验，为你挑选了1个好方法。 ... [详细]
程序员
并行聚合集合

如何解决《并行聚合集合》经验，为你挑选了1个好方法。 ... [详细]
程序员
有没有更好的方法来填充多个下拉列表？

如何解决《有没有更好的方法来填充多个下拉列表？》经验，为你挑选了1个好方法。 ... [详细]

135369一生真爱_890

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章