5赞

在处理NaN时,data.table"list"与":="

作者：LEEstarmmmmm | 2023-09-11 10:19

如何解决《在处理NaN时,data.table"list"与":="》经验，为你挑选了1个好方法。

注意到data.table的一些奇怪的行为,希望有人比我能解释的更了解data.table.

说我有这个data.table:

library(data.table)
DT <- data.table(
  C1 = c(rep("A", 4), rep("B",4), rep("C", 4)),
  C2 = c(rep("a", 3), rep("b",3), rep("c",3), rep("d",3)),
  Val = c(1:5, NaN, NaN, 8,9,10,NaN,12))

DT
    C1 C2 Val
 1:  A  a   1
 2:  A  a   2
 3:  A  a   3
 4:  A  b   4
 5:  B  b   5
 6:  B  b NaN
 7:  B  c NaN
 8:  B  c   8
 9:  C  c   9
10:  C  d  10
11:  C  d NaN
12:  C  d  12

现在,在我看来,以下两种方法应该生成相同的结果,但它们不会.

TEST1 <- DT[, agg := min(Val, na.rm = TRUE), by = c('C1', 'C2')]
TEST1 <- data.table(unique(TEST1[, c('C1','C2','agg'), with = FALSE]))

TEST2 <- DT[, list(agg = min(Val, na.rm = TRUE)), by = c('C1', 'C2')]

TEST1
   C1 C2 agg
1:  A  a   1
2:  A  b   4
3:  B  b   5
4:  B  c   8
5:  C  c   9
6:  C  d  10


TEST2
   C1 C2 agg
1:  A  a   1
2:  A  b   4
3:  B  b   5
4:  B  c NaN
5:  C  c   9
6:  C  d  10

如您所见,使用":="会为(C1 = B,C2 = c)生成最小值8.而list命令会生成NaN.有趣的是,对于(C1 = B,C2 = b)和(C1 = C,C2 = d),它们也有NaNs,list命令确实产生一个值.我相信这是因为在NaN首先在给定C1 C2组合的值之前的情况下,NaN结果.而在另外两个例子中,NaN来自一个值.

为什么会这样？

我注意到如果用NA替换NaN,则生成的值没有问题.

1> Arun..：

修复了这个问题,#1461刚刚开发,v1.9.7,提交2080.

require(data.table) # v1.9.7, commit 2080+
DT <- data.table(
     C1 = c(rep("A", 4), rep("B",4), rep("C", 4)),
     C2 = c(rep("a", 3), rep("b",3), rep("c",3), rep("d",3)),
     Val = c(1:5, NaN, NaN, 8,9,10,NaN,12))

DT[, list(agg = min(Val, na.rm = TRUE)), by = c('C1', 'C2')]
#    C1 C2 agg
# 1:  A  a   1
# 2:  A  b   4
# 3:  B  b   5
# 4:  B  c   8
# 5:  C  c   9
# 6:  C  d  10

推荐阅读

程序员
Int.TryParse()始终返回false

如何解决《Int.TryParse()始终返回false》经验，为你挑选了1个好方法。 ... [详细]
程序员
iOS推送通知生产证书常见名称问题

如何解决《iOS推送通知生产证书常见名称问题》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在scala中进行内存分配

如何解决《如何在scala中进行内存分配》经验，为你挑选了1个好方法。 ... [详细]
程序员
符号显示不正确

如何解决《符号显示不正确》经验，为你挑选了3个好方法。 ... [详细]
程序员
我可以在dma_sync_single_for_cpu之后调用dma_unmap_single吗？

如何解决《我可以在dma_sync_single_for_cpu之后调用dma_unmap_single吗？》经验，为你挑选了0个好方法。 ... [详细]
程序员
在Java中随机化一个字符串

如何解决《在Java中随机化一个字符串》经验，为你挑选了0个好方法。 ... [详细]
程序员
循环c#wpf中的疯狂行为

如何解决《循环c#wpf中的疯狂行为》经验，为你挑选了1个好方法。 ... [详细]
程序员
解析dom元素时,JqueryUI滑块不起作用

如何解决《解析dom元素时,JqueryUI滑块不起作用》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用Python在2个组合数组中排列序列

如何解决《使用Python在2个组合数组中排列序列》经验，为你挑选了0个好方法。 ... [详细]
程序员
形式在angular2

如何解决《形式在angular2》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何在swift中打印数组中的对象值,而不是它的位置

如何解决《如何在swift中打印数组中的对象值,而不是它的位置》经验，为你挑选了1个好方法。 ... [详细]
程序员
Swift的异构值类型数组如何工作？

如何解决《Swift的异构值类型数组如何工作？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何覆盖RecyclerView Adapter的notifyDataSetChanged,notifyItemChanged ...方法

如何解决《如何覆盖RecyclerViewAdapter的notifyDataSetChanged,notifyItemChanged方法》经验，为你挑选了2个好方法。 ... [详细]
程序员
删除排队的作业在Laravel 5

如何解决《删除排队的作业在Laravel5》经验，为你挑选了1个好方法。 ... [详细]
程序员
什么是SSO(例如SAML)中使用的RelayState参数？

如何解决《什么是SSO(例如SAML)中使用的RelayState参数？》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何让git-diff忽略所有的空白变化而忽略一个？

如何解决《如何让git-diff忽略所有的空白变化而忽略一个？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Sinon JS:有没有办法在sinon js中对对象参数的键值存根方法

如何解决《SinonJS:有没有办法在sinonjs中对对象参数的键值存根方法》经验，为你挑选了1个好方法。 ... [详细]
程序员
Winston记录器文件名错误未定义

如何解决《Winston记录器文件名错误未定义》经验，为你挑选了1个好方法。 ... [详细]
程序员
PHP 7.0.1无法加载ini文件

如何解决《PHP7.0.1无法加载ini文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
写入BinaryWriter时的类型大小

如何解决《写入BinaryWriter时的类型大小》经验，为你挑选了0个好方法。 ... [详细]

LEEstarmmmmm

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章