当前位置:  开发笔记 > 编程语言 > 正文

将包括其他值的最重复值排在前面

如何解决《将包括其他值的最重复值排在前面》经验,为你挑选了1个好方法。

我创建了一个表格,其中包括按性别,主题等组织的1000首歌曲的列表.我想知道重复多少年以及其他类别中有多少年.我试过了:

sort(summary(as.factor(canciones$YEAR)), decreasing=T)[1:3]

输出是:

1968 1966 1979 
  39   37   34 

但我希望它是

1968 1966 1979 Others
  39   37   34    950

Rich Scriven.. 9

以下是一些示例数据.

set.seed(1)
x <- sample(10, 500, TRUE)

我们可以运行整个摘要,前三个子集,然后将剩余值计算为"其他"并在最后添加.此外,我认为你可以使用table()而不是summary(factor())因为summary.factor()无论如何这是在引擎盖下.

xx <- sort(table(x), decreasing = TRUE)
c(xx[1:3], Others = sum(xx[-(1:3)]))
#     5      2      4 Others 
#    64     61     57    318 

注意:使用它可能会或可能不会更快Others = length(x) - sum(xx[1:3]).



1> Rich Scriven..:

以下是一些示例数据.

set.seed(1)
x <- sample(10, 500, TRUE)

我们可以运行整个摘要,前三个子集,然后将剩余值计算为"其他"并在最后添加.此外,我认为你可以使用table()而不是summary(factor())因为summary.factor()无论如何这是在引擎盖下.

xx <- sort(table(x), decreasing = TRUE)
c(xx[1:3], Others = sum(xx[-(1:3)]))
#     5      2      4 Others 
#    64     61     57    318 

注意:使用它可能会或可能不会更快Others = length(x) - sum(xx[1:3]).

推荐阅读
mylvfamily
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有