14赞

将数字向量作为字符串汇总的功能？

作者：手机用户2402852387 | 2023-09-08 12:04

如何解决《将数字向量作为字符串汇总的功能？》经验，为你挑选了3个好方法。

假设我有以下数字向量:

vec = c(1, 2, 3, 5, 7, 8, 9, 10, 11, 12)

我正在寻找一个函数,它将创建一个字符串,以人类的方式总结数字列表,即

"1-3, 5, 7-12"

我怎么能在R中这样做？

1> alexis_laz..：

添加另一种替代方法,您可以使用deparseing方法.例如:

deparse(c(1L, 2L, 3L))
#[1] "1:3"

利用as.character"deparse"给定的"列表"作为输入,我们可以使用:

as.character(split(as.integer(vec), cumsum(c(TRUE, diff(vec) != 1))))
#[1] "1:3"  "5"    "7:12"
toString(gsub(":", "-", .Last.value))
#[1] "1-3, 5, 7-12"

这是什么巫术？

@Tensibai:你是对的,不过,我猜它看起来像是一个小测验..!@RichardScriven:我没有对它进行基准测试,但我认为`deparse`已经比通过不替换另一种方法可以改善的速度慢得多.@DavidArenburg:在R中调试,更经常导致"为什么"而不是"如何工作"？

2> talat..：

我假设矢量按照示例中的顺序排序.如果不vec <- sort(vec)事先使用.

编辑注:@DavidArenburg发现一个错误在我原来的答案在c(min(x), x)实际上应该是c(0, x).既然我们现在知道我们总是需要首先添加一个0,我们可以省略创建的第一步x并"动态"执行.现在编辑原始答案和其他选项以反映(您可以检查原始帖子的编辑历史记录).谢谢大卫!

关于调用的注释unname:我曾经unname(sapply(...))确保结果向量没有被命名,否则它将被命名为0:(n-1)其中n等于长度new_vec.正如@Tensibai在评论中正确指出的那样,如果最终目的是生成由运行产生的长度为1的字符向量,则无关紧要,toString(new_vec)因为toString无论如何都将省略向量名称.

一个选项(可能不是最短的)将是:

new_vec <- unname(sapply(split(vec, c(0, cumsum(diff(vec) > 1))), function(y) {
  if(length(y) == 1) y else paste0(head(y, 1), "-", tail(y, 1))
}))

结果:

new_vec
#[1] "1-3"  "5"    "7-12"
toString(new_vec)
#[1] "1-3, 5, 7-12"

感谢@ Zelazny7,可以使用以下range功能缩短它:

new_vec <- unname(sapply(split(vec, c(0, cumsum(diff(vec) > 1))), function(y) {
    paste(unique(range(y)), collapse='-')
}))

感谢@DavidArenburg,可以通过使用tapply而不是sapply+ 来进一步缩短它split:

new_vec <- unname(tapply(vec, c(0, cumsum(diff(vec) > 1)), function(y) {
  paste(unique(range(y)), collapse = "-")
}))

可以使用`paste(unique(range(y)),collapse =' - ')`而不是`head`和`tail`

3> Benjamin..：

编辑:我首先通过对矢量进行排序来加快docendo的代码,所以现在它们实际上处于平等地位.

我还添加了亚历克西斯的方法.

readable_integers <- function(integers)
{
  integers <- sort(unique(integers))
  group <- cumsum(c(0, diff(integers)) != 1)

  paste0(vapply(split(integers, group),
           function(x){
             if (length(x) == 1) as.character(x)
             else paste0(range(x), collapse = "-")
           },
           character(1)),
           collapse = "; ")
}

library(microbenchmark)
vec = c(1, 2, 3, 5, 7, 8, 9, 10, 11, 12)
microbenchmark(
  docendo = {vec <- sort(vec)
    x <- cumsum(diff(vec) > 1)
   toString(tapply(vec, c(min(x), x), function(y) paste(unique(range(y)), )collapse = "-"))
  },
  Benjamin = readable_integers(vec),
  alexis = {vec <- sort(vec)
            as.character(split(as.integer(vec), cumsum(c(TRUE, diff(vec) != 1))))
            toString(gsub(":", "-", .Last.value))}
)

Unit: microseconds
     expr     min       lq     mean  median       uq     max neval
  docendo 205.273 220.3755 230.3134 228.293 235.4780 467.142   100
 Benjamin 121.991 128.4420 135.5302 133.574 143.3980 161.286   100
   alexis 121.698 128.0030 137.0374 136.507 143.3975 169.790   100

set.seed(pi)
vec = sample(1:1000, 900)

set.seed(pi)
vec = sample(1:1000, 900)

microbenchmark(
  docendo = {vec <- sort(vec)
   x <- cumsum(diff(vec) > 1)
   toString(tapply(sort(vec), c(min(x), x), function(y) paste(unique(range(y)), collapse = "-")))
  },
  Benjamin = readable_integers(vec),
  alexis = {vec <- sort(vec)
            as.character(split(as.integer(vec), cumsum(c(TRUE, diff(vec) != 1))))
            toString(gsub(":", "-", .Last.value))}
)
Unit: microseconds
     expr      min        lq      mean    median        uq      max neval
  docendo 1307.294 1353.7735 1420.3088 1379.7265 1427.8190 2554.473   100
 Benjamin  615.525  626.8155  661.2513  638.8385  665.3765 1676.493   100
   alexis  799.684  808.3355  866.1516  820.0650  833.2615 1974.138   100

推荐阅读

程序员
使用已删除的复制构造函数和初始化列表重载调用类定义中的成员构造函数

如何解决《使用已删除的复制构造函数和初始化列表重载调用类定义中的成员构造函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用DNX和ASP.NET 5实现持续交付

如何解决《如何使用DNX和ASP.NET5实现持续交付》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何用里面的两个视图刷新SwipeRefreshLayout

如何解决《如何用里面的两个视图刷新SwipeRefreshLayout》经验，为你挑选了1个好方法。 ... [详细]
程序员
Laravel Eloquent:如何在Json响应中生成假列？

如何解决《LaravelEloquent:如何在Json响应中生成假列？》经验，为你挑选了1个好方法。 ... [详细]
程序员
ES6模块:重新导出为对象

如何解决《ES6模块:重新导出为对象》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何检查证书是否自签名？

如何解决《如何检查证书是否自签名？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用参考参数

如何解决《使用参考参数》经验，为你挑选了1个好方法。 ... [详细]
程序员
PyQt4:如何在发出信号之前暂停线程？

如何解决《PyQt4:如何在发出信号之前暂停线程？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Docker构建参数

如何解决《Docker构建参数》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在我的Mac OSX上安装PHP扩展"pcntl"

如何解决《如何在我的MacOSX上安装PHP扩展"pcntl"》经验，为你挑选了1个好方法。 ... [详细]
程序员
spring jdbctemplate get byte array

如何解决《springjdbctemplategetbytearray》经验，为你挑选了0个好方法。 ... [详细]
程序员
SQL datetime比较

如何解决《SQLdatetime比较》经验，为你挑选了2个好方法。 ... [详细]
程序员
按Java 8中的Map列表分组

如何解决《按Java8中的Map列表分组》经验，为你挑选了1个好方法。 ... [详细]
程序员
Python字符串文字串联

如何解决《Python字符串文字串联》经验，为你挑选了1个好方法。 ... [详细]
程序员
doctrine ORM count arraycollection in where condition

如何解决《doctrineORMcountarraycollectioninwherecondition》经验，为你挑选了0个好方法。 ... [详细]
程序员
SPARQL的正则表达式

如何解决《SPARQL的正则表达式》经验，为你挑选了1个好方法。 ... [详细]
程序员
在php中解码json就像字符串一样

如何解决《在php中解码json就像字符串一样》经验，为你挑选了1个好方法。 ... [详细]
程序员
尝试在后台线程中加载/设置场景导致"OpenGL错误0x0502 in - [CCSprite draw] 530"

如何解决《尝试在后台线程中加载/设置场景导致"OpenGL错误0x0502in-[CCSpritedraw]530"》经验，为你挑选了1个好方法。 ... [详细]
程序员
java字符串操作,将多个斜杠更改为一个斜杠

如何解决《java字符串操作,将多个斜杠更改为一个斜杠》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法使用相同的密钥发送带有参数的改装2.0多部分请求

如何解决《无法使用相同的密钥发送带有参数的改装2.0多部分请求》经验，为你挑选了0个好方法。 ... [详细]

手机用户2402852387

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章