1赞

将(1:n)[boolean]分割成连续的序列

作者：小色米虫_524 | 2023-09-11 14:57

如何解决《将(1:n)[boolean]分割成连续的序列》经验，为你挑选了1个好方法。

我想将我的数据分成连续行的组,通过一些测试.这是一个例子:

set.seed(1)
n   <-  29
ok  <-  sample(c(TRUE,FALSE),n,replace=TRUE,prob=c(.7,.3))

vec <- (1:n)[ok]
# [1]  1  2  3  5  8  9 10 11 12 13 14 16 19 22 23 24 25 26 27 28

所需的输出是"vec"分组为连续序列:

out <- list(1:3,5,8:14,16,19,22:28)

这有效:

nv  <- length(vec)

splits <- 1 + which(diff(vec) != 1)
splits <- c(1,splits,nv+1)
nsp    <- length(splits)

out <- list()
for (i in 1:(nsp-1)){
    out[[i]] <- vec[splits[i]:(splits[i+1]-1)]
}

我猜测基地R有一个更清洁的方式...？我还不熟悉我在SO上看过的那些rle和cumsum诡计......

1> eddi..：

这是cumsum给你的"诀窍":

split(vec, cumsum(c(1, diff(vec)) - 1))

更新

以下是使用您的版本的简单示例,split(vec, cumsum(c(0, diff(vec) > 1)))其中每个步骤都已细分:

vec <- c(1:3,7:9)            #  1 2 3 7 8 9 (sample with two contiguous sequences)
diff(vec)                    #   1 1 4 1 1  (lagged difference)
diff(vec) > 1                #   F F T F F  (not contiguous where diff > 1)
                             #   0 0 1 0 0  (numeric equivalent for T/F)
c(0, diff(vec) > 1)          #  0 0 0 1 0 0 (pad with 0 to align with original vector)
cumsum(c(0, diff(vec) > 1))  #  0 0 0 1 1 1 (cumulative sum of logical values)

groups <- cumsum(c(0, diff(vec) > 1)) #  0 0 0 1 1 1

sets <- split(vec, groups) # split into groups named by cumulative sum

sets
# $`0`
# [1] 1 2 3
# 
# $`1`
# [1] 7 8 9

然后如果你想出于某种原因输出它:

# Create strings representing each contiguous range
set_strings <- sapply(sets, function(x) paste0(min(x),":",max(x)))

set_strings
#     0     1
# "1:3" "7:9"

# Print out a concise representation of all contiguous sequences
print(paste0(set_strings,collapse=","))

# [1] "1:3,7:9"

推荐阅读

程序员
TypeError:不可用类型

如何解决《TypeError:不可用类型》经验，为你挑选了1个好方法。 ... [详细]
程序员
git checkout - *并跳过未跟踪的文件

如何解决《gitcheckout-*并跳过未跟踪的文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法将Firebase导入Swift类

如何解决《无法将Firebase导入Swift类》经验，为你挑选了3个好方法。 ... [详细]
程序员
Eslint:如何在Node.js中禁用"意外的控制台语句"？

如何解决《Eslint:如何在Node.js中禁用"意外的控制台语句"？》经验，为你挑选了10个好方法。 ... [详细]
程序员
launchd状态78是什么意思？为什么我的用户代理没有运行？

如何解决《launchd状态78是什么意思？为什么我的用户代理没有运行？》经验，为你挑选了3个好方法。 ... [详细]
程序员
如何在序列化器中设置默认值？

如何解决《如何在序列化器中设置默认值？》经验，为你挑选了3个好方法。 ... [详细]
程序员
将md5哈希值添加到mongo集合中

如何解决《将md5哈希值添加到mongo集合中》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么使用multiDexEnabled(true)允许应用程序构建但不断崩溃？

如何解决《为什么使用multiDexEnabled(true)允许应用程序构建但不断崩溃？》经验，为你挑选了1个好方法。 ... [详细]
程序员
远程文件上传量角器测试

如何解决《远程文件上传量角器测试》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否可以在"if语句"中嵌入"for循环"以在继续使用c ++之前比较多个条件

如何解决《是否可以在"if语句"中嵌入"for循环"以在继续使用c++之前比较多个条件》经验，为你挑选了1个好方法。 ... [详细]
程序员
TensorFlow中variable_scope和name_scope之间的区别

如何解决《TensorFlow中variable_scope和name_scope之间的区别》经验，为你挑选了2个好方法。 ... [详细]
程序员
当一个.Swift文件的图标比另一个图标更暗时,它是什么意思？

如何解决《当一个.Swift文件的图标比另一个图标更暗时,它是什么意思？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Perl中是否有关键字'with'？

如何解决《Perl中是否有关键字'with'？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用swagger与android数据库

如何解决《使用swagger与android数据库》经验，为你挑选了0个好方法。 ... [详细]
程序员
chrome中不支持getUserMedia()

如何解决《chrome中不支持getUserMedia()》经验，为你挑选了2个好方法。 ... [详细]
程序员
Floyd warshall实施似乎缺少最短的路径

如何解决《Floydwarshall实施似乎缺少最短的路径》经验，为你挑选了0个好方法。 ... [详细]
程序员
根据给定时区(本地时区)获取以毫秒为单位的时间

如何解决《根据给定时区(本地时区)获取以毫秒为单位的时间》经验，为你挑选了1个好方法。 ... [详细]
程序员
在列表中标记除一个重复项之外的所有重复项

如何解决《在列表中标记除一个重复项之外的所有重复项》经验，为你挑选了1个好方法。 ... [详细]
程序员
sizeof功能无法正常工作

如何解决《sizeof功能无法正常工作》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Android下测试Realm

如何解决《在Android下测试Realm》经验，为你挑选了2个好方法。 ... [详细]

小色米虫_524

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章