18赞

将列表列表转换为字符向量

作者：pan2502851807 | 2023-09-08 12:46

如何解决《将列表列表转换为字符向量》经验，为你挑选了2个好方法。

我有一个字符列表列表.例如:

l <- list(list("A"),list("B"),list("C","D"))

因此,您可以看到一些元素是长度> 1的列表.

我想将此列表列表转换为字符向量,但我希望长度> 1的列表在字符向量中显示为单个元素.

该unlist功能并没有做到这一点,而是:

> unlist(l)
[1] "A" "B" "C" "D"

还有什么比:

sapply(l,function(x) paste(unlist(x),collapse=""))

为了得到我想要的结果:

"A"  "B"  "CD"

42-.. 19

您可以跳过取消列表步骤.您已经发现paste0需要collapse = TRUE将向量的顺序元素"绑定"在一起:

> sapply( l, paste0, collapse="")
[1] "A"  "B"  "CD"

A5C1D2H2I1M1.. 6

如果你不介意多线方法,这是@ thela建议的变体:

x <- lengths(l)                                     ## Get the lengths of each list
l[x > 1] <- lapply(l[x > 1], paste0, collapse = "") ## Paste only those together
unlist(l, use.names = FALSE)                        ## Unlist the result
# [1] "A"  "B"  "CD"

或者,如果您不介意使用软件包,请查看"stringi"软件包,具体来说stri_flatten,请按@Jota的建议.

这是一个性能比较:

l <- list(list("A"), list("B"), list("B"), list("B"), list("B"),
          list("C","D"), list("E","F", "G", "H"), 
          as.list(rep(letters,10)), as.list(rep(letters,2)))
l <- unlist(replicate(1000, l, FALSE), recursive = FALSE)

funop <- function() sapply(l,function(x) paste(unlist(x),collapse=""))
fun42 <- function() sapply(l, paste0, collapse="")
funv  <- function() vapply(l, paste0, character(1L), collapse = "")
funam <- function() {
  x <- lengths(l)
  l[x > 1] <- lapply(l[x > 1], paste0, collapse = "")
  unlist(l, use.names = FALSE)
}
funj <- function() sapply(l, stri_flatten)
funamj <- function() {
  x <- lengths(l)
  l[x > 1] <- lapply(l[x > 1], stri_flatten)
  unlist(l, use.names = FALSE)
}

library(microbenchmark)
microbenchmark(funop(), fun42(), funv(), funam(), funj(), times = 20)
# Unit: milliseconds
#      expr      min       lq     mean   median       uq      max neval   cld
#   funop() 78.21822 84.79588 85.30055 85.36399 86.90540 90.48321    20     e
#   fun42() 56.16938 57.35735 61.60008 58.04969 65.82836 81.46482    20    d 
#    funv() 54.64101 56.23245 60.07896 57.26049 63.96815 78.58043    20    d 
#   funam() 45.89760 46.89890 48.99810 47.29617 48.28764 56.92544    20   c  
#    funj() 28.73405 29.94041 32.00676 30.56711 31.11448 39.93765    20  b   
#  funamj() 18.64829 19.01328 21.05989 19.12468 19.52516 32.87569    20 a

注意:此方法的相对效率取决于将有多少列表项length(x) > 1.如果他们中的大多数都是> 1无论如何,那么就采用@ 42-的方法. stri_flatten只有在您将长字符向量粘贴在一起时才能提高性能,就像在上面的基准测试中使用的样本列表一样,否则,它没有帮助.

1> 42-..：

您可以跳过取消列表步骤.您已经发现paste0需要collapse = TRUE将向量的顺序元素"绑定"在一起:

> sapply( l, paste0, collapse="")
[1] "A"  "B"  "CD"

2> A5C1D2H2I1M1..：

如果你不介意多线方法,这是@ thela建议的变体:

x <- lengths(l)                                     ## Get the lengths of each list
l[x > 1] <- lapply(l[x > 1], paste0, collapse = "") ## Paste only those together
unlist(l, use.names = FALSE)                        ## Unlist the result
# [1] "A"  "B"  "CD"

或者,如果您不介意使用软件包,请查看"stringi"软件包,具体来说stri_flatten,请按@Jota的建议.

这是一个性能比较:

l <- list(list("A"), list("B"), list("B"), list("B"), list("B"),
          list("C","D"), list("E","F", "G", "H"), 
          as.list(rep(letters,10)), as.list(rep(letters,2)))
l <- unlist(replicate(1000, l, FALSE), recursive = FALSE)

funop <- function() sapply(l,function(x) paste(unlist(x),collapse=""))
fun42 <- function() sapply(l, paste0, collapse="")
funv  <- function() vapply(l, paste0, character(1L), collapse = "")
funam <- function() {
  x <- lengths(l)
  l[x > 1] <- lapply(l[x > 1], paste0, collapse = "")
  unlist(l, use.names = FALSE)
}
funj <- function() sapply(l, stri_flatten)
funamj <- function() {
  x <- lengths(l)
  l[x > 1] <- lapply(l[x > 1], stri_flatten)
  unlist(l, use.names = FALSE)
}

library(microbenchmark)
microbenchmark(funop(), fun42(), funv(), funam(), funj(), times = 20)
# Unit: milliseconds
#      expr      min       lq     mean   median       uq      max neval   cld
#   funop() 78.21822 84.79588 85.30055 85.36399 86.90540 90.48321    20     e
#   fun42() 56.16938 57.35735 61.60008 58.04969 65.82836 81.46482    20    d 
#    funv() 54.64101 56.23245 60.07896 57.26049 63.96815 78.58043    20    d 
#   funam() 45.89760 46.89890 48.99810 47.29617 48.28764 56.92544    20   c  
#    funj() 28.73405 29.94041 32.00676 30.56711 31.11448 39.93765    20  b   
#  funamj() 18.64829 19.01328 21.05989 19.12468 19.52516 32.87569    20 a

推荐阅读

程序员
引导程序的第二阶段使用Int 0x10/ah = 0x0e打印垃圾

如何解决《引导程序的第二阶段使用Int0x10/ah=0x0e打印垃圾》经验，为你挑选了1个好方法。 ... [详细]
程序员
按数据属性查找元素

如何解决《按数据属性查找元素》经验，为你挑选了2个好方法。 ... [详细]
程序员
游乐场不工作

如何解决《游乐场不工作》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何查找所有基于图像的PDF？

如何解决《如何查找所有基于图像的PDF？》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用不带web.xml的Spring(Boot)配置CAS

如何解决《使用不带web.xml的Spring(Boot)配置CAS》经验，为你挑选了1个好方法。 ... [详细]
程序员
这些Ruby版本中存在`heroku'命令:

如何解决《这些Ruby版本中存在`heroku'命令:》经验，为你挑选了1个好方法。 ... [详细]
程序员
as(x,'double')和as.double(x)不一致

如何解决《as(x,'double')和as.double(x)不一致》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何"施放"联盟类型榆树

如何解决《如何"施放"联盟类型榆树》经验，为你挑选了1个好方法。 ... [详细]
程序员
Visual Studio 2015隐藏错误列表中的Javascript错误

如何解决《VisualStudio2015隐藏错误列表中的Javascript错误》经验，为你挑选了0个好方法。 ... [详细]
程序员
通过LAN托管Socket.io服务器

如何解决《通过LAN托管Socket.io服务器》经验，为你挑选了1个好方法。 ... [详细]
程序员
控制器启动两次

如何解决《控制器启动两次》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何选择功能名称？

如何解决《如何选择功能名称？》经验，为你挑选了1个好方法。 ... [详细]
程序员
水平/垂直线图

如何解决《水平/垂直线图》经验，为你挑选了2个好方法。 ... [详细]
程序员
python逻辑回归(初学者)

如何解决《python逻辑回归(初学者)》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用C++将结构复制到数组中

如何解决《使用C++将结构复制到数组中》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何从方法中打印指针的值？

如何解决《如何从方法中打印指针的值？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在C中安全二进制搜索

如何解决《在C中安全二进制搜索》经验，为你挑选了1个好方法。 ... [详细]
程序员
匹配列表后修复类型擦除

如何解决《匹配列表后修复类型擦除》经验，为你挑选了1个好方法。 ... [详细]
程序员
Object.wait()超过了超时

如何解决《Object.wait()超过了超时》经验，为你挑选了1个好方法。 ... [详细]
程序员
强制SQL Server查询不返回任何行

如何解决《强制SQLServer查询不返回任何行》经验，为你挑选了1个好方法。 ... [详细]

pan2502851807

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章