6赞

R:将对象序列化为文本文件并再次返回

作者：拾味湖 | 2023-08-09 11:37

如何解决《R:将对象序列化为文本文件并再次返回》经验，为你挑选了1个好方法。

我在R中有一个进程,它创建了一堆对象,将它们序列化,并将它们放入纯文本文件中.这似乎是处理事情的一种非常好的方法,因为我正在使用Hadoop并且所有输出都需要通过stdin和stdout进行流式处理.

我留下的问题是如何从文本文件中读取这些对象并返回到桌面计算机上的R中.这是一个说明挑战的工作示例:

让我们创建一个tmp文件并将一个对象写入其中.这个对象只是一个向量:

outCon <- file("c:/tmp", "w")
mychars <- rawToChar(serialize(1:10, NULL, ascii=T))
cat(mychars, file=outCon)
close(outCon)

mychars对象看起来像这样:

> mychars
[1] "A\n2\n133633\n131840\n13\n10\n1\n2\n3\n4\n5\n6\n7\n8\n9\n10\n"

当写入文本文件时,它看起来像这样:

我可能忽略了一些非常明显的东西,但是如何将这个文件读回R并反序列化对象呢？当我尝试scan()或readLines()时,他们都希望将新行字符视为记录分隔符,最后我得到一个向量,其中每个元素都是文本文件中的一行.我真正想要的是一个包含文件全部内容的文本字符串.然后我可以反序列化字符串.

Perl会将换行符读回字符串,但我无法弄清楚如何覆盖R处理换行符的方式.

1> Dirk Eddelbu..：

JD,我们在摘要包中通过serialize()/来自raw.这很好,因为您可以在SQL和其他地方存储序列化对象.我实际上将它存储为RData,这样更快load()(没有解析!)和save().

或者,如果它必须是RawToChar()和ascii然后使用这样的东西(直接从help(digest)我们比较文件的序列化COPYING:

 # test 'length' parameter and file input
 fname <- file.path(R.home(),"COPYING")
 x <- readChar(fname, file.info(fname)$size) # read file
 for (alg in c("sha1", "md5", "crc32")) {
   # partial file
   h1 <- digest(x    , length=18000, algo=alg, serialize=FALSE)
   h2 <- digest(fname, length=18000, algo=alg, serialize=FALSE, file=TRUE)
   h3 <- digest( substr(x,1,18000) , algo=alg, serialize=FALSE)
   stopifnot( identical(h1,h2), identical(h1,h3) )
   # whole file
   h1 <- digest(x    , algo=alg, serialize=FALSE)
   h2 <- digest(fname, algo=alg, serialize=FALSE, file=TRUE)
   stopifnot( identical(h1,h2) )
 }

所以你的例子变成了这样:

R> outCon <- file("/tmp/jd.txt", "w")
R> mychars <- rawToChar(serialize(1:10, NULL, ascii=T))
R> cat(mychars, file=outCon); close(outCon)
R> fname <- "/tmp/jd.txt"
R> readChar(fname, file.info(fname)$size)
[1] "A\n2\n133633\n131840\n13\n10\n1\n2\n3\n4\n5\n6\n7\n8\n9\n10\n"
R> unserialize(charToRaw(readChar(fname, file.info(fname)$size)))
[1]  1  2  3  4  5  6  7  8  9 10
R>

推荐阅读

程序员
(Android)尝试抛出OutOfMemoryError时抛出OutOfMemoryError

如何解决《(Android)尝试抛出OutOfMemoryError时抛出OutOfMemoryError》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用ng-repeat或ng-model填充textarea,以便它不会使用迭代数据创建一个新的textarea

如何解决《使用ng-repeat或ng-model填充textarea,以便它不会使用迭代数据创建一个新的textarea》经验，为你挑选了1个好方法。 ... [详细]
程序员
Fullcalendar:如何删除事件

如何解决《Fullcalendar:如何删除事件》经验，为你挑选了1个好方法。 ... [详细]
程序员
覆盖动画填充模式:在JavaScript/CSS中转发

如何解决《覆盖动画填充模式:在JavaScript/CSS中转发》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何获取byte []以在视图上显示为div的背景图像（C＃，ASP.NET，MVC）

如何解决《如何获取byte[]以在视图上显示为div的背景图像（C＃，ASP.NET，MVC）》经验，为你挑选了0个好方法。 ... [详细]
程序员
有没有办法确定C++编译器实现的语言功能？

如何解决《有没有办法确定C++编译器实现的语言功能？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Seaborn热图旁边添加列

如何解决《如何在Seaborn热图旁边添加列》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么TypeError上的JSON.stringify返回一个空对象

如何解决《为什么TypeError上的JSON.stringify返回一个空对象》经验，为你挑选了1个好方法。 ... [详细]
程序员
角饼干

如何解决《角饼干》经验，为你挑选了3个好方法。 ... [详细]
程序员
从协议扩展实例方法中读取静态var

如何解决《从协议扩展实例方法中读取静态var》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么我使用框架获得不可用的声明

如何解决《为什么我使用框架获得不可用的声明》经验，为你挑选了1个好方法。 ... [详细]
程序员
将可变长度JSON数组解码为Rust数组

如何解决《将可变长度JSON数组解码为Rust数组》经验，为你挑选了1个好方法。 ... [详细]
程序员
git rebase是否会产生比git merge更多的冲突？

如何解决《gitrebase是否会产生比gitmerge更多的冲突？》经验，为你挑选了1个好方法。 ... [详细]
程序员
单击edittext时自动滚动

如何解决《单击edittext时自动滚动》经验，为你挑选了1个好方法。 ... [详细]
程序员
多行导航栏标题

如何解决《多行导航栏标题》经验，为你挑选了1个好方法。 ... [详细]
程序员
方法调用上的问号语法

如何解决《方法调用上的问号语法》经验，为你挑选了1个好方法。 ... [详细]
程序员
select2不保存Edit的输入

如何解决《select2不保存Edit的输入》经验，为你挑选了0个好方法。 ... [详细]
程序员
无法读取属性'refs'的null反应错误反应js

如何解决《无法读取属性'refs'的null反应错误反应js》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何_ts在DocumentDB中更改

如何解决《如何_ts在DocumentDB中更改》经验，为你挑选了1个好方法。 ... [详细]
程序员
Jenkins Changelog for Git标签

如何解决《JenkinsChangelogforGit标签》经验，为你挑选了0个好方法。 ... [详细]

拾味湖

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章