16赞

删除"NUL"字符(在R中)

作者：有风吹过best | 2023-09-10 15:26

如何解决《删除"NUL"字符(在R中)》经验，为你挑选了1个好方法。

我有一个奇怪的文本文件,其中包含一堆NUL字符(实际上大约有10个这样的文件),我想以编程方式从R中替换它们.这是一个链接到其中一个文件.在这个问题的帮助下,我终于找到了一种比临时更好的方法来进入每个文件并找到并替换烦扰的角色.事实证明,它们中的每一对应该对应一个空间([NUL][NUL]- > ) to maintain the intended line width of the file (which is crucial for reading these as fixed-width further down the road).

However, for robustness' sake, I prefer a more automable approach to the solution, ideally (for organization's sake) something I could add at the beginning of an R script I'm writing to clean up the files. This question looked promising but the accepted answer is insufficient - readLines每当我尝试在这些文件上使用它时都会抛出错误(除非我激活skipNul).

有没有办法将此文件的行放入R中,以便我可以使用gsub或其他任何方法来解决此问题,而无需借助外部程序？

1> Simon Urbane..：

您想要将文件读取为二进制文件,然后您可以替换NULs,例如用空格替换它们:

r = readBin("00staff.dat", raw(), file.info("00staff.dat")$size)
r[r==as.raw(0)] = as.raw(0x20) ## replace with 0x20 = 
writeBin(r, "00staff.txt")
str(readLines("00staff.txt"))
#  chr [1:155432] "000540952Anderson            Shelley J       FW1949     2000R000000000000119460007620            3  0007000704002097907KGKG1616"| __truncated__ ...

你也可以NUL用一个非常罕见的字符替换s(例如"\01")并对字符串进行处理,例如,假设你想用一个空格替换两个NULs("\00\00"):

r = readBin("00staff.dat", raw(), file.info("00staff.dat")$size)
r[r==as.raw(0)] = as.raw(1)
a = gsub("\01\01", " ", rawToChar(r), fixed=TRUE)
s = strsplit(a, "\n", TRUE)[[1]]
str(s)
# chr [1:155432] "000540952Anderson            Shelley J       FW1949     2000R000000000000119460007620            3  0007000704002097907KGKG1616"| __truncated__

推荐阅读

程序员
BouncyCastle现在更新了pgp密钥,导致校验和不匹配错误

如何解决《BouncyCastle现在更新了pgp密钥,导致校验和不匹配错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
将SEXP从R转换为C++中的字符串向量

如何解决《将SEXP从R转换为C++中的字符串向量》经验，为你挑选了1个好方法。 ... [详细]
程序员
C#6 null传播当object为null时设置的值

如何解决《C#6null传播当object为null时设置的值》经验，为你挑选了2个好方法。 ... [详细]
程序员
iOS Swift:从两个Int创建Float值

如何解决《iOSSwift:从两个Int创建Float值》经验，为你挑选了1个好方法。 ... [详细]
程序员
寻找对应于最小特征值的特征向量

如何解决《寻找对应于最小特征值的特征向量》经验，为你挑选了1个好方法。 ... [详细]
程序员
NPM安装与package.json在提取 - > gunzTarPerm期间退出,没有错误消息

如何解决《NPM安装与package.json在提取->gunzTarPerm期间退出,没有错误消息》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Google BigQuery中选择除一些以外的所有列？

如何解决《在GoogleBigQuery中选择除一些以外的所有列？》经验，为你挑选了2个好方法。 ... [详细]
程序员
完成Docker for Windows教程时找不到Eval命令

如何解决《完成DockerforWindows教程时找不到Eval命令》经验，为你挑选了0个好方法。 ... [详细]
程序员
前n个奇数的总和

如何解决《前n个奇数的总和》经验，为你挑选了1个好方法。 ... [详细]
程序员
Javascript \ x转义

如何解决《Javascript\x转义》经验，为你挑选了1个好方法。 ... [详细]
程序员
Vimscript:在字符串上获取正则表达式的所有匹配项

如何解决《Vimscript:在字符串上获取正则表达式的所有匹配项》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何检查整数是否是一个完美的正方形

如何解决《如何检查整数是否是一个完美的正方形》经验，为你挑选了1个好方法。 ... [详细]
程序员
NodeJS - connect-keycloak中间件空响应错误

如何解决《NodeJS-connect-keycloak中间件空响应错误》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何使用socket.io发送二进制数据？

如何解决《如何使用socket.io发送二进制数据？》经验，为你挑选了1个好方法。 ... [详细]
程序员
添加文件并在Xcode中选择多个目标

如何解决《添加文件并在Xcode中选择多个目标》经验，为你挑选了0个好方法。 ... [详细]
程序员
AWS JS SDK,IAM和DynamoDB问题

如何解决《AWSJSSDK,IAM和DynamoDB问题》经验，为你挑选了1个好方法。 ... [详细]
程序员
Django编辑和删除，使用通用编辑视图或在视图中创建函数。

如何解决《Django编辑和删除，使用通用编辑视图或在视图中创建函数。》经验，为你挑选了1个好方法。 ... [详细]
程序员
创建一个范围内有间隙的序列

如何解决《创建一个范围内有间隙的序列》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用spring MVC的Maven jackson依赖项的问题

如何解决《使用springMVC的Mavenjackson依赖项的问题》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在visual studio中调试python(如何进入库)？

如何解决《如何在visualstudio中调试python(如何进入库)？》经验，为你挑选了0个好方法。 ... [详细]

有风吹过best

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章