13赞

在列中使用逗号读取CSV文件

作者：U友50081205_653 | 2023-09-07 14:10

如何解决《在列中使用逗号读取CSV文件》经验，为你挑选了1个好方法。

我有一个包含6列的csv文件,其中一列的文本用逗号分隔,例如BOLT,RD HD SQ SHORT NECK,METRIC.

当我在R中读取此文件时,此列中存在溢出,随后数据移动到新行.

下面我贴了几行

014003051906,ETN5080,0450,螺栓套件上轴,5速,1.000,F 014003051906,ETN5967,0460,传感器传感器FH后挡板,1.000,F 014003051906,ETN64267,0470,倾斜装置传感器,1.000,F

014003065376,03M7184,0020,BOLT - M 8.0 X 1.250 X 20.0 - 8.8-Zinc,4.000,G 014003065376,03M7386,0090,BOLT,RD HD SQ短颈,公制,18.000,G 014003065376,14M7296,0090,NUT,METRIC ,HEX FLANGE,14.000,G

最后两行是问题所在."NUT,METRIC,HEX FLANGE"应该归入一个变量.

怎么解决这个问题？

1> Aurèle..：

data <- readLines(con = textConnection("014003051906,ETN5080 ,0450,BOLT KIT UPPER SHAFT WITH 5 SPEED,1.000,F
014003051906,ETN5967 ,0460,SENSOR SENSOR FH BACKSHAFT SPEED,1.000,F
014003051906,ETN64267 ,0470,TILT UNIT SENSOR,1.000,F

014003065376,03M7184 ,0020,BOLT - M 8.0 X 1.250 X 20.0 - 8.8-Zinc,4.000,G
014003065376,03M7386 ,0090,BOLT, RD HD SQ SHORT NECK, METRIC,18.000,G
014003065376,14M7296 ,0090,NUT, METRIC, HEX FLANGE,14.000,G"))

pattern <- "^([^,]*),([^,]*),([^,]*),(.*),([^,]*),([^,]*)$"

library(stringr)
str_match(data, pattern)[, - 1]
#      [,1]           [,2]        [,3]   [,4]                                     [,5]     [,6]
# [1,] "014003051906" "ETN5080 "  "0450" "BOLT KIT UPPER SHAFT WITH 5 SPEED"      "1.000"  "F" 
# [2,] "014003051906" "ETN5967 "  "0460" "SENSOR SENSOR FH BACKSHAFT SPEED"       "1.000"  "F" 
# [3,] "014003051906" "ETN64267 " "0470" "TILT UNIT SENSOR"                       "1.000"  "F" 
# [4,] NA             NA          NA     NA                                       NA       NA  
# [5,] "014003065376" "03M7184 "  "0020" "BOLT - M 8.0 X 1.250 X 20.0 - 8.8-Zinc" "4.000"  "G" 
# [6,] "014003065376" "03M7386 "  "0090" "BOLT, RD HD SQ SHORT NECK, METRIC"      "18.000" "G" 
# [7,] "014003065376" "14M7296 "  "0090" "NUT, METRIC, HEX FLANGE"                "14.000" "G"

编辑:
初学者的正则表达式解释,用简单的词语请原谅不准确:

初始^和终端$的意思是启动和字符串的结尾.

Parens用于分组(str_match()将提取的组).

.表示任何字符,.*表示任何数量的字符.

[^,] 表示任何不是逗号的字符.

放在一起时,这意味着:start of string- - substring without a comma(comma重复3次) - - substring possibly containing commas- comma- substring without a comma- comma- substring without a comma,end of string只有带括号的组被提取.

推荐阅读

程序员
错误:任务执行失败:ransformException

如何解决《错误:任务执行失败:ransformException》经验，为你挑选了1个好方法。 ... [详细]
程序员
逗号之后我不想要空格宽度 - 最佳做法？

如何解决《逗号之后我不想要空格宽度-最佳做法？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java:字符串模式:如何为具有特殊字符的所有字符字符指定正则表达式

如何解决《Java:字符串模式:如何为具有特殊字符的所有字符字符指定正则表达式》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在UITextField中添加图像和文本作为swift中心的占位符

如何解决《如何在UITextField中添加图像和文本作为swift中心的占位符》经验，为你挑选了0个好方法。 ... [详细]
程序员
Rspec：如何创建模拟关联

如何解决《Rspec：如何创建模拟关联》经验，为你挑选了0个好方法。 ... [详细]
程序员
未初始化的常量Sprockets :: Rails(NameError)

如何解决《未初始化的常量Sprockets::Rails(NameError)》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何通过包管理器安装Swift包？

如何解决《如何通过包管理器安装Swift包？》经验，为你挑选了2个好方法。 ... [详细]
程序员
mysql:mysql的wait_timeout,net_read_timeout和net_write_timeout变量是什么？

如何解决《mysql:mysql的wait_timeout,net_read_timeout和net_write_timeout变量是什么？》经验，为你挑选了1个好方法。 ... [详细]
程序员
缓冲区溢出漏洞利用：为什么“ jmp esp”需要位于DLL中？

如何解决《缓冲区溢出漏洞利用：为什么“jmpesp”需要位于DLL中？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Java编译器上下文中的"生成的源文件"是什么？

如何解决《Java编译器上下文中的"生成的源文件"是什么？》经验，为你挑选了1个好方法。 ... [详细]
程序员
mysql表导入向导无法导入csv文件

如何解决《mysql表导入向导无法导入csv文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
Ruby对象空白？方法

如何解决《Ruby对象空白？方法》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在MySQL中按各种值排序？

如何解决《如何在MySQL中按各种值排序？》经验，为你挑选了1个好方法。 ... [详细]
程序员
我的应用程序在横向模式下崩溃

如何解决《我的应用程序在横向模式下崩溃》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用transform:scale进行滚动时的振动屏幕

如何解决《使用transform:scale进行滚动时的振动屏幕》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用Swift删除iOS目录中的文件

如何解决《使用Swift删除iOS目录中的文件》经验，为你挑选了2个好方法。 ... [详细]
程序员
对于Android开发,我可以在图像视图上使用JPG图像而不是PNG图像吗？

如何解决《对于Android开发,我可以在图像视图上使用JPG图像而不是PNG图像吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Unity支持阿拉伯语

如何解决《Unity支持阿拉伯语》经验，为你挑选了0个好方法。 ... [详细]
程序员
奇怪的C++模式减少了编译时间

如何解决《奇怪的C++模式减少了编译时间》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何保持引用以进行正确的SQL查询

如何解决《如何保持引用以进行正确的SQL查询》经验，为你挑选了1个好方法。 ... [详细]

U友50081205_653

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章