10赞

使用python包含汉字的文件读写末尾加上特定字符方法介绍

作者：雯颜哥_135 | 2021-09-03 07:25

这篇文章讲述使用python包含汉字的文件读写末尾加上特定字符方法介绍

在数据挖掘中，原始文件的格式往往是令人抓狂，很重要的一步是对数据文件的格式进行整理。

最近，接手的项目里，提供的数据文件格式简直让人看不下去，使用pandas打不开，一直是io error.仔细查看，发现文件中很多行数据是以"结尾，然而其他行缺失，因而需求也就很明显了：判断每行的结尾是否有"，没有的话，加上就好了。

采用倒叙的方式好了，毕竟很多人需要的只是一个快速的解决方案，而不是一个why. 解决方案如下：

b = open('b_file.txt', w)
with open('a_file.txt', 'r') as lines:
    for line in lines:
        line = line.strip()
        if not line.endswith(r'"'):
            line += r'"'
        line += '\n'
        b.write(line)

b.close()
a.close()

其中整个过程的关键在于

line = line.strip()

　　之前我偷懒，直接使用省去了上面那行，结果在判断条件栽了跟头，程序认为每一行都不是以"结尾：

if not line.endswith(r'"')

硬着头皮试上去，重写：

for line in open(data_path+'heheda.txt', 'r'):
    if not line[-2] == r'"':
        print line
        line = line[:-1] + r'"' + line[-1:]
        print line

此时判断条件为 if not line[-2] == r'"'，这样才能得到除最后一行之外的正确结果。众所周知的原因，在windows系统中，文件的回车符是"\r\n"，因而，在没有strip()处理好回车符的时候，需要手动在每一行的结尾前移一个字节进行判断每行的末尾。而对于文件的最后一行，一般情况下不是回车符作为结尾，毕竟不要换行了嘛。因而line[-2]则定位到了最后一个汉字的中间，将\xx\xx，硬写成了\xx"\xx，使得最后一个字显示错误。

以上就是使用python包含汉字的文件读写末尾加上特定字符方法介绍的详细内容，更多请关注第一PHP社区其它相关文章！

推荐阅读

程序员
什么是？MODULE

如何解决《什么是？MODULE》经验，为你挑选了1个好方法。 ... [详细]
程序员
常规过程/方法指针

如何解决《常规过程/方法指针》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在LINQ查询的where子句中将方法/函数作为IEnumerable对象调用

如何解决《如何在LINQ查询的where子句中将方法/函数作为IEnumerable对象调用》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何将此SQL语句转换为PostgreSQL？

如何解决《如何将此SQL语句转换为PostgreSQL？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在张量流中将3通道掩模应用于3通道Tensor

如何解决《在张量流中将3通道掩模应用于3通道Tensor》经验，为你挑选了1个好方法。 ... [详细]
程序员
安装自定义构建heroku并使用库路径发出问题

如何解决《安装自定义构建heroku并使用库路径发出问题》经验，为你挑选了1个好方法。 ... [详细]
程序员
重载Extraction和Insertion << >> operator c ++

如何解决《重载Extraction和Insertion<<>>operatorc++》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何为TensorFlow变量赋值？

如何解决《如何为TensorFlow变量赋值？》经验，为你挑选了3个好方法。 ... [详细]
程序员
Flexbox调整复选框的大小(太小)

如何解决《Flexbox调整复选框的大小(太小)》经验，为你挑选了1个好方法。 ... [详细]
程序员
有没有办法在Visual Studio Code中生成JSDoc注释

如何解决《有没有办法在VisualStudioCode中生成JSDoc注释》经验，为你挑选了3个好方法。 ... [详细]
程序员
Visual Studio 2015 - 在重新启动Visual Studio之前,ASP.Net应用程序不会启动

如何解决《VisualStudio2015-在重新启动VisualStudio之前,ASP.Net应用程序不会启动》经验，为你挑选了1个好方法。 ... [详细]
程序员
模拟对象不起作用

如何解决《模拟对象不起作用》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用游标在不同的数据库中创建过程

如何解决《如何使用游标在不同的数据库中创建过程》经验，为你挑选了0个好方法。 ... [详细]
程序员
Elasticsearch搜索的结果多种多样

如何解决《Elasticsearch搜索的结果多种多样》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java字符串不可变

如何解决《Java字符串不可变》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Python和Regex提取不同格式的日期

如何解决《使用Python和Regex提取不同格式的日期》经验，为你挑选了0个好方法。 ... [详细]
程序员
用于在Python中更新共享字典的多处理模块

如何解决《用于在Python中更新共享字典的多处理模块》经验，为你挑选了0个好方法。 ... [详细]
程序员
grid.Call出错(L_textBounds,as.graphicsAnnot(x $ label),x $ x,x $ y,:找不到多边形边缘(新)

如何解决《grid.Call出错(L_textBounds,as.graphicsAnnot(x$label),x$x,x$y,:找不到多边形边缘(新)》经验，为你挑选了0个好方法。 ... [详细]
程序员
更新到Angular 2后,无法在Firefox上通过Protractor运行Selenium

如何解决《更新到Angular2后,无法在Firefox上通过Protractor运行Selenium》经验，为你挑选了1个好方法。 ... [详细]
程序员
当前网址app /与其中任何一个都不匹配

如何解决《当前网址app/与其中任何一个都不匹配》经验，为你挑选了2个好方法。 ... [详细]

雯颜哥_135

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章