当前位置:  开发笔记 > 编程语言 > 正文

我应该使用正则表达式来解析我的文件,还是有更好的方法?

如何解决《我应该使用正则表达式来解析我的文件,还是有更好的方法?》经验,为你挑选了1个好方法。

我有一个超过2000行的文件,我需要解析.我想确保获得100%准确的结果,然后将其导入我的MariaDB.

该文件如下所示:

line 0: #start#
line 1: 20111211\200000
line 2: n=john|l=smith,131_stree_apt#102_city_state_11111_country,19989989988|17771112222,user%64domain.com,12,21,551|626|23\r
...
line 2156: #end#

所以第1行是24h格式的日期时间第2行是行格式:

n =名字

l =姓氏

完整地址

手机+手机

电子邮件

总目标

总票数

在冰上的时间+在板凳上的时间

阴谋纪要

我无法弄清楚正则表达式.我的另一个想法是解析每一行,然后解析每个逗号,然后解析每个管道等,但我认为这种方法比正则表达式慢,而且不太准确.我对吗?



1> middus..:

我无法弄清楚正则表达式,所以我的想法是解析每一行,然后解析每个逗号,然后每个管道然后......我认为这是缓慢的,然后不那么准确,然后regexp

你为什么不去试试呢?不要让这个讽刺你,大胆.一般来说,如果我是你,我会做以下事情:

    做一个简单的实现

    测试一下

    调整它

〜2000条记录并不是那么多,所以甚至可能不需要第三步(特别是如果这是一次只运行一次的迁移 - 那么如果需要2分钟呢?).

顺便说一句:这是一般的编程建议,适用于很多问题.不要过早优化.

推荐阅读
农大军乐团_697
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有