我有一个超过2000行的文件,我需要解析.我想确保获得100%准确的结果,然后将其导入我的MariaDB.
该文件如下所示:
line 0: #start# line 1: 20111211\200000 line 2: n=john|l=smith,131_stree_apt#102_city_state_11111_country,19989989988|17771112222,user%64domain.com,12,21,551|626|23\r ... line 2156: #end#
所以第1行是24h格式的日期时间第2行是行格式:
n =名字
l =姓氏
完整地址
手机+手机
电子邮件
总目标
总票数
在冰上的时间+在板凳上的时间
阴谋纪要
我无法弄清楚正则表达式.我的另一个想法是解析每一行,然后解析每个逗号,然后解析每个管道等,但我认为这种方法比正则表达式慢,而且不太准确.我对吗?
我无法弄清楚正则表达式,所以我的想法是解析每一行,然后解析每个逗号,然后每个管道然后......我认为这是缓慢的,然后不那么准确,然后regexp
你为什么不去试试呢?不要让这个讽刺你,大胆.一般来说,如果我是你,我会做以下事情:
做一个简单的实现
测试一下
调整它
〜2000条记录并不是那么多,所以甚至可能不需要第三步(特别是如果这是一次只运行一次的迁移 - 那么如果需要2分钟呢?).
顺便说一句:这是一般的编程建议,适用于很多问题.不要过早优化.