5赞

awk/sed/grep删除与另一个文件中的字段匹配的行

作者：贾志军 | 2023-09-08 11:57

如何解决《awk/sed/grep删除与另一个文件中的字段匹配的行》经验，为你挑选了0个好方法。

我有一个file1,有几行(十行),一个更长的file2(~500,000行).尽管存在相同的字段子集,但每个文件中的行不相同.我想从file1中的每一行获取字段3-5,并搜索file2以获得相同的模式(只有这三个字段,按相同顺序 - 在file2中,它们属于字段2-4).如果找到任何匹配项,那么我想从file1中删除相应的行.

例如,file1:

2016-01-06T05:38:31 2016-01-06T05:23:33 2016006 120E A TM Current
2016-01-06T07:34:01 2016-01-06T07:01:51 2016006 090E B TM Current
2016-01-06T07:40:44 2016-01-06T07:40:41 2016006 080E A TM Alt
2016-01-06T07:53:50 2016-01-06T07:52:14 2016006 090E A TM Current
2016-01-06T08:14:45 2016-01-06T08:06:33 2016006 080E C TM Current

文件2:

2016-01-06T07:35:06.87 2016003 100E C NN Current 0
2016-01-06T07:35:09.97 2016003 100E B TM Current 6303
2016-01-06T07:36:23.12 2016004 030N C TM Current 0
2016-01-06T07:37:57.36 2016006 090E A TM Current 399
2016-01-06T07:40:29.61 2016006 010N C TM Current 0

......(以及500,000行)

所以在这种情况下,我想删除file1的第四行(就地).

以下是我要删除的行:

grep "$(awk '{print $3,$4,$5}' file1)" file2

因此,一种解决方案可能是将其传输到sed,但我不清楚如何在sed中设置匹配模式来自管道输入.在网上搜索建议awk可能会完成所有这些(或者也许是sed或其他东西),所以想知道什么是干净的解决方案.

此外,速度有点重要,因为其他进程可能会尝试修改文件(我知道这可能会带来更多的复杂性......).匹配通常位于file2的末尾,而不是开头(如果有一些方法可以从下往上搜索file2).

推荐阅读

程序员
测试Jersey应用程序,使用Jersey Injection内置框架(HK2)注入类

如何解决《测试Jersey应用程序,使用JerseyInjection内置框架(HK2)注入类》经验，为你挑选了1个好方法。 ... [详细]
程序员
Google Developer Console点击启用API会显示"无法加载"错误

如何解决《GoogleDeveloperConsole点击启用API会显示"无法加载"错误》经验，为你挑选了0个好方法。 ... [详细]
程序员
是否存在限制解决方案的访问修饰符？

如何解决《是否存在限制解决方案的访问修饰符？》经验，为你挑选了1个好方法。 ... [详细]
程序员
什么会导致Tomcat(v8)具有周期性规律性的CPU峰值

如何解决《什么会导致Tomcat(v8)具有周期性规律性的CPU峰值》经验，为你挑选了1个好方法。 ... [详细]
程序员
Sonatype Nexus Pro中部署,升级和发布有什么区别？

如何解决《SonatypeNexusPro中部署,升级和发布有什么区别？》经验，为你挑选了0个好方法。 ... [详细]
程序员
无法通过CMake找到Eigen3

如何解决《无法通过CMake找到Eigen3》经验，为你挑选了1个好方法。 ... [详细]
程序员
嵌套RecyclerView的Espresso Matcher

如何解决《嵌套RecyclerView的EspressoMatcher》经验，为你挑选了1个好方法。 ... [详细]
程序员
Gemfile在除一个环境之外的所有环境中都需要gem

如何解决《Gemfile在除一个环境之外的所有环境中都需要gem》经验，为你挑选了0个好方法。 ... [详细]
程序员
std :: weak_ptr:lock或shared_ptr构造函数？

如何解决《std::weak_ptr:lock或shared_ptr构造函数？》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法解析Manifest.permission.ACCESS_FINE_LOCATION

如何解决《无法解析Manifest.permission.ACCESS_FINE_LOCATION》经验，为你挑选了4个好方法。 ... [详细]
程序员
为什么我的BroadcastHashJoin比Spark中的ShuffledHashJoin慢

如何解决《为什么我的BroadcastHashJoin比Spark中的ShuffledHashJoin慢》经验，为你挑选了1个好方法。 ... [详细]
程序员
如果异常不为null,则Nlog输出字符

如何解决《如果异常不为null,则Nlog输出字符》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何将分割更改为R中的水平分割？

如何解决《如何将分割更改为R中的水平分割？》经验，为你挑选了1个好方法。 ... [详细]
程序员
pandas.read_csv中dtype和转换器之间有什么区别？

如何解决《pandas.read_csv中dtype和转换器之间有什么区别？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何迭代Pandas中的MultiIndex级别？

如何解决《如何迭代Pandas中的MultiIndex级别？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Matplotlib只是给出错误消息

如何解决《Matplotlib只是给出错误消息》经验，为你挑选了1个好方法。 ... [详细]
程序员
未找到本机DLL

如何解决《未找到本机DLL》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Ext.panel.Tool中使用字体awesome

如何解决《如何在Ext.panel.Tool中使用字体awesome》经验，为你挑选了1个好方法。 ... [详细]
程序员
SaveTo StringHelper？

如何解决《SaveToStringHelper？》经验，为你挑选了1个好方法。 ... [详细]
程序员
CakePHP错误:在Acl中找不到类'String'

如何解决《CakePHP错误:在Acl中找不到类'String'》经验，为你挑选了1个好方法。 ... [详细]

贾志军

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章