有效地比较两个csv与+300000记录(用awk？)

作者：有风吹过best | 2023-09-06 17:07

如何解决《有效地比较两个csv与+300000记录(用awk？)》经验，为你挑选了1个好方法。

我有两个csv(A有30万行,B有1 000 000行).记录通过列ID(关系1-1)相关,但具有不同的列顺序且不按ID排序.我需要获得在A中缺少ID的70万行B.

A.csv

A.ID,A.Field01,A.Field02   
2,a,d                      
4,b,e                      
1,c,f

B.csv

B.Field01,B.ID,B.Field02 
g,2,f
f,4,r
h,6,k
a,1,3

(我想选择h,6,k)

我想我可以用像sqlite这样的sgbd来解决它,但我确信它可以用更简单,更高效的东西来完成,就像awk一样.

我想调整我发现的这个命令:

awk 'ARGIND==1 {x[$0]++; next} !x[$0]' B.csv A.csv

然而,这比较了整行,我不知道如何选择具体的A.ID和B.ID作为要比较的字段.

我也对任何其他有效的解决方法感兴趣!

干杯

1> James Brown..：

$ awk -F","  'FNR==NR{a[$1];next}!($2 in a)' a b
B.Field01,B.ID,B.Field02 
h,6,k

推荐阅读

程序员
Docker flask应用程序环境变量

如何解决《Dockerflask应用程序环境变量》经验，为你挑选了0个好方法。 ... [详细]
程序员
HTML5视频 - 如何无缝播放和/或循环播放多个视频？

如何解决《HTML5视频-如何无缝播放和/或循环播放多个视频？》经验，为你挑选了1个好方法。 ... [详细]
程序员
当光标在右列上方时如何滚动左列？

如何解决《当光标在右列上方时如何滚动左列？》经验，为你挑选了0个好方法。 ... [详细]
程序员
C# - 在Universal Apps中获取mac地址

如何解决《C#-在UniversalApps中获取mac地址》经验，为你挑选了2个好方法。 ... [详细]
程序员
Visual Studio 2015 JSX/ES2015语法高亮显示

如何解决《VisualStudio2015JSX/ES2015语法高亮显示》经验，为你挑选了4个好方法。 ... [详细]
程序员
在Spark中连接稀疏向量？

如何解决《在Spark中连接稀疏向量？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用union将字典添加到`set()`

如何解决《使用union将字典添加到`set()`》经验，为你挑选了2个好方法。 ... [详细]
程序员
杀死一个敌人会使每个敌人消失 - C#Unity

如何解决《杀死一个敌人会使每个敌人消失-C#Unity》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Windows上的Anaconda Python中安装Keras和Theano？

如何解决《如何在Windows上的AnacondaPython中安装Keras和Theano？》经验，为你挑选了4个好方法。 ... [详细]
程序员
TypeScript:继承类中静态方法的自引用返回类型

如何解决《TypeScript:继承类中静态方法的自引用返回类型》经验，为你挑选了1个好方法。 ... [详细]
程序员
我应该为我的API使用哪种身份验证策略？

如何解决《我应该为我的API使用哪种身份验证策略？》经验，为你挑选了1个好方法。 ... [详细]
程序员
找出给定键组合的相应转义序列

如何解决《找出给定键组合的相应转义序列》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何划分Redux Reducer与动作创建者之间的逻辑？

如何解决《如何划分ReduxReducer与动作创建者之间的逻辑？》经验，为你挑选了1个好方法。 ... [详细]
程序员
aspnet5 vNext(rc1)iis 8 - 糟糕的网关502.3

如何解决《aspnet5vNext(rc1)iis8-糟糕的网关502.3》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何重新连接控制台？

如何解决《如何重新连接控制台？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何从main.css文件中删除关键CSS

如何解决《如何从main.css文件中删除关键CSS》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在linux中两次打开文件？

如何解决《如何在linux中两次打开文件？》经验，为你挑选了1个好方法。 ... [详细]
程序员
来自Dynamic Linq的Execution-Deferred IQueryable <T>？

如何解决《来自DynamicLinq的Execution-DeferredIQueryable<T>？》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用psql时如何在postgres中选择模式？

如何解决《使用psql时如何在postgres中选择模式？》经验，为你挑选了5个好方法。 ... [详细]
程序员
如何在Java中交换两个对象？

如何解决《如何在Java中交换两个对象？》经验，为你挑选了1个好方法。 ... [详细]

有风吹过best

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章