3赞

AWK比较两个单独文件中的两列

作者：手机用户2402852307 | 2023-09-09 14:22

如何解决《AWK比较两个单独文件中的两列》经验，为你挑选了1个好方法。

我想比较两个文件,并做这样的事情:如果第一个文件中的第5列等于第二个文件中的第5列,我想打印第一个文件中的整行.那可能吗？我搜索了这个问题,但无法找到解决方案:(

文件由制表符分隔,我试过这样的事情:

zcat file1.txt.gz file2.txt.gz | awk -F'\t' 'NR==FNR{a[$5];next}$5 in a {print $0}'

有没有人试图做类似的事情？:)

在此先感谢您的帮助!

1> jas..：

你的脚本没问题,但你需要将每个文件单独提供给awk并按相反的顺序.

$ cat file1.txt
a b c d 100
x y z w 200
p q r s 300
1 2 3 4 400

$ cat file2.txt
. . . . 200
. . . . 400

$ awk 'NR==FNR{a[$5];next} $5 in a {print $0}' file2.txt file1.txt
x y z w 200
1 2 3 4 400

编辑:

正如评论中所指出的,上面的通用解决方案可以根据OP从压缩的制表符分隔文件开始的情况进行改进和定制:

$ awk -F'\t' 'NR==FNR{a[$5];next} $5 in a' <(zcat file2.txt) <(zcat file1.txt)
x y z w 200
1 2 3 4 400

说明:

NR是正在处理的当前记录的编号,FNR是其文件中当前记录的编号.因此NR == FNR,只有当awk处理给它的第一个文件(在我们的例子中是file2.txt)时才会这样.

a[$5]将第5列的值添加为数组的索引a.awk中的数组是关联数组,但通常你不关心关联一个值而只是想做一个很好的集合.这是一个简单的方法来收集我们在第一个文件的第5列中看到的所有值.接下来的next声明表示立即获取下一个可用记录而不再查看awk程序中的任何语句.

总结以上内容,这一行说"如果您正在读取第一个文件(file2.txt),请将第5列的值保存在所调用的数组中,a然后转到记录而不继续使用其余的awk程序."

NR == FNR { a[$5]; next }

希望从上面可以清楚地看出,我们可以通过awk程序第一行的唯一方法是读取第二个文件(在我们的例子中是file1.txt).

$5 in a如果第5列的值作为a数组中的索引出现,则求值为true .换句话说,对于file1.txt中的每个记录都是如此,我们在file2.txt的第5列中看到了第5列的值.

在awk中,当模式部分的计算结果为true时,将调用伴随的操作.如果没有给出操作,如下所示,则会触发默认操作,即只打印当前记录.因此,通过说 $5 in a,我们告诉awk打印file1.txt中的所有记录,其第5列也出现在file2.txt中,这当然是给定的要求.

$5 in a

因为它们是压缩文件,所以你可能想说'awk'...'<(zcat file2)<(zcat file1)`.此外,`{print $ 0}`在这里是多余的,'$ 5 in a'就足够了.

推荐阅读

程序员
如果它们存在于另一个列表中,如何更新List <Objects>中的所有重复项？

如何解决《如果它们存在于另一个列表中,如何更新List<Objects>中的所有重复项？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在发布数据时维护ViewBag值

如何解决《在发布数据时维护ViewBag值》经验，为你挑选了1个好方法。 ... [详细]
程序员
从bootstrap formhelper验证bootstrap datepicker

如何解决《从bootstrapformhelper验证bootstrapdatepicker》经验，为你挑选了0个好方法。 ... [详细]
程序员
scala中内部函数的占位符

如何解决《scala中内部函数的占位符》经验，为你挑选了1个好方法。 ... [详细]
程序员
React native Invariant Violation:id 2错误的回调

如何解决《ReactnativeInvariantViolation:id2错误的回调》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何转换DateTimeOffset？到C＃中的DateTime？

如何解决《如何转换DateTimeOffset？到C＃中的DateTime？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Jsfiddle的新UI破坏了我的角度和javascript小提琴

如何解决《Jsfiddle的新UI破坏了我的角度和javascript小提琴》经验，为你挑选了1个好方法。 ... [详细]
程序员
C++ Simple IF子句更改静态const char变量的值

如何解决《C++SimpleIF子句更改静态constchar变量的值》经验，为你挑选了1个好方法。 ... [详细]
程序员
具有变形的动态形式

如何解决《具有变形的动态形式》经验，为你挑选了1个好方法。 ... [详细]
程序员
反应 - material-ui appbar图标触摸事件不会触发

如何解决《反应-material-uiappbar图标触摸事件不会触发》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么`-1*x`比`-x`快？为什么？

如何解决《为什么`-1*x`比`-x`快？为什么？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在打字稿中一直使用.tsx而不是.ts是否有任何不足之处？

如何解决《在打字稿中一直使用.tsx而不是.ts是否有任何不足之处？》经验，为你挑选了2个好方法。 ... [详细]
程序员
std :: ref和swap函数似乎不能很好地协同工作

如何解决《std::ref和swap函数似乎不能很好地协同工作》经验，为你挑选了1个好方法。 ... [详细]
程序员
"base.html.twig"中的symfony2("没有"cssrewrite"filter.")

如何解决《"base.html.twig"中的symfony2("没有"cssrewrite"filter.")》经验，为你挑选了1个好方法。 ... [详细]
程序员
显示文件名称并在JTree中的文件夹下选择它

如何解决《显示文件名称并在JTree中的文件夹下选择它》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用React v0.14.3实现路由器

如何解决《使用Reactv0.14.3实现路由器》经验，为你挑选了0个好方法。 ... [详细]
程序员
Angularjs 2.0不加载templateUrl

如何解决《Angularjs2.0不加载templateUrl》经验，为你挑选了1个好方法。 ... [详细]
程序员
在OrderedDict中如何按特定属性排序？

如何解决《在OrderedDict中如何按特定属性排序？》经验，为你挑选了1个好方法。 ... [详细]
程序员
SurfaceView中的缩放和拖动功能

如何解决《SurfaceView中的缩放和拖动功能》经验，为你挑选了0个好方法。 ... [详细]
程序员
Xcode中关于iOS中fenceExemptQueue的奇怪警告

如何解决《Xcode中关于iOS中fenceExemptQueue的奇怪警告》经验，为你挑选了0个好方法。 ... [详细]

手机用户2402852307

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章