当前位置:  开发笔记 > 编程语言 > 正文

如何使用gawk多次通过?

如何解决《如何使用gawk多次通过?》经验,为你挑选了1个好方法。

我正在尝试使用CYGWIN中的GAWK来处理csv文件.通过1找到最大值,通过2打印匹配最大值的记录.我正在使用.awk文件作为输入.当我使用手册中的文本时,它在两次传递中都匹配.我可以使用IF形式作为解决方法,但这迫使我在每个模式匹配中使用IF,这是一种痛苦.知道我做错了什么吗?

这是我的.awk文件:

pass == 1
{
    print "pass1 is", pass;  
}    

pass == 2
{
if(pass == 2)
    print "pass2 is", pass;  
}    

这是我的输出(输入文件只是"你好"):

hello
pass1 is 1
pass1 is 2
hello
pass2 is 2

这是我的命令行:

gawk -F , -f test.awk pass=1 x.txt pass=2 x.txt

我很感激任何帮助.



1> F. Knorr..:

(g)awk解决方案可能如下所示:

awk 'FNR == NR{print "1st pass"; next}
     {print "second pass"}' x.txt x.txt

(请更换awkgawk,如果必要的.)
比方说,你想搜索的文件的第一列中的最大值x.txt,然后打印已在第一列中这个值的所有行,你的程序可能是这样的(感谢给埃德莫顿的一些提示,请参阅评论):

awk -F"," 'FNR==NR {max = ( (FNR==1) || ($1 > max) ? $1 : max ); next}
           $1==max'  x.txt x.txt

输出x.txt:

6,5
2,6
5,7
6,9

6,5
6,9

这是如何运作的?变量NR随每条记录不断增加,而在读取新文件时FNR重置为1.因此,FNR==NR仅适用于处理的第一个文件.


那个剧本里没有什么特别的傻瓜.为了避免要求max> = 0并使你的脚本可以移植到所有awks(某些awks在某些情况下会失败,并且更容易阅读),将测试更改为`FNR == NR {max =(( FNR == 1)||($ 1> max)?$ 1:max); 接下来}`.无论何时进行最小值或最大值计算,读取第一个值的种子,都不要假定/带有一些随机值的种子,如零.您可以而且应该删除`{print $ 0}`,因为这是条件为真时的默认操作.
推荐阅读
手机用户2502852037
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有