当前位置:  开发笔记 > 编程语言 > 正文

如何打印匹配的行,紧靠其上方的一行和紧接下方的一行?

如何解决《如何打印匹配的行,紧靠其上方的一行和紧接下方的一行?》经验,为你挑选了4个好方法。

根据Bi提出的相关问题,我已经学会了如何打印匹配的线以及它下方的线.代码看起来很简单:

#!perl
open(FH,'FILE');
while ($line = ) {
    if ($line =~ /Pattern/) {
        print "$line";
        print scalar ;
    }
}

然后,我在谷歌搜索了一个不同的代码,可以打印匹配的行与它们正上方的行.部分适合我的目的的代码是这样的:

#!perl

@array;
open(FH, "FILE");
while (  ) {
  chomp;
  $my_line = "$_";
  if ("$my_line" =~ /Pattern/) {
      foreach( @array ){
          print "$_\n";
      }
      print "$my_line\n"
  }
  push(@array,$my_line);
  if ( "$#array" > "0" ) {
    shift(@array);
  }
};

问题是我仍然无法弄清楚如何一起做这些.似乎我的大脑正在关闭.有没有人有任何想法?

谢谢你的帮助.

更新:

我觉得我有点感动.你们这么有帮助!也许有点偏离主题,但我真的觉得有更多的冲动.

我需要一个Windows程序,能够搜索多个文件的内容并显示相关信息,而无需单独打开每个文件.我尝试使用谷歌搜索和两个应用程序,代理Ransack和Devas,已证明是有用的,但它们只显示包含匹配查询的行,我想要查看相邻的行.然后,即兴创作一个程序的想法突然出现在我脑海中.多年前,我对Perl脚本印象深刻,可以生成维基百科的Tomeraider格式,这样我就可以轻松地在我的Lifedrive上搜索Wiki,而且我也在网上读到了Perl很容易学习的地方,特别是像我这样的人没有任何编程语言的经验.然后我几天前就开始自学Perl了.我的第一步是学习如何完成与"Agent Ransack"相同的工作,并且使用Perl证明它并不那么困难.我首先学习了如何搜索单个文件的内容并通过修改标题为"Perl by Example"的书中使用的示例来显示匹配的行,但我被困在那里.我对如何处理多个文件变得完全无能为力.书中没有找到类似的例子,也可能是因为我太不耐烦了.然后我再次尝试谷歌搜索并被带到这里,我问了我的第一个问题"如何在Perl中搜索多个文件中的字符串模式?" 在这里,我必须说这个论坛是血腥的真棒;).然后我查看了更多示例脚本,然后我昨天提出了以下代码,它很好地满足了我原来的目的:

代码如下:

#!perl

$hits=0;
print "INPUT YOUR QUERY:";
chop ($query = );
$dir = 'f:/corpus/'; 
@files = <$dir/*>;
foreach $file (@files) {
open   (txt, "$file");

while($line = ) {
if ($line =~ /$query/i) {   
$hits++;
print "$file \n $line";     
print scalar ;
}
}
}
close(txt);
print "$hits RESULTS FOUND FOR THIS SEARCH\n";

在文件夹"corpus"中,我有很多文本文件,包括srt pdf doc文件,其中包含如下内容:

然后我甩了身体.

J'ai mis le corps dans unedécharge.

我知道你有电线.

Je sais que tu as un micro.

现在我告诉你实话.

Alors je vais te direlavérité.

基本上我只需要搜索英语短语并查看法语等效词,所以我昨天完成的脚本非常令人满意,除非如果我的脚本可以显示上面的行以便我想搜索法语短语并且会更好检查英语.所以我正在努力改进代码.实际上我知道"打印标量"是有缺陷的,但它很整洁,并且至少在大多数时间都能完成打印后续行的工作.我甚至期待另一个单行魔术线打印前一行而不是后续行.Perl似乎很有趣.我想我会花更多的时间来更好地理解它.正如daotoad所建议的那样,我将研究你们慷慨提供的代码.再次感谢你们!



1> Brian Rasmus..:

它可能更容易使用grep,因为它允许在匹配之前和之后打印线.分别使用-B-A打印匹配前后的上下文.请参阅http://ss64.com/bash/grep.html


我也是这么认为,但是那时OP并没有学到任何关于Perl的知识,除非**不要**用于所有事情.
+1为适合工作的工具.在这种情况下,如果`grep(1)`(从Perl的`grep()`函数中消除歧义)可用,则Perl不是_best_解决方案.此外,一个类似的(和更强大的(并在Perl中编写))工具将是'ack(1)`这是一个惊人的小程序.

2> daotoad..:

这是Pax的优秀答案的现代化版本:

use strict;
use warnings;

open( my $fh, '<', 'qq.in') 
    or die "Error opening file - $!\n";

my $this_line = "";
my $do_next = 0;

while(<$fh>) {
    my $last_line = $this_line;
    $this_line = $_;

    if ($this_line =~ /XXX/) {
        print $last_line unless $do_next;
        print $this_line;
        $do_next = 1;
    } else {
        print $this_line if $do_next;
        $last_line = "";
        $do_next = 0;
    }
}
close ($fh);

请参阅为什么使用词法文件句柄的三参数打开调用是Perl的最佳实践?讨论最重要变化的原因.

重要变化:

3个论点open.

词汇文件句柄

补充strictwarningspragma.

用词法范围声明的变量.

微小的变化(风格和个人品味的问题):

从修复后删除不需要的parens if

将if-not contstruct转换为unless.

如果您觉得这个答案有用,请务必向上投票Pax的原件.



3> paxdiablo..:

给定以下输入文件:

(1:first) Yes, this one.
(2) This one as well (XXX).
(3) And this one.
Not this one.
Not this one.
Not this one.
(4) Yes, this one.
(5) This one as well (XXX).
(6) AND this one as well (XXX).
(7:last) And this one.
Not this one.

这个小片段:

open(FH, ") {
    $last_line = $this_line;
    $this_line = $_;
    if ($this_line =~ /XXX/) {
        print $last_line if (!$do_next);
        print $this_line;
        $do_next = 1;
    } else {
        print $this_line if ($do_next);
        $last_line = "";
        $do_next = 0;
    }
}
close (FH);

产生以下,这是我认为你追求的:

(1:first) Yes, this one.
(2) This one as well (XXX).
(3) And this one.
(4) Yes, this one.
(5) This one as well (XXX).
(6) AND this one as well (XXX).
(7:last) And this one.

它基本上通过记住最后一行读取来工作,当它找到模式时,它输出它和模式行.然后它继续输出模式行加一个(带$do_next变量).

还有一点点诡计,以确保没有两次打印线.


请使用词法文件句柄和3参数打开.即使在像这样的短剧中,没有什么理由可以避免全局,IMO,最好通过练习养成良好的习惯.
好的,我发布了代码的"更新"版本.但是你应该得到明确,有效的实施.我所做的就是添加一些小调整.

4> mob..:

您总是希望存储您看到的最后一行,以防下一行包含您的图案并且您需要打印它.像在第二个代码片段中那样使用数组可能有点过分.

my $last = "";
while (my $line = ) {
  if ($line =~ /Pattern/) {
    print $last;
    print $line;
    print scalar ;  # next line
  }
  $last = $line;
}

推荐阅读
mobiledu2402851323
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有