9赞

使用或不使用链接匹配HTML的正则表达式

作者：地之南_816 | 2023-09-10 18:53

如何解决《使用或不使用链接匹配HTML的正则表达式》经验，为你挑选了1个好方法。

我想能够在页面中显示的HTML块中获取"Target":


                  Target

我可以指望可靠的间距.我不能指望的是"目标"将始终包含在锚标记中.有时,它看起来像这样:


                    Target

我可以匹配第一个版本并使用此正则表达式轻松提取"目标":

/\s+\s+(.*)\s+<\/a>\s+<\/h3>/

但是我很难写出一个能与之匹敌的东西.有任何想法吗？

1> Quentin..：

不要使用正则表达式来解析HTML.在大多数情况下,它更值得痛苦.使用旨在解析HTML的库.

#!/usr/bin/perl

use v5.16;
use strict;
use warnings;
use HTML::TreeBuilder;

my $data = qq{
              Target
            
};

my $otherdata = qq{
              Target
            
};

my $t = HTML::TreeBuilder->new_from_content($data);
say $t->look_down(_tag => "h3")->as_text();


$t = HTML::TreeBuilder->new_from_content($otherdata);
say $t->look_down(_tag => "h3")->as_text();

HTML解析器通常仍然更好地处理HTML的小片段而不是正则表达式.

推荐阅读

程序员
在Symfony 3.0中给出"string","Vendor\NameBundle\Form\EntitynameType"类型的预期参数

如何解决《在Symfony3.0中给出"string","Vendor\NameBundle\Form\EntitynameType"类型的预期参数》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在没有循环的情况下将list转换为字符串,在Python中将join()转换为

如何解决《如何在没有循环的情况下将list转换为字符串,在Python中将join()转换为》经验，为你挑选了1个好方法。 ... [详细]
程序员
没有表达式或条件的cfif语句

如何解决《没有表达式或条件的cfif语句》经验，为你挑选了1个好方法。 ... [详细]
程序员
SETEX错误 - "使用封闭网络连接"

如何解决《SETEX错误-"使用封闭网络连接"》经验，为你挑选了1个好方法。 ... [详细]
程序员
与鼠标轮的水平的纸卷在水平的名单上

如何解决《与鼠标轮的水平的纸卷在水平的名单上》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何在单击angularjs时调用两个函数

如何解决《如何在单击angularjs时调用两个函数》经验，为你挑选了2个好方法。 ... [详细]
程序员
将DDL与SELECT混合使用时,"错误:缓存计划不得更改结果类型"

如何解决《将DDL与SELECT混合使用时,"错误:缓存计划不得更改结果类型"》经验，为你挑选了1个好方法。 ... [详细]
程序员
if语句是多余的java

如何解决《if语句是多余的java》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何在python中模拟/修补装饰器？

如何解决《如何在python中模拟/修补装饰器？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Q学习与时间差异与基于模型的强化学习

如何解决《Q学习与时间差异与基于模型的强化学习》经验，为你挑选了1个好方法。 ... [详细]
程序员
python paramiko等待完成执行命令

如何解决《pythonparamiko等待完成执行命令》经验，为你挑选了1个好方法。 ... [详细]
程序员
通过环境变量在Spring Boot中设置日志级别

如何解决《通过环境变量在SpringBoot中设置日志级别》经验，为你挑选了3个好方法。 ... [详细]
程序员
获得Eloquent Model Laravel 5.1的原始属性

如何解决《获得EloquentModelLaravel5.1的原始属性》经验，为你挑选了4个好方法。 ... [详细]
程序员
将std :: map转换为Rcpp :: List？

如何解决《将std::map转换为Rcpp::List？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java发送电子邮件避免smtp中继服务器并直接发送到MX服务器

如何解决《Java发送电子邮件避免smtp中继服务器并直接发送到MX服务器》经验，为你挑选了1个好方法。 ... [详细]
程序员
API接口不得扩展其他接口Retrofit 2

如何解决《API接口不得扩展其他接口Retrofit2》经验，为你挑选了1个好方法。 ... [详细]
程序员
设备锁定时NSTimer不起作用

如何解决《设备锁定时NSTimer不起作用》经验，为你挑选了1个好方法。 ... [详细]
程序员
Swift 2.1错误"二进制运算符||不能应用于两个Bool操作数"

如何解决《Swift2.1错误"二进制运算符||不能应用于两个Bool操作数"》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java消费群失踪了吗？

如何解决《Java消费群失踪了吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
我如何将此int转换为十进制格式

如何解决《我如何将此int转换为十进制格式》经验，为你挑选了1个好方法。 ... [详细]

地之南_816

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章