用于.NET的HTML解析库

作者：jerry613 | 2023-08-29 12:14

如何解决《用于.NET的HTML解析库》经验，为你挑选了1个好方法。

我正在寻找解析HTML的库来提取链接,表单,标签等.

http://www.majestic12.co.uk/projects/html_parser.php

http://www.netomatix.com/Products/DocumentManagement/HtmlParserNet.aspx

http://www.developer.com/net/csharp/article.php/2230091

LGPL或任何其他商业开发友好许可证是优选的.

你有过这个图书馆的经验吗？或者你能推荐另一个类似的图书馆？

1> Marc Gravell..：

该HTML敏捷性包恰好有这种类型的事情的例子,使用XPath熟悉的查询-例如(从主页),找到所有链接很简单:

foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a@href")) {
    //...
}

编辑

截至2012年6月19日,上面的代码以及HTML Agility Pack示例页面上显示的唯一代码示例将不起作用.只需稍微调整,如下所示.

HtmlDocument doc = new HtmlDocument();
doc.Load("file.htm");

foreach (HtmlNode link in doc.DocumentNode.SelectNodes("//a[@href]"))
{
  HtmlAttribute att = link.Attributes["href"];
  att.Value = Foo(att); // fix the link
}
doc.Save("file.htm");

HTML Agility Pack很棒,我也推荐它.

同意.我们在生产环境中使用它,我们在几年内解析了大约50,000(X)个HTML文件/小时.工作得很好.

推荐阅读

程序员
typedef中C样式数组的维度

如何解决《typedef中C样式数组的维度》经验，为你挑选了1个好方法。 ... [详细]
程序员
列出Drive中的所有文件

如何解决《列出Drive中的所有文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Express Router中使用multer进行文件上传

如何解决《在ExpressRouter中使用multer进行文件上传》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何使用Lazy处理并发请求？

如何解决《如何使用Lazy处理并发请求？》经验，为你挑选了1个好方法。 ... [详细]
程序员
默认方法中的自动构造函数匹配

如何解决《默认方法中的自动构造函数匹配》经验，为你挑选了1个好方法。 ... [详细]
程序员
Python中无限循环可用吗？

如何解决《Python中无限循环可用吗？》经验，为你挑选了3个好方法。 ... [详细]
程序员
无法读取非ASCII内容

如何解决《无法读取非ASCII内容》经验，为你挑选了1个好方法。 ... [详细]
程序员
转移/减少java杯中的冲突 - 悬空其他问题

如何解决《转移/减少java杯中的冲突-悬空其他问题》经验，为你挑选了1个好方法。 ... [详细]
程序员
什么是cp:在Unix中无法统计错误,我在尝试将东西从一个文件夹复制到另一个文件夹时出现此错误

如何解决《什么是cp:在Unix中无法统计错误,我在尝试将东西从一个文件夹复制到另一个文件夹时出现此错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何将参数传递给Dockerfile？

如何解决《如何将参数传递给Dockerfile？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在分类机器学习算法中发现新类？

如何解决《如何在分类机器学习算法中发现新类？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何检查re.sub()是否已在python中成功替换？

如何解决《如何检查re.sub()是否已在python中成功替换？》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何最小化来自imageView TVOS Focus CollectionView Swift的阴影

如何解决《如何最小化来自imageViewTVOSFocusCollectionViewSwift的阴影》经验，为你挑选了0个好方法。 ... [详细]
程序员
IllegalArgumentException:不支持addAccount

如何解决《IllegalArgumentException:不支持addAccount》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何检查字符串的最后一个字符是否等于Swift中的"a"

如何解决《如何检查字符串的最后一个字符是否等于Swift中的"a"》经验，为你挑选了1个好方法。 ... [详细]
程序员
字符/数字的乘法可以更高效吗？

如何解决《字符/数字的乘法可以更高效吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Jetty Websockets-应该如何使用sendPing和sendPong？

如何解决《JettyWebsockets-应该如何使用sendPing和sendPong？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Graphicsmagick C++ API

如何解决《GraphicsmagickC++API》经验，为你挑选了1个好方法。 ... [详细]
程序员
用Angular设置Express

如何解决《用Angular设置Express》经验，为你挑选了1个好方法。 ... [详细]
程序员
(Jade或Slim)类似于React的语法？

如何解决《(Jade或Slim)类似于React的语法？》经验，为你挑选了1个好方法。 ... [详细]

jerry613

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章