任何人都有任何C#代码来解析robots.txt并对其进行评估

作者：php | 2023-08-29 15:37

如何解决《任何人都有任何C#代码来解析robots.txt并对其进行评估》经验，为你挑选了1个好方法。

简短的问题:

有没有人有任何C#代码来解析robots.txt,然后针对它评估URLS,所以看看它们是否会被排除.

长问题:

我一直在为一个尚未发布到谷歌的新网站创建一个站点地图.站点地图有两种模式,一种是用户模式(如传统的站点地图)和一种"管理"模式.

管理员模式将显示网站上所有可能的URL,包括特定外部合作伙伴的自定义条目URL或URL,例如example.com/oprah在Oprah上看到我们网站的任何人.我想跟踪Excel电子表格以外的其他地方发布的链接.

我不得不假设有人可能会/oprah在他们的博客或某个地方发布链接.我们实际上并不希望将这个"迷你oprah网站"编入索引,因为这会导致非oprah观众能够找到特殊的Oprah优惠.

所以在我创建站点地图的同时,我还添加了URLS,/oprah以便从我们的robots.txt文件中排除.

然后(这是实际问题)我认为"能够在站点地图上显示文件是否被索引并且对机器人可见"不是很好.这很简单 - 只需解析robots.txt然后评估一个链接.

然而,这是一个"奖励功能",我当然没有时间去写它(甚至认为它可能不那么复杂) - 所以我想知道是否有人已经编写任何代码来解析robots.txt？

1> realMarkusSc..：

讨厌说,但只是谷歌"C#robots.txt解析器",然后点击第一个命中.这是一篇关于用C#实现的简单搜索引擎的CodeProject文章,称为"Searcharoo",它包含一个类Searcharoo.Indexer.RobotsTxt,描述如下:

检查并在网站上下载并解析robots.txt文件(如果有)

为Spider提供一个界面,以根据robots.txt规则检查每个Url

哎呀.我承认这次我没有搜索谷歌.但具有讽刺意味的是,这个问题现在是'c#robots.txt'的第一场比赛:-)我会看看我是否可以从中提取我需要的东西.谢谢

推荐阅读

程序员
在我调用delete,c ++之后仍然可以访问值

如何解决《在我调用delete,c++之后仍然可以访问值》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使AutoMoqCustomization使用Strict MockBehavior？

如何解决《如何使AutoMoqCustomization使用StrictMockBehavior？》经验，为你挑选了0个好方法。 ... [详细]
程序员
与dplyr和所有的奇怪

如何解决《与dplyr和所有的奇怪》经验，为你挑选了1个好方法。 ... [详细]
程序员
处理回归(机器学习)中的未分配(null)特征值？

如何解决《处理回归(机器学习)中的未分配(null)特征值？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在C中的char数组中添加char/int？

如何解决《如何在C中的char数组中添加char/int？》经验，为你挑选了1个好方法。 ... [详细]
程序员
从VSTS版本管理部署WebSite构建到Azure

如何解决《从VSTS版本管理部署WebSite构建到Azure》经验，为你挑选了2个好方法。 ... [详细]
程序员
iOS9"游戏中心无法识别此游戏."

如何解决《iOS9"游戏中心无法识别此游戏."》经验，为你挑选了3个好方法。 ... [详细]
程序员
如何将我的远程git存储库还原为某个提交？

如何解决《如何将我的远程git存储库还原为某个提交？》经验，为你挑选了1个好方法。 ... [详细]
程序员
将\ in(是集合的成员)表示法添加到qplot中

$将\ in(是集合的成员)表示法添加到qplot中$

如何解决《将\in(是集合的成员)表示法添加到qplot中》经验，为你挑选了1个好方法。 ... [详细]
程序员
null和undefined不一致的比较

如何解决《null和undefined不一致的比较》经验，为你挑选了1个好方法。 ... [详细]
程序员
deleteRowsAtIndexPaths:滑动删除行永远不会释放单元格？

如何解决《deleteRowsAtIndexPaths:滑动删除行永远不会释放单元格？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何使用Java加载纸莎草uml模型？

如何解决《如何使用Java加载纸莎草uml模型？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何搜索有人用git更改的字符串？

如何解决《如何搜索有人用git更改的字符串？》经验，为你挑选了0个好方法。 ... [详细]
程序员
BouncyCastle现在更新了pgp密钥,导致校验和不匹配错误

如何解决《BouncyCastle现在更新了pgp密钥,导致校验和不匹配错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
将SEXP从R转换为C++中的字符串向量

如何解决《将SEXP从R转换为C++中的字符串向量》经验，为你挑选了1个好方法。 ... [详细]
程序员
C#6 null传播当object为null时设置的值

如何解决《C#6null传播当object为null时设置的值》经验，为你挑选了2个好方法。 ... [详细]
程序员
iOS Swift:从两个Int创建Float值

如何解决《iOSSwift:从两个Int创建Float值》经验，为你挑选了1个好方法。 ... [详细]
程序员
寻找对应于最小特征值的特征向量

如何解决《寻找对应于最小特征值的特征向量》经验，为你挑选了1个好方法。 ... [详细]
程序员
NPM安装与package.json在提取 - > gunzTarPerm期间退出,没有错误消息

如何解决《NPM安装与package.json在提取->gunzTarPerm期间退出,没有错误消息》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Google BigQuery中选择除一些以外的所有列？

如何解决《在GoogleBigQuery中选择除一些以外的所有列？》经验，为你挑选了2个好方法。 ... [详细]

php

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章