什么是高性能,可扩展的方法来解析来自http://bit.ly的链接

作者：mobiledu2402851173 | 2023-06-21 18:27

如何解决《什么是高性能,可扩展的方法来解析来自http://bit.ly的链接》经验，为你挑选了1个好方法。

鉴于来自流的一系列URL,数百万可能是bit.ly,google或tinyurl缩短链接,解决这些问题以获得最终网址的最具扩展性的方法是什么？

多线程爬虫在每个短链接上执行HEAD请求,同时缓存您已经解决的那些？有没有提供此服务的服务？

也是因为没有阻止网址缩短服务.假设规模是每天2000万缩短的网址.

1> Rex Kerr..：

Google 提供了一个API.bit.ly也是如此(并且bit.ly要求通知大量使用,并指明它们对光的使用意味着什么).我不知道tinyurl(用于解码)的适当API,但可能有一个.

然后,您必须获取每秒230个URL的顺序,以跟上您所需的费率.我将测量每个服务的典型延迟,并根据需要创建一个主actor和多个worker actor,这样actor就可以阻止查找.(我会使用Akka,而不是默认的Scala actor,并确保每个worker actor都有自己的线程!)

你也应该在本地缓存答案; 查找已知答案比查询这些服务要快得多.(主演员应该照顾好.)

在那之后,如果你仍然因为网站的限制而无法跟上,你最好还是与网站交谈,或者你必须做一些相当可疑的事情(租用一堆廉价的服务器)不同的站点并向他们提出请求).

推荐阅读

程序员
ScrollView未显示第一个项目

如何解决《ScrollView未显示第一个项目》经验，为你挑选了1个好方法。 ... [详细]
程序员
用于参数检查和其他偏执狂的常见Lisp习语？

如何解决《用于参数检查和其他偏执狂的常见Lisp习语？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用wifi直接和使用wifi热点共享文件之间的区别

如何解决《使用wifi直接和使用wifi热点共享文件之间的区别》经验，为你挑选了0个好方法。 ... [详细]
程序员
如果没有第二次调用服务器,请求确认IdentityServer 3不支持自定义声明

如何解决《如果没有第二次调用服务器,请求确认IdentityServer3不支持自定义声明》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何通过子树合并将git存储库与子模块合并到另一个子模块中？

如何解决《如何通过子树合并将git存储库与子模块合并到另一个子模块中？》经验，为你挑选了0个好方法。 ... [详细]
程序员
不能将字符串数组声明为类成员

如何解决《不能将字符串数组声明为类成员》经验，为你挑选了1个好方法。 ... [详细]
程序员
在matlab中运行矩阵的均值

如何解决《在matlab中运行矩阵的均值》经验，为你挑选了1个好方法。 ... [详细]
程序员
警告"使用构建变体包中的属性"是什么意思？

如何解决《警告"使用构建变体包中的属性"是什么意思？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用相同的配置部署多个Content Delivery Server

如何解决《使用相同的配置部署多个ContentDeliveryServer》经验，为你挑选了1个好方法。 ... [详细]
程序员
Hamcrest匹配器比较JSON的双值

如何解决《Hamcrest匹配器比较JSON的双值》经验，为你挑选了0个好方法。 ... [详细]
程序员
d3.select.style没有在firefox上工作

如何解决《d3.select.style没有在firefox上工作》经验，为你挑选了1个好方法。 ... [详细]
程序员
单击动态生成的跨度

如何解决《单击动态生成的跨度》经验，为你挑选了1个好方法。 ... [详细]
程序员
Play framework 2.4:NoClassDefFoundError:play/api/cache/CachePlugin

如何解决《Playframework2.4:NoClassDefFoundError:play/api/cache/CachePlugin》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么nullptr_t不是关键字

如何解决《为什么nullptr_t不是关键字》经验，为你挑选了1个好方法。 ... [详细]
程序员
C#:为什么x的最终值与for循环外的值不同？

如何解决《C#:为什么x的最终值与for循环外的值不同？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Laravel 5.1和VueJS的TokenMismatchException

如何解决《使用Laravel5.1和VueJS的TokenMismatchException》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Webpack通过NPM包含Zurb Foundation

如何解决《使用Webpack通过NPM包含ZurbFoundation》经验，为你挑选了1个好方法。 ... [详细]
程序员
什么是在矩阵中找到M个相邻元素的最大总和的最快方法

如何解决《什么是在矩阵中找到M个相邻元素的最大总和的最快方法》经验，为你挑选了0个好方法。 ... [详细]
程序员
SQL语法和OR子句问题

如何解决《SQL语法和OR子句问题》经验，为你挑选了1个好方法。 ... [详细]

mobiledu2402851173

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章