ActionScript3中的蜘蛛

作者：李桂平2402851397 | 2023-06-17 15:26

如何解决《ActionScript3中的蜘蛛》经验，为你挑选了1个好方法。

理论上可以在不使用服务器端中间件技术的情况下在ActionScript3中构建蜘蛛吗？没有什么非常先进的(只访问HTML页面并将HTML作为文本返回到swf).

1> weltraumpira..：

编辑 (问题已更新为更具体)

没有有效的策略文件,您无法访问随机域.但是您可以使用ExternalInterface并设置allowScriptAccess = always以在另一个浏览器框架中打开页面并通过JavaScript传递结果数据.

原始答案

从理论上讲,任何可以加载和解析网页的语言都可以用来抓取它们 - 问题是:你想要吗？

这里有几点需要考虑:

Flash/Flex主要用于客户端应用程序,即提供精细UI功能和/或可视化的程序.虽然它已经发展并演变成一个强大的编程环境 - 这是它最擅长的,所以它应该主要用于它.我的意思是:当然,如果有时间和耐心,你可以用纯汇编语言编写一个Web应用程序 - 但为什么不使用为此发明的工具呢？

ActionScript当然不是您构建HTML解析器的最快语言.该程序将运行单线程,一次只能在一台机器上运行.扩展可能是通过实施P2P网络完成的,但同样重要:该技术适用于其他方面,并且有一些解决方案可以更好地创建可扩展的搜索机制.

根据您要抓取的网页类型以及数量,您最终会获得大量数据.迟早,存储,索引和检索您收集的任何数据将比爬行本身更重要.

如果您选择基于文件工作,则必须至少使用AIR,因为标准ActionScript具有非常有限的文件读/写功能 - 如果没有异步访问方法(如FileStream),您的程序会变慢并且随着时间的推移响应也会降低.

此外,分布式解决方案将变得更加复杂,因为每个节点都必须保留索引结果的一部分,除了搜索和索引之外,您还必须实现某种查找机制,例如MapReduce.

因此,您可能希望使用现有的存储技术 - 数据库和/或搜索引擎.

总而言之,我强烈建议列出您希望蜘蛛拥有的重要功能:

谁将与您的计划合作,其目的是什么？

它是否意味着自动运行,或者您是否希望通过某种用户交互来控制它？

您要收集哪种数据,以及如何访问它？

您要存储多少数据,并且您是否拥有可以构建的基础架构？

一旦您回答了这些问题,您应该查看可能有助于您实现部分或全部功能的现有工具,并且只有在您完成之后,才能决定实施无法解决的技术.

推荐阅读

程序员
在PowerBI中安装ngpsql以使用PostgreSQL

如何解决《在PowerBI中安装ngpsql以使用PostgreSQL》经验，为你挑选了1个好方法。 ... [详细]
程序员
使旧会话Cookie无效 - ASP.Net标识

如何解决《使旧会话Cookie无效-ASP.Net标识》经验，为你挑选了1个好方法。 ... [详细]
程序员
npm WARN package.json Stock@0.0.1没有存储库字段

如何解决《npmWARNpackage.jsonStock@0.0.1没有存储库字段》经验，为你挑选了2个好方法。 ... [详细]
程序员
ipywidgets下拉小部件:onchange事件是什么？

如何解决《ipywidgets下拉小部件:onchange事件是什么？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Javascript属性未更新

如何解决《Javascript属性未更新》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何改变小吃店的背景颜色？

如何解决《如何改变小吃店的背景颜色？》经验，为你挑选了7个好方法。 ... [详细]
程序员
Visual Studio git同步抛出错误

如何解决《VisualStudiogit同步抛出错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么strings.HasPrefix比bytes.HasPrefix快？

如何解决《为什么strings.HasPrefix比bytes.HasPrefix快？》经验，为你挑选了1个好方法。 ... [详细]
程序员
ACTION_OPEN_DOCUMENT在MIUI上不起作用

如何解决《ACTION_OPEN_DOCUMENT在MIUI上不起作用》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何将文本参数传递给`IN`运算符的存储函数

如何解决《如何将文本参数传递给`IN`运算符的存储函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
带有Open vSwitch的LXC

如何解决《带有OpenvSwitch的LXC》经验，为你挑选了0个好方法。 ... [详细]
程序员
在Java中解析异常

如何解决《在Java中解析异常》经验，为你挑选了1个好方法。 ... [详细]
程序员
返回true然后从for循环中断

如何解决《返回true然后从for循环中断》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在getJSON()函数中检查文件？

如何解决《如何在getJSON()函数中检查文件？》经验，为你挑选了1个好方法。 ... [详细]
程序员
将嵌套数组转换为对象

如何解决《将嵌套数组转换为对象》经验，为你挑选了0个好方法。 ... [详细]
程序员
两个不同的OWIN应用程序可以授权OAuth2承载访问令牌吗？

如何解决《两个不同的OWIN应用程序可以授权OAuth2承载访问令牌吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Github错误：无法连接到443端口

如何解决《Github错误：无法连接到443端口》经验，为你挑选了1个好方法。 ... [详细]
程序员
C++ lambda两个复制构造函数调用

如何解决《C++lambda两个复制构造函数调用》经验，为你挑选了1个好方法。 ... [详细]
程序员
可捕获的致命错误:传递给"...\FormType :: __ construct()的参数1必须实现接口

如何解决《可捕获的致命错误:传递给"\FormType::__construct()的参数1必须实现接口》经验，为你挑选了0个好方法。 ... [详细]
程序员
线条图用灰色和黑色虚线

如何解决《线条图用灰色和黑色虚线》经验，为你挑选了1个好方法。 ... [详细]

李桂平2402851397

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章

ActionScript3中的蜘​​蛛

ActionScript3中的蜘蛛