javascript - 有没有能解析js的库啊？-php教程

作者：郑谊099_448 | 2021-09-02 17:28

我想抓取网站上的内容，但是好多内容都js生成的，请问有没有能够解析js的库方便抓取页面js解析后的html库啊？比如商城产品信息，QQ空间内容等。不管什么语言，能够快速开发就行，谢谢

回复内容：

这中不仅仅是解析 js，还要浏览器内核的！

推荐几个：

QtWebKit，已知有 Python 和 C++ 支持
PhantomJS，已知有 JavaScript、CoffeeScript 和 Python 支持，也是 Webkit 内核
SlimerJS，已知有 JavaScript 支持，Gecko 内核，和火狐是一样的，也可以运行于火狐之上
CasperJS，已知有 JavaScript 支持。上边两个的进一步封装

感觉你的问题可以不一定要那么重量级的东西的。

你要抓的页面内容，你知道它是从 js 来的，那么这个 js 是从哪里来的？可能是页面本身有的，也可能是 ajax 的 json 。

找出包含你需要的内容的这些 js ，然后是 json 的话用一个 json parser ，是 js 的话简单的也可以用正则提取。

phantomJs maybe the best solution for you, also, casperJs is based on phantomJs that can be a useful tool to grab webpage content created by javascript or ajax

試試 node.js

从你的描述听起来，是想抓页面，但是页面里内容是JS生产的，你用抓页面的方法，抓下来一个空壳子，啥也没有。对吧？

这样的话，我建议你使用“无头浏览器”，首推楼上说的PhantomJS，它本质上就是个浏览器，只是没有用户界面而已，通过编程来调用，最后可以和你的外部代码产生一些交互，给你返回（最终生成的）HTML、给你截图等等。

直接用nodejs，然后执行返回内容就妥了

我一般在这种情况下，都是自己把js代码看一下，找到需要的地方然后自己仿照实现出来，而且java下貌似有一个库是可以执行js代码的，比如我在做新浪微博模拟登录的时候就是直接将网站js中的加密函数提取出来，然后在代码中执行获得结果，最后模拟请求就好了

推荐阅读

程序员
使用NewtonSoft将JSON对象反序列化为.Net对象

如何解决《使用NewtonSoft将JSON对象反序列化为.Net对象》经验，为你挑选了1个好方法。 ... [详细]
程序员
返回+重置成员变量最有效的方法？

如何解决《返回+重置成员变量最有效的方法？》经验，为你挑选了4个好方法。 ... [详细]
程序员
提高Aurelia框架在移动设备上的性能

如何解决《提高Aurelia框架在移动设备上的性能》经验，为你挑选了1个好方法。 ... [详细]
程序员
Tomcat：使用数据库连接部署两个应用程序时出现HikariCP问题

如何解决《Tomcat：使用数据库连接部署两个应用程序时出现HikariCP问题》经验，为你挑选了1个好方法。 ... [详细]
程序员
Gitblit推动被拒绝的原因没有在intelij-idea中显示

如何解决《Gitblit推动被拒绝的原因没有在intelij-idea中显示》经验，为你挑选了1个好方法。 ... [详细]
程序员
将div宽度内的文本框居中:100%在所有边留下一些边距

如何解决《将div宽度内的文本框居中:100%在所有边留下一些边距》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何将DTO的ODataQueryOptions应用于基础EntitySet？

如何解决《如何将DTO的ODataQueryOptions应用于基础EntitySet？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Rails部署不显示生产中的图像

如何解决《Rails部署不显示生产中的图像》经验，为你挑选了1个好方法。 ... [详细]
程序员
Jails只在Rails应用程序中工作一次(在页面刷新后不是第二次)

如何解决《Jails只在Rails应用程序中工作一次(在页面刷新后不是第二次)》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在字符串中的特定符号之前获取字符串

如何解决《如何在字符串中的特定符号之前获取字符串》经验，为你挑选了1个好方法。 ... [详细]
程序员
R中的行乘法

如何解决《R中的行乘法》经验，为你挑选了1个好方法。 ... [详细]
程序员
csv:writer.writerows()拆分我的字符串输入

如何解决《csv:writer.writerows()拆分我的字符串输入》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何用swift添加圆形按钮？

如何解决《如何用swift添加圆形按钮？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Ax - 检查是否从数据库中选择了字段

如何解决《Ax-检查是否从数据库中选择了字段》经验，为你挑选了1个好方法。 ... [详细]
程序员
错误路径中的webpack错误@ multi main

如何解决《错误路径中的webpack错误@multimain》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何计算行中三个元素的每一个可以有300px宽度？

如何解决《如何计算行中三个元素的每一个可以有300px宽度？》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用红外激光传感器Nexus 6P和5X测量距离

如何解决《使用红外激光传感器Nexus6P和5X测量距离》经验，为你挑选了0个好方法。 ... [详细]
程序员
我怎样才能运行多台Andy机器

如何解决《我怎样才能运行多台Andy机器》经验，为你挑选了0个好方法。 ... [详细]
程序员
关于Java集,如何通过其属性删除元素？

如何解决《关于Java集,如何通过其属性删除元素？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android：如何检测语言已更改手机设置

如何解决《Android：如何检测语言已更改手机设置》经验，为你挑选了1个好方法。 ... [详细]

郑谊099_448

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章