我需要创建一个PHP脚本.
这个想法很简单:
当我将博客帖子的链接发送到此php脚本时,将抓取该网页,并将带有标题页的第一个图像保存在我的服务器上.
我必须为此爬虫使用什么PHP函数?
使用PHP Simple HTML DOM Parser
// Create DOM from URL $html = file_get_html('http://www.example.com/'); // Find all images $images = array(); foreach($html->find('img') as $element) { $images[] = $element->src; }
现在$images
数组有给定网页的图像链接.现在,您可以将所需的图像存储在数据库中.