Snoopy功能强大的模拟浏览器方法的PHP类
Snoopy是一个功能强大的模拟浏览器方法的PHP类,常常被用于在PHP采集网页内容,Snoopy 是一个非常强大的PHP类,可以利用该类模拟浏览器来完成获取网页内容和发送表单的任务。下面是详细介绍Snoopy.class.php 的特点和一些常见的用法。
功能特点
Snoopy是一个php类,用来模仿web浏览器的功能,它能完成获取网页内容和发送表单的任务。Snoopy的一些功能特点:
抓取网页的内容 fetch()
抓取网页的文本内容 (去除HTML标签) fetchtext()
抓取网页的链接,表单 fetchlinks() fetchform()
支持代理主机
支持基本的用户名/密码验证
支持设置 user_agent, referer(来路), cookies 和 header content(头文件)
支持浏览器重定向,并能控制重定向深度
能把网页中的链接扩展成高质量的url(默认)
提交数据并且获取返回值
支持跟踪HTML框架
支持重定向的时候传递Cookies
要求php4以上就可以。由于本身是PHP一个类,无需扩支持,服务器不支持curl时候的最好选择。
使用方法
1、先下载Snoopy类
下载地址:http://sourceforge.net/projects/snoopy/
2、实例化对象
然后调用相应的方法即可获取抓取的网页信息
[code]
include 'snoopy/Snoopy.class.php';
$snoopy = new Snoopy();
$sourceURL = "http://xxxxxxxxx";
$snoopy->fetchlinks($sourceURL);
$results = $snoopy->results;[/code]
$results就是我们抓取的网页内容。