Re: Snoopy功能强大的模拟浏览器方法的PHP类

添加时间:17-06-30 所属分类:PHP工具与代码
  类属性

类属性就是我们初始化Snoopy类的时候,括号里面的缺省值。

$host 连接的主机
$port 连接的端口
$proxy_host 使用的代理主机,如果有的话
$proxy_port 使用的代理主机端口,如果有的话
$agent 用户代理伪装 (Snoopy v0.1)
$referer 来路信息,如果有的话
$cookies cookies, 如果有的话
$rawheaders 其他的头信息, 如果有的话
$maxredirs 最大重定向次数, 0=不允许 (5)
$offsiteok whether or not to allow redirects off-site. (true)
$expandlinks 是否将链接都补全为完整地址 (true)
$user 认证用户名, 如果有的话
$pass 认证用户名, 如果有的话
$accept http 接受类型 (image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, */*)
$error 哪里报错, 如果有的话
$response_code 从服务器返回的响应代码
$headers 从服务器返回的头信息
$maxlength 最长返回数据长度
$read_timeout 读取操作超时 (requires PHP 4 Beta 4+),设置为0为没有超时
$timed_out 如果一次读取操作超时了,本属性返回 true (requires PHP 4 Beta 4+)
$maxframes 允许追踪的框架最大数量
$status 抓取的http的状态
$temp_dir 网页服务器能够写入的临时文件目录 (/tmp)
$curl_path cURL binary 的目录, 如果没有cURL binary就设置为 false

类方法
fetch($uri)

这是为了抓取网页的内容而使用的方法。$URI参数是被抓取网页的URL地址。抓取的结果被存储在 $this->results 中。

如果你正在抓取的是一个框架,Snoopy将会将每个框架追踪后存入数组中,然后存入 $this->results。

[code]<?php
$url = "http://www.nowamagic.net/librarys/veda/";
include("./Snoopy.class.php");

$snoopy = new Snoopy;
$snoopy->fetch($url); //获取所有内容
echo $snoopy->results; //显示结果
?>
[/code]
fetchtext($URI)

本方法类似于fetch(),唯一不同的就是本方法会去除HTML标签和其他的无关数据,只返回网页中的文字内容。

[code]<?php
$url = "http://www.nowamagic.net/librarys/veda/";
include("./Snoopy.class.php");

$snoopy = new Snoopy;
$snoopy->fetchtext($url); //获取文本内容
echo $snoopy->results; //显示结果
?>[/code]

fetchform($URI)

本方法类似于fetch(),唯一不同的就是本方法会去除HTML标签和其他的无关数据,只返回网页中表单内容(form)。
fetchlinks($URI)

本方法类似于fetch(),唯一不同的就是本方法会去除HTML标签和其他的无关数据,只返回网页中链接(link)。默认情况下,相对链接将自动补全,转换成完整的URL。
submit($URI,$formvars)

本方法向$URL指定的链接地址发送确认表单。$formvars是一个存储表单参数的数组。
submittext($URI,$formvars)

本方法类似于submit(),唯一不同的就是本方法会去除HTML标签和其他的无关数据,只返回登陆后网页中的文字内容。
submitlinks($URI)

本方法类似于submit(),唯一不同的就是本方法会去除HTML标签和其他的无关数据,只返回网页中链接(link)。默认情况下,相对链接将自动补全,转换成完整的URL。
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

前篇:退休教师夫妇为贫困孩子免费补课23年 还自费... 后篇:Snoopy 用来模仿web浏览器的功能,它能完成...
发表我的评论


推荐文章   这3种爸爸,容易培养出优秀孩子,教会孩...   懂核反应堆学过微积分?幼升小“神童简...   穿35元衣服,喂饱8亿人,这位老人又创一...   房贷还款年龄提高最高75岁 啃老族是最大...   孩子在外哭闹打滚怎么办?这位明星爸爸...
随机文章   关于PHPCMS登录后台被电信宽带劫持的解...   Discuz源码分析与插件开发实例进阶   Discuz!提示“对不起,您安装的不是正版...   JS数组使用说明   php 禁用COOKIE获得SESSION
广告

其他推荐

因为本站所有内容均转载自其它媒体,本意为公众提供免费服务,但并不代表本网赞同其观点,也不能对其真实性验证负责,如稿件版权单位或个人不想在本网发布,请与我联系,本人会立即将其撤除,谢谢.联系方式:atseashawk@163.com QQ:99289555