一个基于phpQuery的通用列表采集类

admin 2015年04月29日 PHP学习 1247次阅读 查看评论

/**
 * QueryList
 *
 * 一个基于phpQuery的通用列表采集类
 * 
 * @author Jaeger
 * @email 734708094@qq.com
 * @link            http://git.oschina.net/jae/QueryList
 * @version         2.2.1     
 *
 * @example 
 *
 //获取CSDN移动开发栏目下的文章列表标题
$hj = QueryList::Query('http://mobile.csdn.net/',array("title"=>array('.unit h1','text')));
print_r($hj->jsonArr);
//回调函数1
function callfun1($content,$key)
{
    return '回调函数1:'.$key.'-'.$content;
}
class HJ{
    //回调函数2
    static public function callfun2($content,$key)
    {
        return '回调函数2:'.$key.'-'.$content;
    }
}
//获取CSDN文章页下面的文章标题和内容
$url = 'http://www.csdn.net/article/2014-06-05/2820091-build-or-buy-a-mobile-game-backend';
$reg = array(
    'title'=>array('h1','text','','callfun1'),    
    //获取纯文本格式的标题,并调用回调函数1                   
    'summary'=>array('.summary','text','-input strong'), 
    //获取纯文本的文章摘要,但保strong标签并去除input标签
    'content'=>array('.news_content','html','div a -.copyright'),    
    //获取html格式的文章内容,但过滤掉div和a标签,去除类名为copyright的元素
    'callback'=>array('HJ','callfun2')      
    //调用回调函数2作为全局回调函数
    );
$rang = '.left';
$hj = QueryList::Query($url,$reg,$rang,'curl');
print_r($hj->jsonArr);
//继续获取右边相关热门文章列表的标题以及链接地址
$hj->setQuery(array('title'=>array('','text'),'url'=>array('a','href')),'#con_two_2 li');
//输出json数据
echo $hj->getJson();
 
 */


« 上一篇 下一篇 » admin原创文章,转载请注明出处! 标签:一个基于phpQuery的通用列表采集类

相关日志:

«   2020年11月   »
1
2345678
9101112131415
16171819202122
23242526272829
30
控制面板
您好,欢迎到访网站!
  [查看权限]
网站分类
文章归档
网站收藏
友情链接
图标汇集
  • 又拍云
  • 订阅ipvb的RSS 2.0聚合