帝国论坛帝国网站管理系统交流区采集使用交流[分享]帝国CMS如何突破目标网站采集限制 【本版专题贴子】  
 1/2     1 2 ›› ›|
主题:[分享]帝国CMS如何突破目标网站采集限制 [加入收藏夹]   

sh495812627
用户头衔:书生

精华贴   :0
发贴数   :15
经验值   :82
注册时间:2016-09-27
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 1 楼]
[分享]帝国CMS如何突破目标网站采集限制

帝国CMS如何突破目标网站采集限制,解决获取不到列表页,具体方法找到帝国网站跟目录/e/class/connect.php文件,打开定位到ReadFiletext函数内,在获取远程代码添加如下代码(看注释说明):


function ReadFiletext($filepath){
        $filepath=trim($filepath);
        if(strstr($filepath,"https://")){
                return getHTTPS($filepath);
        }
        $htmlfp=@fopen($filepath,"r");
        //远程
        if(strstr($filepath,"://"))
        {
                while($data=@fread($htmlfp,500000))
            {
                        $string.=$data;
                }
                //如果为空,可能是做了防采集,待添加代码
                if(empty($string)){
                        return getHTTP($filepath);
                }


最后在connect.php文件末尾添加如下函数


//突破防采集,更多突破采集限制参考php中的curl函数库
function getHTTP($url) {
        $ch = curl_init();
        curl_setopt($ch, CURLOPT_URL, $url);
        curl_setopt($ch, CURLOPT_REFERER, "http://www.baidu.com");
        curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.57 Safari/536.11");
        curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE);
        $result = curl_exec($ch);
        curl_close($ch);
        return $result;
}


保存即可。



八零在线交流社区http://bbs.80zx.com,QQ:315988561
2017-04-20 12:24:02 已设置保密 顶部 回复 引用 报告 编辑 删除

我是一片云
用户头衔:探花

精华贴   :0
发贴数   :2712
经验值   :7989
注册时间:2008-02-25
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 2 楼]

支持一下




2017-04-21 08:09:08 已设置保密 顶部 回复 引用 报告 编辑 删除

500919
用户头衔:探花

精华贴   :0
发贴数   :11660
经验值   :31188
注册时间:2009-03-02
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 3 楼]

支持一下




2017-04-21 08:44:32 已设置保密 顶部 回复 引用 报告 编辑 删除

平凡人生
用户头衔:进士

精华贴   :0
发贴数   :1174
经验值   :3442
注册时间:2009-08-20
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 4 楼]

支持




2017-05-03 08:50:27 已设置保密 顶部 回复 引用 报告 编辑 删除

cnnb
用户头衔:探花

精华贴   :0
发贴数   :5709
经验值   :16315
注册时间:2008-10-14
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 5 楼]

支持




2017-05-11 08:33:57 已设置保密 顶部 回复 引用 报告 编辑 删除

更好的自己
用户头衔:进士

精华贴   :0
发贴数   :617
经验值   :1828
注册时间:2017-04-17
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 6 楼]

收藏




2017-05-15 07:32:15 已设置保密 顶部 回复 引用 报告 编辑 删除

未末来去
用户头衔:举人

精华贴   :0
发贴数   :343
经验值   :1027
注册时间:2017-03-02
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 7 楼]

支持




2017-05-18 21:44:34 已设置保密 顶部 回复 引用 报告 编辑 删除

sxhr520
用户头衔:书生

精华贴   :0
发贴数   :2
经验值   :10
注册时间:2017-03-23
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 8 楼]





2017-05-29 19:48:23 已设置保密 顶部 回复 引用 报告 编辑 删除

ghp18
用户头衔:书生

精华贴   :0
发贴数   :81
经验值   :242
注册时间:2011-12-28
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 9 楼]

帝国的采集好像一直老样子,没有什么进步呀




2017-05-31 15:19:29 已设置保密 顶部 回复 引用 报告 编辑 删除

陈同平
用户头衔:进士

精华贴   :0
发贴数   :1998
经验值   :5610
注册时间:2009-02-23
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 10 楼]

支持一下




2017-06-08 10:18:35 已设置保密 顶部 回复 引用 报告 编辑 删除
 1/2     1 2 ›› ›|

快速回复
内容

表情
使用EBB代码 使用smile代码 显示签名 自动分析url 自动分析img
     【进入高级模式】   (按 Ctrl+Enter 直接提交)
    顶部  加入收藏夹
关于帝国 | 广告服务 | 联系我们 | 法律声明 | 隐私条款 | 许可协议
Powered by: EBB Version 2.2.1