下载帝国网站管理系统5.0正式版
 帝国论坛帝国网站管理系统交流区采集使用交流[求助]WC请看,gbk4.7采集utf-8页面,如果选图片保存到本地,则采集不到内容 【本版专题贴子】  
22G硬防帝国空间1G100元/5G280元
帝国CMS模板下载中心
测试:生成20万数据共用107分钟
《帝国下载系统》全面免费
帝国备份王2008版发布
1G双线帝国空间+200M数据库=158
站长工具 - dotool.cn
广告联系QQ:627174919
主题:[求助]WC请看,gbk4.7采集utf-8页面,如果选图片保存到本地,则采集不到内容 [加入收藏夹]   

zengxming
用户头衔:书生

精华贴   :0
发贴数   :47
经验值   :229
注册时间:2007-10-09
信息 搜索 好友 发送悄悄话 《帝国网站管理系统》基础教程下载】   [第 1 楼]
[求助]WC请看,gbk4.7采集utf-8页面,如果选图片保存到本地,则采集不到内容
gbk4.7采集utf-8页面,如果选图片保存到本地,则采集不到内容。如不选择图片保存本地,则
能正常采集,不知是什么原因,
采集的页面如下
http://article.ednchina.com/Power/20080413114117.htm

[该贴被修改 1 次,最后修改时间 2008-04-16 16:28:52 ]



2008-04-15 16:05:43 已设置保密 顶部 回复 引用 报告 编辑 删除

wm_chief
用户头衔:管理员

精华贴   :21
发贴数   :47809
经验值   :109063
注册时间:2002-10-30
信息 搜索 好友 发送悄悄话 《帝国网站管理系统》零基础实例入门教程】   [第 2 楼]

可以设置这个项,然后再采集入库:
e/class/config.php文件里的
$saveurlimgclearurl=1;        //远程保存图片自动去除图片的链接(0为保留,1为去除)
将他设为0
$saveurlimgclearurl=0;



[零基础入门教程] [模板制作教程] [采集使用教程]
2008-04-15 16:47:57 已设置保密 顶部 回复 引用 报告 编辑 删除

zengxming
用户头衔:书生

精华贴   :0
发贴数   :47
经验值   :229
注册时间:2007-10-09
信息 搜索 好友 发送悄悄话 《帝国网站管理系统》基础教程下载】   [第 3 楼]
[求助]采集不能超过三页,只能采集到第二页
原帖由 wm_chief 于 2008-04-15 16:47:57 发表
可以设置这个项,然后再采集入库:
e/class/config.php文件里的
$saveurlimgclearurl=1;        //远程保存图片自动去除图片的链接(0为...



谢谢wc,按着你的提示,问题解决诶,但是采集不能超过三页,只能采集到第二页。
故障现象是:预览时,新闻正文(newstext)显示的内容是正确和完整的(和被采集的网页的内容一致),但是入库后,只能看到两页,少了一部分内容,怪事!!好像编辑器只能容纳那么多字节一样!!

[该贴被修改 4 次,最后修改时间 2008-04-16 17:11:06 ]



2008-04-16 16:16:47 已设置保密 顶部 回复 引用 报告 编辑 删除

luring
用户头衔:进士

精华贴   :1
发贴数   :1698
经验值   :4437
注册时间:2007-02-12
信息 搜索 好友 发送悄悄话 《帝国网站管理系统》零基础实例入门教程】   [第 4 楼]




不断学习 QQ群:5834465
订模板QQ:一二一三七七九二四
稀饭
女生宿舍,男人都爱看
2008-04-16 18:02:34 已设置保密 顶部 回复 引用 报告 编辑 删除

zengxming
用户头衔:书生

精华贴   :0
发贴数   :47
经验值   :229
注册时间:2007-10-09
信息 搜索 好友 发送悄悄话 《帝国网站管理系统》基础教程下载】   [第 5 楼]

我花了一天半时间,研究了火车头,在这个问题上分页完全搞定,帝国+火车 爽啊!
帝国的采集还要完善。




2008-04-18 17:37:25 已设置保密 顶部 回复 引用 报告 编辑 删除

快速回复
内容

表情
使用EBB代码 使用smile代码 显示签名 自动分析url 自动分析img
     【进入高级模式】   (按 Ctrl+Enter 直接提交)
    顶部  加入收藏夹
关于帝国 | 广告服务 | 联系我们 | 法律声明 | 隐私条款 | 许可协议
Powered by: EBB Version 2.2.1