帝国论坛帝国网站管理系统交流区采集使用交流分页采集问题-请教 【本版专题贴子】  
主题:分页采集问题-请教 [加入收藏夹]   

pangtye
用户头衔:书生

精华贴   :0
发贴数   :19
经验值   :132
注册时间:2006-11-28
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 1 楼]
分页采集问题-请教
以下页面:http://os.yesky.com/windowsvista/214/3334214.shtml
采集规则:
网址:http://vista.yesky.com/yyjqwzlb/
信息页链接正则:<li class="bigpointli"><div class="left"><a class="blue-b" href="[!--newsurl--]"
标题正则:
<div id="contitle"><h1>[!--title--]</h1>
新闻正文正则:
<span id="contentAdv"></span></div>[!--newstext--]<P align=center>
分页形式: 全部列出式
分页区域正则<div id="numpage">[!--smallpageallzz--]</div>
分页链接正则<a href="[!--pageallzz--]"
无法采集到第一页,只能采集到第二页的数据,请问WC为什么,应该怎样修改规则才能采集到全部页面,谢谢。



走进泰山----http://www.intotaishan.com
2007-05-19 11:48:59 已设置保密 顶部 回复 引用 报告 编辑 删除

wm_chief
用户头衔:管理员

精华贴   :21
发贴数   :48941
经验值   :114161
注册时间:2002-10-30
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 2 楼]

分页区域正则<div id="numpage">[!--smallpageallzz--]" target="_self"><font face="Webdings">:

[该贴被修改 1 次,最后修改时间 2007-05-19 12:31:46 ]


[零基础入门教程] [模板制作教程] [采集使用教程]
2007-05-19 12:31:33 已设置保密 顶部 回复 引用 报告 编辑 删除

wm_chief
用户头衔:管理员

精华贴   :21
发贴数   :48941
经验值   :114161
注册时间:2002-10-30
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 3 楼]

记得复制原页面代码内容。



[零基础入门教程] [模板制作教程] [采集使用教程]
2007-05-19 12:34:43 已设置保密 顶部 回复 引用 报告 编辑 删除

pangtye
用户头衔:书生

精华贴   :0
发贴数   :19
经验值   :132
注册时间:2006-11-28
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 4 楼]

还是不行啊,只能采集第一页的内容,wm_chief能否说的详细些,谢谢



走进泰山----http://www.intotaishan.com
2007-05-19 13:28:13 已设置保密 顶部 回复 引用 报告 编辑 删除

快速回复
内容

表情
使用EBB代码 使用smile代码 显示签名 自动分析url 自动分析img
     【进入高级模式】   (按 Ctrl+Enter 直接提交)
    顶部  加入收藏夹
关于帝国 | 广告服务 | 联系我们 | 法律声明 | 隐私条款 | 许可协议
Powered by: EBB Version 2.2.1