帝国论坛帝国网站管理系统交流区采集使用交流采集的一个很大不足,不能分页的原因、、、、 【本版专题贴子】  
主题:采集的一个很大不足,不能分页的原因、、、、 [加入收藏夹]   

ly365
用户头衔:书生

精华贴   :0
发贴数   :19
经验值   :132
注册时间:2007-12-26
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 1 楼]
采集的一个很大不足,不能分页的原因、、、、
采集做的很不好,分页根本不能采集


因为过滤了A标签。

那么分页的也是A标签所以这个就矛盾了。

要不留下外部链接A标签

要不只能采集分页内容


建议WC把采集重新做下


可以先指定采集内容开始到结束,这样过滤的内容就不会和
分页内容发生冲突。




2008-06-22 10:22:28 已设置保密 顶部 回复 引用 报告 编辑 删除

悟空
用户头衔:探花

精华贴   :0
发贴数   :2660
经验值   :6770
注册时间:2007-11-27
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 2 楼]

内容正则包含内容范围不要把分页内容也圈进去




2008-06-22 11:08:44 已设置保密 顶部 回复 引用 报告 编辑 删除

osceo
用户头衔:书生

精华贴   :0
发贴数   :26
经验值   :89
注册时间:2008-06-12
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 3 楼]

楼上说的 不太容易实现啊  有分页的和没分页的 内容页代码区别很大
但是在全含分页的网站上 倒是非常安逸了
楼上的思路很历害的说  不知道能否指点一下图片采集的图片集正则写法思路




2008-06-23 14:44:49 已设置保密 顶部 回复 引用 报告 编辑 删除

快速回复
内容

表情
使用EBB代码 使用smile代码 显示签名 自动分析url 自动分析img
     【进入高级模式】   (按 Ctrl+Enter 直接提交)
    顶部  加入收藏夹
关于帝国 | 广告服务 | 联系我们 | 法律声明 | 隐私条款 | 许可协议
Powered by: EBB Version 2.2.1