帝国论坛帝国网站管理系统交流区采集使用交流[求助]相同的正则,相同的列表页面,为什么这个列表里面有的链接可以采集到,有的就不能采集到呢? 【本版专题贴子】  
主题:[求助]相同的正则,相同的列表页面,为什么这个列表里面有的链接可以采集到,有的就不能采集到呢? [加入收藏夹]   

jaord
用户头衔:进士

精华贴   :0
发贴数   :904
经验值   :3977
注册时间:2006-05-05
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 1 楼]
[求助]相同的正则,相同的列表页面,为什么这个列表里面有的链接可以采集到,有的就不能采集到呢?
比如目标页面有1-10条记录
为什么只能采集到其中的6-10条记录,剩下的1-5条采集不到 这是为什么呵?




2008-05-07 16:04:37 已设置保密 顶部 回复 引用 报告 编辑 删除

dxzzx
用户头衔:进士

精华贴   :0
发贴数   :1458
经验值   :3916
注册时间:2007-05-30
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 2 楼]

可能你写的正则不“通用”,没有采到标题的不入库,检查正则是不是能在所有页面中使用。还有同一个页面链接帝国也不会重复采集




2008-05-07 16:30:52 已设置保密 顶部 回复 引用 报告 编辑 删除

jaord
用户头衔:进士

精华贴   :0
发贴数   :904
经验值   :3977
注册时间:2006-05-05
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 3 楼]

谁可以帮忙看看 这个页面的正则怎么写?
http://www.chemblink.com/cas/53-84-9_56-86-0C.htm

以下是我写的正则

信息页链接正则:
<td width="30%" class=style2>
<a href="[!--newsurl--]"

中文名称正则:
<h4><font color="#002f64">
[!--title--]
</font></h4>

我仔细对照了源码 发现没有错阿
我按照这个正则采集 只能采集到50条中的13条

谁可以帮忙看看 谢谢~




2008-05-07 23:04:13 已设置保密 顶部 回复 引用 报告 编辑 删除

ruixing
用户头衔:书生

精华贴   :0
发贴数   :99
经验值   :255
注册时间:2008-04-01
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 4 楼]

chinaz很好很强大,人气旺盛啊



瑞星2008
2008-05-09 21:26:49 已设置保密 顶部 回复 引用 报告 编辑 删除

qq-fantizi
用户头衔:书生

精华贴   :0
发贴数   :59
经验值   :118
注册时间:2008-03-29
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 5 楼]

唉,怎么这么多广告啊



qq繁体字
2008-05-10 08:49:43 已设置保密 顶部 回复 引用 报告 编辑 删除

快速回复
内容

表情
使用EBB代码 使用smile代码 显示签名 自动分析url 自动分析img
     【进入高级模式】   (按 Ctrl+Enter 直接提交)
    顶部  加入收藏夹
关于帝国 | 广告服务 | 联系我们 | 法律声明 | 隐私条款 | 许可协议
Powered by: EBB Version 2.2.1