帝国论坛
→
帝国网站管理系统交流区
→
采集使用交流
→
[求助]相同的正则,相同的列表页面,为什么这个列表里面有的链接可以采集到,有的就不能采集到呢?
【本版专题贴子】
主题:[求助]相同的正则,相同的列表页面,为什么这个列表里面有的链接可以采集到,有的就不能采集到呢?
[加入收藏夹]
jaord
用户头衔:进士
精华贴 :0
发贴数 :904
经验值 :3977
注册时间:2006-05-05
信息
搜索
好友
发送悄悄话
【
精益求精-帝国网站管理系统7.5正式版开源发布
】 [第
1
楼]
[求助]相同的正则,相同的列表页面,为什么这个列表里面有的链接可以采集到,有的就不能采集到呢?
比如目标页面有1-10条记录
为什么只能采集到其中的6-10条记录,剩下的1-5条采集不到 这是为什么呵?
2008-05-07 16:04:37
已设置保密
顶部
回复
引用
报告
编辑
删除
dxzzx
用户头衔:进士
精华贴 :0
发贴数 :1458
经验值 :3916
注册时间:2007-05-30
信息
搜索
好友
发送悄悄话
【
免费开源-EBMA系统:更安全的MYSQL管理和备份系统
】 [第
2
楼]
可能你写的正则不“通用”,没有采到标题的不入库,检查正则是不是能在所有页面中使用。还有同一个页面链接帝国也不会重复采集
2008-05-07 16:30:52
已设置保密
顶部
回复
引用
报告
编辑
删除
jaord
用户头衔:进士
精华贴 :0
发贴数 :904
经验值 :3977
注册时间:2006-05-05
信息
搜索
好友
发送悄悄话
【
精益求精-帝国网站管理系统7.5正式版开源发布
】 [第
3
楼]
谁可以帮忙看看 这个页面的正则怎么写?
http://www.chemblink.com/cas/53-84-9_56-86-0C.htm
以下是我写的正则
信息页链接正则:
<td width="30%" class=style2>
<a href="[!--newsurl--]"
中文名称正则:
<h4><font color="#002f64">
[!--title--]
</font></h4>
我仔细对照了源码 发现没有错阿
我按照这个正则采集 只能采集到50条中的13条
谁可以帮忙看看 谢谢~
2008-05-07 23:04:13
已设置保密
顶部
回复
引用
报告
编辑
删除
ruixing
用户头衔:书生
精华贴 :0
发贴数 :99
经验值 :255
注册时间:2008-04-01
信息
搜索
好友
发送悄悄话
【
免费开源-EBMA系统:更安全的MYSQL管理和备份系统
】 [第
4
楼]
chinaz很好很强大,人气旺盛啊
瑞星2008
2008-05-09 21:26:49
已设置保密
顶部
回复
引用
报告
编辑
删除
qq-fantizi
用户头衔:书生
精华贴 :0
发贴数 :59
经验值 :118
注册时间:2008-03-29
信息
搜索
好友
发送悄悄话
【
精益求精-帝国网站管理系统7.5正式版开源发布
】 [第
5
楼]
唉,怎么这么多广告啊
qq繁体字
2008-05-10 08:49:43
已设置保密
顶部
回复
引用
报告
编辑
删除
快速回复
内容
表情
使用EBB代码
使用smile代码
显示签名
自动分析url
自动分析img
【
进入高级模式
】
(按 Ctrl+Enter 直接提交)
顶部
加入收藏夹
关于帝国
|
广告服务
|
联系我们
|
法律声明
|
隐私条款
|
许可协议
Powered by:
EBB
Version 2.2.1