帝国论坛帝国网站管理系统交流区采集使用交流[求助]信息页链接正则好像有问题bug? 【本版专题贴子】  
 1/2     1 2 ›› ›|
主题:[求助]信息页链接正则好像有问题bug? [加入收藏夹]   

liuye0922
用户头衔:秀才

精华贴   :0
发贴数   :195
经验值   :593
注册时间:2011-12-04
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 1 楼]
[求助]信息页链接正则好像有问题bug?
如连接
<a href='aaa.html'>aaa</a>
<a href='bbb.html' target='_black'>bbb</a>

<a href='aaa.html'>aaa</a>
<a href='bbb.html' target='_black'>bbb</a>

<a href='aaa.html'>aaa</a>
<a href='bbb.html' target='_black'>bbb</a>

<a href='aaa.html'>aaa</a>
<a href='bbb.html' target='_black'>bbb</a>
比如是这样的连接
要采集<a href='bbb.html' target='_black'>bbb</a>
写规则<a href='[[!--newsurl--]]' target='_black'>或<a href='[[!--newsurl--]]' target='_black'>*</a>

这样在匹配的时候可以采集到第一组的数据
但以后的就有问题了
也就是大家经常看到的采集的连接里面有标题的问题

第一组匹配完后
到第三行连接
<a href='aaa.html'>aaa</a>这时候由于没有找到target='_black'
所以会继续向下匹配查找 一直到第四行<a href='bbb.html' target='_black'>bbb</a>出现target='_black'
所以 结果是  aaa.html'>aaa</a><a href='bbb.html'这样字的,把第三行的和第四行的作为一个匹配结果了

有高手看看 我说的对吗 我看采集到的页面代码也确实是这个结果




2012-01-07 11:55:47 已设置保密 顶部 回复 引用 报告 编辑 删除

liuye0922
用户头衔:秀才

精华贴   :0
发贴数   :195
经验值   :593
注册时间:2011-12-04
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 2 楼]

还有 如果写<a href='[!--newsurl--]'*>
这样的话是没有结果的。。。
这个不知道为什么没有呢?




2012-01-07 12:01:21 已设置保密 顶部 回复 引用 报告 编辑 删除

yf0127
用户头衔:举人

精华贴   :0
发贴数   :981
经验值   :1701
注册时间:2011-08-02
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 3 楼]




武汉男科医院
武汉男科
武汉中原医院
武汉男科医院

2012-01-08 09:56:14 已设置保密 顶部 回复 引用 报告 编辑 删除

dld008
用户头衔:书生

精华贴   :0
发贴数   :11
经验值   :38
注册时间:2011-09-24
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 4 楼]

等待高手的解答



泡妞秘籍
2012-01-08 21:39:02 已设置保密 顶部 回复 引用 报告 编辑 删除

huilan
用户头衔:探花

精华贴   :0
发贴数   :3958
经验值   :9825
注册时间:2009-02-04
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 5 楼]

你的正则问题,正则起始必须是唯一的,你那个不是




2012-01-09 09:41:18 已设置保密 顶部 回复 引用 报告 编辑 删除

912320305
用户头衔:书生

精华贴   :0
发贴数   :10
经验值   :32
注册时间:2011-12-28
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 6 楼]

等待高手。我没遇到过。不是很懂



网站运营
成都SEO
2012-01-11 16:54:39 已设置保密 顶部 回复 引用 报告 编辑 删除

www3gcyltcn
用户头衔:举人

精华贴   :0
发贴数   :244
经验值   :645
注册时间:2011-12-17
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 7 楼]

还有 如果写<a href='[!--newsurl--]'*>
这样的话是没有结果的。。。
这个不知道为什么没有呢?



www.3gcylt.cn北京移动充值卡批发www.ltsjczk.info联通手机充值卡
2012-01-13 20:30:04 已设置保密 顶部 回复 引用 报告 编辑 删除

十八
用户头衔:书生

精华贴   :0
发贴数   :5
经验值   :21
注册时间:2011-12-12
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 8 楼]

看看楼下的知道不,我也想了解,帮你顶了!



GM起点网游单机服务端下载基地
2012-01-13 22:55:29 已设置保密 顶部 回复 引用 报告 编辑 删除

zynzyy
用户头衔:书生

精华贴   :0
发贴数   :5
经验值   :17
注册时间:2011-12-17
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 9 楼]

路过帮楼主顶下,期待高手



http://www.zynzyy.com/遵义妇产医院
2012-01-14 09:34:21 已设置保密 顶部 回复 引用 报告 编辑 删除

dasic
用户头衔:书生

精华贴   :0
发贴数   :27
经验值   :54
注册时间:2012-01-11
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 10 楼]

等待高手,,,,哈哈啊。。这里都是高手云集啊!



武汉丰胸多少钱
武汉抽脂塑身
武汉割双眼皮哪家好







2012-01-14 14:47:47 已设置保密 顶部 回复 引用 报告 编辑 删除
 1/2     1 2 ›› ›|

快速回复
内容

表情
使用EBB代码 使用smile代码 显示签名 自动分析url 自动分析img
     【进入高级模式】   (按 Ctrl+Enter 直接提交)
    顶部  加入收藏夹
关于帝国 | 广告服务 | 联系我们 | 法律声明 | 隐私条款 | 许可协议
Powered by: EBB Version 2.2.1