帝国论坛帝国网站管理系统交流区帝国CMS使用交流在采集时,发现信息页链接正则:有../的链接就采集不了? 【本版专题贴子】  
主题:在采集时,发现信息页链接正则:有../的链接就采集不了? [加入收藏夹]   

CkmXP
用户头衔:书生

精华贴   :0
发贴数   :16
经验值   :73
注册时间:2007-06-05
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 1 楼]
在采集时,发现信息页链接正则:有../的链接就采集不了?
在采集网站时,

信息页链接正则: <td    height="25" valign="top"><b><a style="font-size:12px;color:#333333" href="[!--newsurl--]" target="_self">*</a> </b></td>

这样设置就不行了,
后我也发现凡有链接前页有 <td    height="25" valign="top"><b><a style="font-size:12px;color:#333333" href="../html/?681.html" target="_self">英语写作基础一考通</a> </b></td>
红色部分都不能采集,

请问有方法可以继续采集吗?

这是原代码,    <td    height="25" valign="top"><b><a style="font-size:12px;color:#333333" href="../html/?681.html" target="_self">英语写作基础一考通</a> </b></td>



江西自学考试网http://bbs.zikao.jx.cn
2008-05-14 15:06:36 已设置保密 顶部 回复 引用 报告 编辑 删除

jaycn
用户头衔:探花

精华贴   :0
发贴数   :4930
经验值   :12030
注册时间:2007-07-19
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 2 楼]

<td    height="25" valign="top"><b><a style="font-size:12px;color:#333333" href="../[!--newsurl--]"




2008-05-14 15:09:28 已设置保密 顶部 回复 引用 报告 编辑 删除

jaycn
用户头衔:探花

精华贴   :0
发贴数   :4930
经验值   :12030
注册时间:2007-07-19
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 3 楼]

还有要设置地址前缀




2008-05-14 15:09:44 已设置保密 顶部 回复 引用 报告 编辑 删除

CkmXP
用户头衔:书生

精华贴   :0
发贴数   :16
经验值   :73
注册时间:2007-06-05
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 4 楼]

好的,谢谢楼上的朋友,

再有一问,

商城系统的采集,也遇到此问题,担在前面增加../也同有效果.



江西自学考试网http://bbs.zikao.jx.cn
2008-05-14 16:15:32 已设置保密 顶部 回复 引用 报告 编辑 删除

快速回复
内容

表情
使用EBB代码 使用smile代码 显示签名 自动分析url 自动分析img
     【进入高级模式】   (按 Ctrl+Enter 直接提交)
    顶部  加入收藏夹
关于帝国 | 广告服务 | 联系我们 | 法律声明 | 隐私条款 | 许可协议
Powered by: EBB Version 2.2.1