帝国论坛帝国网站管理系统交流区采集使用交流关于ECMS相对地址采集的问题?? 【本版专题贴子】  
主题:关于ECMS相对地址采集的问题?? [加入收藏夹]   

改个好名
用户头衔:秀才

精华贴   :1
发贴数   :75
经验值   :420
注册时间:2006-09-24
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 1 楼]
关于ECMS相对地址采集的问题??
我想采这个网站http://tech.china.com/zh_cn/netschool/net/netsafe/index.html

它是用相对地址的/zh_cn/netschool/net/netsafe/4052/20001005/270056.htm
所以我在"内容页地址前缀:"里填了"http://tech.china.com"

这样设置后我只能正常采它单页的文章
但分页的文章就不正常采集,如下面的
http://tech.china.com/zh_cn/nets ... 60809/13528251.html
它分页的相对地址很短"13528251.html"

请问是不是相对地址的问题使我不能正常采集啊??
怎么解决啊??




2006-09-27 17:37:16 已设置保密 顶部 回复 引用 报告 编辑 删除

all
用户头衔:进士

精华贴   :1
发贴数   :1064
经验值   :2921
注册时间:2006-09-06
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 2 楼]

嘿嘿,解决的方法就是你在baidu上搜索相同的文章,看看他的出处是哪儿?然后去采集那个网站。。。





2006-09-27 17:54:18 已设置保密 顶部 回复 引用 报告 编辑 删除

leahdizon
用户头衔:举人

精华贴   :1
发贴数   :480
经验值   :1056
注册时间:2006-07-27
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 3 楼]

你的分页正则怎么写的?



[img]http://www.hotik.com/sign.png[/img]
2006-09-27 17:57:34 已设置保密 顶部 回复 引用 报告 编辑 删除

leahdizon
用户头衔:举人

精华贴   :1
发贴数   :480
经验值   :1056
注册时间:2006-07-27
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 4 楼]

嘿嘿,解决的方法就是你在baidu上搜索相同的文章,看看他的出处是哪儿?然后去采集那个网站。。。





[img]http://www.hotik.com/sign.png[/img]
2006-09-27 17:58:27 已设置保密 顶部 回复 引用 报告 编辑 删除

改个好名
用户头衔:秀才

精华贴   :1
发贴数   :75
经验值   :420
注册时间:2006-09-24
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 5 楼]

新闻正文正则:<font color=black id="zoom">[!--newstext--]<table align=center border=0 cellpadding=0 cellspacing=0
              width=540>
分页区域正则</font></span></p>[!--smallpagezz--]</font>页*</p>

分页链接正则href="[!--pagezz--]"




2006-09-27 18:06:15 已设置保密 顶部 回复 引用 报告 编辑 删除

快速回复
内容

表情
使用EBB代码 使用smile代码 显示签名 自动分析url 自动分析img
     【进入高级模式】   (按 Ctrl+Enter 直接提交)
    顶部  加入收藏夹
关于帝国 | 广告服务 | 联系我们 | 法律声明 | 隐私条款 | 许可协议
Powered by: EBB Version 2.2.1