帝国论坛帝国网站管理系统交流区采集使用交流[求助]高手看下这个地址怎么采 【本版专题贴子】  
主题:[求助]高手看下这个地址怎么采 [加入收藏夹]   

leonard4046
用户头衔:秀才

精华贴   :0
发贴数   :67
经验值   :387
注册时间:2008-12-05
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 1 楼]
[求助]高手看下这个地址怎么采
http://www.hnaee.com/creatorCMS/appManage/objectManage/findFontObjectList.page?rows=100000&xmlb=3

其实很简单一个页面,为毛提示“请确认采集页面存在,系统无法取得信息 ”呢,百撕不得其姐啊。


信息页链接正则:href="[!--newsurl--]"

标题正则:<h1 style="*">[!--title--]</h1>




2016-12-22 19:05:59 已设置保密 顶部 回复 引用 报告 编辑 删除

qq1000811
用户头衔:书生

精华贴   :0
发贴数   :1
经验值   :4
注册时间:2016-12-22
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 2 楼]

哈哈回家




2016-12-22 22:59:32 已设置保密 顶部 回复 引用 报告 编辑 删除

59966
用户头衔:探花

精华贴   :0
发贴数   :8493
经验值   :21577
注册时间:2008-11-17
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 3 楼]

一看链接正则就不对,href开头肯定不是唯一




2016-12-25 08:56:05 已设置保密 顶部 回复 引用 报告 编辑 删除

Calibur
用户头衔:书生

精华贴   :0
发贴数   :5
经验值   :23
注册时间:2017-02-13
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 4 楼]

链接正则是错的,不过这不是问题的起因。这个页面是个动态页面,你是不可能采集到什么有用的东西的。




2017-02-13 19:14:23 已设置保密 顶部 回复 引用 报告 编辑 删除

快速回复
内容

表情
使用EBB代码 使用smile代码 显示签名 自动分析url 自动分析img
     【进入高级模式】   (按 Ctrl+Enter 直接提交)
    顶部  加入收藏夹
关于帝国 | 广告服务 | 联系我们 | 法律声明 | 隐私条款 | 许可协议
Powered by: EBB Version 2.2.1