帝国论坛帝国网站管理系统交流区采集使用交流大家帮忙看一下这样页面如何过滤,谢谢,新手,急! 【本版专题贴子】  
主题:大家帮忙看一下这样页面如何过滤,谢谢,新手,急! [加入收藏夹]   

mosark
用户头衔:书生

精华贴   :0
发贴数   :24
经验值   :120
注册时间:2008-03-10
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 1 楼]
大家帮忙看一下这样页面如何过滤,谢谢,新手,急!
http://www.eph.com.cn/dianli-war/shows.jsf?articleId=4551



图片为我采集后预览效果,不太理想,那位兄弟帮忙给一个采集正则,万分感谢

上传以下图片:





2008-04-15 17:22:35 已设置保密 顶部 回复 引用 报告 编辑 删除

nppcb
用户头衔:举人

精华贴   :0
发贴数   :250
经验值   :723
注册时间:2007-05-30
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 2 楼]

内容正则设置错了




2008-04-15 17:28:04 已设置保密 顶部 回复 引用 报告 编辑 删除

mosark
用户头衔:书生

精华贴   :0
发贴数   :24
经验值   :120
注册时间:2008-03-10
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 3 楼]
我的正则
<dd class="detalis" id="NewsContentLabel">[!--newstext--]<dd class="send">
这个页面我试了一天,图片正则<img src="[!--titlepic--]" border="0" alt="" />.如果填到标题图片正则:(如图片在内容页,请留空),里面,采集的页面内容就会成为楼上的样子,而如果把图片正则填到"标题图片正则:",采集的页面内容正常,但在管理信息--信息列表里"预览标题图片",却指向了别外一个页面,而不是我采集的第一张图片.

上传以下图片:





2008-04-15 17:46:31 已设置保密 顶部 回复 引用 报告 编辑 删除

mosark
用户头衔:书生

精华贴   :0
发贴数   :24
经验值   :120
注册时间:2008-03-10
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 4 楼]

我对采集过来的文件进行修改发现,标题图片栏的后辍为cn,而不是jpg,这是为什么呢?谢谢啊,兄弟们.

上传以下图片:





2008-04-15 17:53:25 已设置保密 顶部 回复 引用 报告 编辑 删除

mosark
用户头衔:书生

精华贴   :0
发贴数   :24
经验值   :120
注册时间:2008-03-10
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 5 楼]
顶上去
顶上去




2008-04-16 11:53:12 已设置保密 顶部 回复 引用 报告 编辑 删除

快速回复
内容

表情
使用EBB代码 使用smile代码 显示签名 自动分析url 自动分析img
     【进入高级模式】   (按 Ctrl+Enter 直接提交)
    顶部  加入收藏夹
关于帝国 | 广告服务 | 联系我们 | 法律声明 | 隐私条款 | 许可协议
Powered by: EBB Version 2.2.1