>>> 帝国网站管理系统5.1开源测试版下载
帝国CMS进入开源时代
 帝国论坛帝国网站管理系统交流区采集使用交流关于采集的问题. 【本版专题贴子】  
主题:关于采集的问题. [加入收藏夹]   

改个好名
用户头衔:秀才

精华贴   :1
发贴数   :60
经验值   :346
注册时间:2006-09-24
信息 搜索 好友 发送悄悄话 开源第一波:帝国备份王2008开源版发布】   [第 1 楼]
关于采集的问题.
我想采http://tech.163.com/special/000915AD/nettools_07.html这个网页
因为它同时有两种格式的文章,
http://tech.163.com/06/0614/09/2JIOCO1O000917GR.html
http://tech.163.com/06/0613/12/2JGEKQL0000917GR.html
所以我的正文正则的范围比较大.
我的正文正则是:
<div id="*main">
<div id="*text">[!--newstext--]文章 -->


我想用过滤广告将多出来的部分过滤掉,但出了问题.

我的过滤广告正则:href="http://tech.163.com/"><img[!--ad--]<!-- 相关

用这个正则什么也过滤不了,为什么?

[该贴被修改 1 次,最后修改时间 2006-10-14 19:36:50 ]



2006-10-14 19:36:28 已设置保密 顶部 回复 引用 报告 编辑 删除

all
用户头衔:进士

精华贴   :1
发贴数   :1057
经验值   :2776
注册时间:2006-09-06
信息 搜索 好友 发送悄悄话 《帝国网站管理系统》零基础实例入门教程】   [第 2 楼]

兄弟,你的两片文章内容里没见到广告啊!




2006-10-15 22:31:55 已设置保密 顶部 回复 引用 报告 编辑 删除

改个好名
用户头衔:秀才

精华贴   :1
发贴数   :60
经验值   :346
注册时间:2006-09-24
信息 搜索 好友 发送悄悄话 开源第一波:帝国备份王2008开源版发布】   [第 3 楼]

我过滤的不是广告,而是文章底部的那些按钮.

"下一页"    "发给MSN好友"




2006-10-16 09:09:53 已设置保密 顶部 回复 引用 报告 编辑 删除

快速回复
内容

表情
使用EBB代码 使用smile代码 显示签名 自动分析url 自动分析img
     【进入高级模式】   (按 Ctrl+Enter 直接提交)
    顶部  加入收藏夹
关于帝国 | 广告服务 | 联系我们 | 法律声明 | 隐私条款 | 许可协议
Powered by: EBB Version 2.2.1