>>> 帝国网站管理系统5.1开源测试版下载
帝国论坛
→
帝国网站管理系统交流区
→
采集使用交流
→
关于采集的问题.
【本版专题贴子】
帝国备份王2008开源版发布
帝国CMS模板下载中心
测试:生成20万数据共用107分钟
《帝国下载系统》全面免费
站长工具 - dotool.cn
1G双线帝国空间+200M数据库=158
帝国下载系统2.5版功能建议征集
自定义系统模型使用教程
主题:关于采集的问题.
[加入收藏夹]
改个好名
用户头衔:秀才
精华贴 :
1
发贴数 :60
经验值 :346
注册时间:2006-09-24
信息
搜索
好友
发送悄悄话
【
开源第一波:帝国备份王2008开源版发布
】 [第
1
楼]
关于采集的问题.
我想采http://tech.163.com/special/000915AD/nettools_07.html这个网页
因为它同时有两种格式的文章,
http://tech.163.com/06/0614/09/2JIOCO1O000917GR.html
http://tech.163.com/06/0613/12/2JGEKQL0000917GR.html
所以我的正文正则的范围比较大.
我的正文正则是:
<div id="*main">
<div id="*text">[!--newstext--]文章 -->
我想用过滤广告将多出来的部分过滤掉,但出了问题.
我的过滤广告正则:href="http://tech.163.com/"><img[!--ad--]<!-- 相关
用这个正则什么也过滤不了,为什么?
[该贴被修改
1
次,最后修改时间
2006-10-14 19:36:50
]
2006-10-14 19:36:28
已设置保密
顶部
回复
引用
报告
编辑
删除
all
用户头衔:进士
精华贴 :
1
发贴数 :1057
经验值 :2776
注册时间:2006-09-06
信息
搜索
好友
发送悄悄话
【
《帝国网站管理系统》零基础实例入门教程
】 [第
2
楼]
兄弟,你的两片文章内容里没见到广告啊!
2006-10-15 22:31:55
已设置保密
顶部
回复
引用
报告
编辑
删除
改个好名
用户头衔:秀才
精华贴 :
1
发贴数 :60
经验值 :346
注册时间:2006-09-24
信息
搜索
好友
发送悄悄话
【
开源第一波:帝国备份王2008开源版发布
】 [第
3
楼]
我过滤的不是广告,而是文章底部的那些按钮.
如
"下一页" "发给MSN好友"
2006-10-16 09:09:53
已设置保密
顶部
回复
引用
报告
编辑
删除
快速回复
内容
表情
使用EBB代码
使用smile代码
显示签名
自动分析url
自动分析img
【
进入高级模式
】
(按 Ctrl+Enter 直接提交)
顶部
加入收藏夹
关于帝国
|
广告服务
|
联系我们
|
法律声明
|
隐私条款
|
许可协议
Powered by:
EBB
Version 2.2.1