帝国论坛
→
帝国网站管理系统交流区
→
采集使用交流
→
[求助]以采集回来的内容出现很多垃圾要怎么过滤?
【本版专题贴子】
主题:[求助]以采集回来的内容出现很多垃圾要怎么过滤?
[加入收藏夹]
lfcyk
用户头衔:进士
精华贴 :0
发贴数 :912
经验值 :3431
注册时间:2007-07-31
信息
搜索
好友
发送悄悄话
【
精益求精-帝国网站管理系统7.5正式版开源发布
】 [第
1
楼]
[求助]以采集回来的内容出现很多垃圾要怎么过滤?
<span style="FONTFAMILY: 楷体_GB2312; FONTSIZE: 10.5pt">
</span><span style="COLOR: black; FONTSIZE: 10.5pt">
</span><span>
(</span><span style="COLOR: black; FONTSIZE: 10.5pt">2</span><span>)
这样没一点规律的东西要怎么批量过滤掉?很多,差不多每页都不一样?要怎么过滤掉?
我用的是文章模型
跪求解觉方法
www.qqfz.cc
2007-08-23 01:30:57
已设置保密
顶部
回复
引用
报告
编辑
删除
wm_chief
用户头衔:
管理员
精华贴 :
21
发贴数 :48941
经验值 :114161
注册时间:2002-10-30
信息
搜索
好友
发送悄悄话
【
免费开源-EBMA系统:更安全的MYSQL管理和备份系统
】 [第
2
楼]
采集时请设置好广告过滤正则
[零基础入门教程]
[模板制作教程]
[采集使用教程]
2007-08-23 08:12:24
已设置保密
顶部
回复
引用
报告
编辑
删除
lfcyk
用户头衔:进士
精华贴 :0
发贴数 :912
经验值 :3431
注册时间:2007-07-31
信息
搜索
好友
发送悄悄话
【
精益求精-帝国网站管理系统7.5正式版开源发布
】 [第
3
楼]
<span*>,</span>,<span>
我采集广告过滤里这样设的但还是有在,现在是采回来的要怎么批量删了这样的垃圾?
www.qqfz.cc
2007-08-23 16:32:56
已设置保密
顶部
回复
引用
报告
编辑
删除
lfcyk
用户头衔:进士
精华贴 :0
发贴数 :912
经验值 :3431
注册时间:2007-07-31
信息
搜索
好友
发送悄悄话
【
免费开源-EBMA系统:更安全的MYSQL管理和备份系统
】 [第
4
楼]
请问下,把D/txt/下的PHP文件拿来替换了是不是可以用了? 还是会出错?不敢试,请官方确认一下,谢谢
www.qqfz.cc
2007-08-23 16:42:48
已设置保密
顶部
回复
引用
报告
编辑
删除
wm_chief
用户头衔:
管理员
精华贴 :
21
发贴数 :48941
经验值 :114161
注册时间:2002-10-30
信息
搜索
好友
发送悄悄话
【
精益求精-帝国网站管理系统7.5正式版开源发布
】 [第
5
楼]
也可以
[零基础入门教程]
[模板制作教程]
[采集使用教程]
2007-08-23 18:06:01
已设置保密
顶部
回复
引用
报告
编辑
删除
快速回复
内容
表情
使用EBB代码
使用smile代码
显示签名
自动分析url
自动分析img
【
进入高级模式
】
(按 Ctrl+Enter 直接提交)
顶部
加入收藏夹
关于帝国
|
广告服务
|
联系我们
|
法律声明
|
隐私条款
|
许可协议
Powered by:
EBB
Version 2.2.1