帝国论坛帝国网站管理系统交流区采集使用交流[求助]以采集回来的内容出现很多垃圾要怎么过滤? 【本版专题贴子】  
主题:[求助]以采集回来的内容出现很多垃圾要怎么过滤? [加入收藏夹]   

lfcyk
用户头衔:进士

精华贴   :0
发贴数   :912
经验值   :3431
注册时间:2007-07-31
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 1 楼]
[求助]以采集回来的内容出现很多垃圾要怎么过滤?
<span style="FONTFAMILY: 楷体_GB2312; FONTSIZE: 10.5pt">
</span><span style="COLOR: black; FONTSIZE: 10.5pt">
</span><span>
(</span><span style="COLOR: black; FONTSIZE: 10.5pt">2</span><span>)

这样没一点规律的东西要怎么批量过滤掉?很多,差不多每页都不一样?要怎么过滤掉?

我用的是文章模型
跪求解觉方法



www.qqfz.cc
2007-08-23 01:30:57 已设置保密 顶部 回复 引用 报告 编辑 删除

wm_chief
用户头衔:管理员

精华贴   :21
发贴数   :48941
经验值   :114161
注册时间:2002-10-30
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 2 楼]

采集时请设置好广告过滤正则



[零基础入门教程] [模板制作教程] [采集使用教程]
2007-08-23 08:12:24 已设置保密 顶部 回复 引用 报告 编辑 删除

lfcyk
用户头衔:进士

精华贴   :0
发贴数   :912
经验值   :3431
注册时间:2007-07-31
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 3 楼]

<span*>,</span>,<span>
我采集广告过滤里这样设的但还是有在,现在是采回来的要怎么批量删了这样的垃圾?



www.qqfz.cc
2007-08-23 16:32:56 已设置保密 顶部 回复 引用 报告 编辑 删除

lfcyk
用户头衔:进士

精华贴   :0
发贴数   :912
经验值   :3431
注册时间:2007-07-31
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 4 楼]

请问下,把D/txt/下的PHP文件拿来替换了是不是可以用了? 还是会出错?不敢试,请官方确认一下,谢谢



www.qqfz.cc
2007-08-23 16:42:48 已设置保密 顶部 回复 引用 报告 编辑 删除

wm_chief
用户头衔:管理员

精华贴   :21
发贴数   :48941
经验值   :114161
注册时间:2002-10-30
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 5 楼]

也可以



[零基础入门教程] [模板制作教程] [采集使用教程]
2007-08-23 18:06:01 已设置保密 顶部 回复 引用 报告 编辑 删除

快速回复
内容

表情
使用EBB代码 使用smile代码 显示签名 自动分析url 自动分析img
     【进入高级模式】   (按 Ctrl+Enter 直接提交)
    顶部  加入收藏夹
关于帝国 | 广告服务 | 联系我们 | 法律声明 | 隐私条款 | 许可协议
Powered by: EBB Version 2.2.1