帝国论坛帝国网站管理系统交流区采集使用交流采集的时候,能去掉文章连接吗? 【本版专题贴子】  
 2/2    |‹ ‹‹ 1 2
主题:采集的时候,能去掉文章连接吗? [加入收藏夹]   

gzdiguo
用户头衔:书生

精华贴   :0
发贴数   :24
经验值   :50
注册时间:2012-01-04
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 11 楼]

学习了。



首饰http://www.gogotaipei.com流行饰品钛钢
2012-04-03 10:22:02 已设置保密 顶部 回复 引用 报告 编辑 删除

125584192
用户头衔:书生

精华贴   :0
发贴数   :53
经验值   :206
注册时间:2011-06-21
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 12 楼]

火车头也不错。继续学习~~

采集常用技巧
1、过滤文章内容的链接:
广告正则:“<a [!--ad--]>”;替换“</a>”为空。
2、同上得出,过滤font之类的标签:
广告正则:“<font[!--ad--]>”;替换“</font>”为空。其他依此类推。
3、清除采集时的空白内容的数据:
“系统设置”-》“执行SQL语句”运行下面SQL语句即可:
delete from phome_ecms_news where newstext='';
4、同一链接的页面如何二次采集:
到“管理采集节点”那清空节点即可。



经典小游戏 http://www.21454.com/
2012-04-07 12:02:03 已设置保密 顶部 回复 引用 报告 编辑 删除

yczwhu
用户头衔:书生

精华贴   :0
发贴数   :63
经验值   :150
注册时间:2012-04-11
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 13 楼]

在txt里面过滤一下啊



阳澄湖大闸蟹,www.zijiangxie.cn,www.xieyuanwai.cn,www.zijiangxie.com.cn,www.xieyuanwai.com.cn,www.zijiangxie.com,www.xieyuanwai.com
2012-04-13 14:02:59 已设置保密 顶部 回复 引用 报告 编辑 删除

如意客官
用户头衔:书生

精华贴   :0
发贴数   :6
经验值   :16
注册时间:2012-04-13
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 14 楼]

顶一个  学习了



大学生校园网
大学生创业网
大学生就业网

2012-04-14 15:01:27 已设置保密 顶部 回复 引用 报告 编辑 删除
 2/2    |‹ ‹‹ 1 2

快速回复
内容

表情
使用EBB代码 使用smile代码 显示签名 自动分析url 自动分析img
     【进入高级模式】   (按 Ctrl+Enter 直接提交)
    顶部  加入收藏夹
关于帝国 | 广告服务 | 联系我们 | 法律声明 | 隐私条款 | 许可协议
Powered by: EBB Version 2.2.1