帝国论坛
→
帝国网站管理系统交流区
→
采集使用交流
→
采集如何清除内文链接问题
【本版专题贴子】
主题:采集如何清除内文链接问题
[加入收藏夹]
gomic
用户头衔:书生
精华贴 :0
发贴数 :18
经验值 :193
注册时间:2007-04-30
信息
搜索
好友
发送悄悄话
【
精益求精-帝国网站管理系统7.5正式版开源发布
】 [第
1
楼]
采集如何清除内文链接问题
在采集的“广告过滤”中试了多次,还是无法解决,特此求助
可能方法差不多,再劳烦一下,如何消除原有的分页链接字样
上传以下图片:
[该贴被修改
1
次,最后修改时间
2007-05-31 21:00:34
]
2007-05-31 20:59:59
已设置保密
顶部
回复
引用
报告
编辑
删除
gomic
用户头衔:书生
精华贴 :0
发贴数 :18
经验值 :193
注册时间:2007-04-30
信息
搜索
好友
发送悄悄话
【
免费开源-EBMA系统:更安全的MYSQL管理和备份系统
】 [第
2
楼]
如果能够加入“清除链接”(a、div、style等等)这样的选项就方便了
2007-05-31 21:05:01
已设置保密
顶部
回复
引用
报告
编辑
删除
gomic
用户头衔:书生
精华贴 :0
发贴数 :18
经验值 :193
注册时间:2007-04-30
信息
搜索
好友
发送悄悄话
【
精益求精-帝国网站管理系统7.5正式版开源发布
】 [第
3
楼]
头一个问题基本解决
因为要采集的页面,内容链接源码是这样的
<A class=blue href="xxxx" target=_blank>,采用<A class=blue[!--ad--]target=_blank>即可
但是如果其他网站页面采用<A href="xxxx" target=_blank>这样的就不只到如何处理了,很可能将分页的链接也一起给屏蔽掉了无法采集分页
后一个问题依然没有解决,如果屏蔽掉就出现无法采集分页的问题
(继续研究中....)
2007-05-31 21:12:40
已设置保密
顶部
回复
引用
报告
编辑
删除
wm_chief
用户头衔:
管理员
精华贴 :
21
发贴数 :48941
经验值 :114161
注册时间:2002-10-30
信息
搜索
好友
发送悄悄话
【
免费开源-EBMA系统:更安全的MYSQL管理和备份系统
】 [第
4
楼]
http://phome.net/doc/ecmsedu/cj/cjjq.html
[零基础入门教程]
[模板制作教程]
[采集使用教程]
2007-05-31 22:06:00
已设置保密
顶部
回复
引用
报告
编辑
删除
fu80com
用户头衔:进士
精华贴 :0
发贴数 :400
经验值 :1871
注册时间:2007-04-04
信息
搜索
好友
发送悄悄话
【
精益求精-帝国网站管理系统7.5正式版开源发布
】 [第
5
楼]
看来我要将IT世界的全部规则发布出来才行!
<A [ad]> 直接这样就可以了!
另外,正文不要包括分页的代码!
心若在,梦就在!
2007-05-31 22:09:05
已设置保密
顶部
回复
引用
报告
编辑
删除
gomic
用户头衔:书生
精华贴 :0
发贴数 :18
经验值 :193
注册时间:2007-04-30
信息
搜索
好友
发送悄悄话
【
免费开源-EBMA系统:更安全的MYSQL管理和备份系统
】 [第
6
楼]
http://phome.net/doc/ecmsedu/cj/cjjq.html
感谢
2007-06-01 00:00:46
已设置保密
顶部
回复
引用
报告
编辑
删除
gomic
用户头衔:书生
精华贴 :0
发贴数 :18
经验值 :193
注册时间:2007-04-30
信息
搜索
好友
发送悄悄话
【
精益求精-帝国网站管理系统7.5正式版开源发布
】 [第
7
楼]
看来我要将IT世界的全部规则发布出来才行!
<A [ad]> 直接这样就可以了!
另外,正文不要包括分页的代码!
那就感谢万分了
[该贴被修改
2
次,最后修改时间
2007-06-01 01:43:51
]
2007-06-01 00:01:28
已设置保密
顶部
回复
引用
报告
编辑
删除
快速回复
内容
表情
使用EBB代码
使用smile代码
显示签名
自动分析url
自动分析img
【
进入高级模式
】
(按 Ctrl+Enter 直接提交)
顶部
加入收藏夹
关于帝国
|
广告服务
|
联系我们
|
法律声明
|
隐私条款
|
许可协议
Powered by:
EBB
Version 2.2.1