帝国论坛帝国网站管理系统交流区采集使用交流写给新手——采集技巧 【本版专题贴子】  
 11/11    |‹ ‹‹ 9 10 11
主题:写给新手——采集技巧 [加入收藏夹]   

百叶花
用户头衔:进士

精华贴   :0
发贴数   :904
经验值   :1999
注册时间:2012-11-03
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 101 楼]

感谢分享!




2013-03-23 17:12:09 已设置保密 顶部 回复 引用 报告 编辑 删除

2248604662@qq.com
用户头衔:书生

精华贴   :0
发贴数   :63
经验值   :168
注册时间:2013-03-15
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 102 楼]

谢谢楼主 收藏了



长白山龙华鹿胎膏www.lutaigao8.com
2013-03-23 20:00:44 已设置保密 顶部 回复 引用 报告 编辑 删除

车前子
用户头衔:书生

精华贴   :0
发贴数   :3
经验值   :9
注册时间:2013-10-21
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 103 楼]

 1.采集的正则能写得越简单越好。
  当然,复杂的话针对性强,比较不容易采到不要的内容,但能在保证不采到不要的内容的前提下,越简单,一个正则对该网页的通用性就越强。比如说一样是采<a href="链接">这个链接,个人觉得,如果你已经设定了链接区域,区域内不会有别的链接的话,与其把链接正则写成<a href="[!--newsurl--]">,还不如写成href="[!--newsurl--]"。这样,万一有几页的链接对方写成了<A href="链接">,也不会影响你的采集效果。

  当然,对方不会莫名其妙地改变自己的模板,上面只是举个例子。而我是懒人,懒人的目标就是用最少的正则采到最多的新闻。
  正则写得简单,还是对自己采集水平的一个锻炼。越简单,找正则规律的要求就越高,多锻炼自己,采集时才比较容易一次就采到自己想要的东西。关注体育足球网qysrds.com  



http://www.ibmhy.com    
www.yjj2012.com  
bjtzxy.com/  
2013-10-28 17:28:24 已设置保密 顶部 回复 引用 报告 编辑 删除

棒棒冰
用户头衔:进士

精华贴   :0
发贴数   :1495
经验值   :4437
注册时间:2011-05-06
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 104 楼]





2013-11-02 10:48:21 已设置保密 顶部 回复 引用 报告 编辑 删除

bruce_zhou
用户头衔:举人

精华贴   :0
发贴数   :67
经验值   :744
注册时间:2013-08-30
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 105 楼]

不错啦 ,学习了



电脑知识
2013-11-02 22:58:47 已设置保密 顶部 回复 引用 报告 编辑 删除

mcj0126
用户头衔:书生

精华贴   :0
发贴数   :43
经验值   :181
注册时间:2013-10-07
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 106 楼]

好东西,学习了



E色彩电子书院
专业考试电子教材
2013-11-11 07:33:18 已设置保密 顶部 回复 引用 报告 编辑 删除

kirb2
用户头衔:进士

精华贴   :0
发贴数   :663
经验值   :1929
注册时间:2008-03-14
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 107 楼]

支持楼主




2013-11-24 10:51:00 已设置保密 顶部 回复 引用 报告 编辑 删除

kirb2
用户头衔:进士

精华贴   :0
发贴数   :663
经验值   :1929
注册时间:2008-03-14
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 108 楼]

支持




2013-12-05 19:29:50 已设置保密 顶部 回复 引用 报告 编辑 删除

木匠
用户头衔:举人

精华贴   :0
发贴数   :363
经验值   :1044
注册时间:2008-02-26
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 109 楼]

支持下




2013-12-06 20:17:56 已设置保密 顶部 回复 引用 报告 编辑 删除
 11/11    |‹ ‹‹ 9 10 11

快速回复
内容

表情
使用EBB代码 使用smile代码 显示签名 自动分析url 自动分析img
     【进入高级模式】   (按 Ctrl+Enter 直接提交)
    顶部  加入收藏夹
关于帝国 | 广告服务 | 联系我们 | 法律声明 | 隐私条款 | 许可协议
Powered by: EBB Version 2.2.1