帝国论坛帝国网站管理系统交流区采集使用交流请问下这样的页面内容怎么采集呢。 【本版专题贴子】  
主题:请问下这样的页面内容怎么采集呢。 [加入收藏夹]   

好想上落伍
用户头衔:举人

精华贴   :0
发贴数   :367
经验值   :1702
注册时间:2006-10-02
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 1 楼]
请问下这样的页面内容怎么采集呢。
为什么我试了好多。都不成功呢

就内容和分页连接呢!!
http://www.youthcy.com/Html/zhidao11/114952555.html




2006-10-24 13:51:43 已设置保密 顶部 回复 引用 报告 编辑 删除

yjian1
用户头衔:进士

精华贴   :0
发贴数   :525
经验值   :1970
注册时间:2006-06-12
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 2 楼]

等哈   我给你写吧。




2006-10-25 19:01:15 已设置保密 顶部 回复 引用 报告 编辑 删除

yjian1
用户头衔:进士

精华贴   :0
发贴数   :525
经验值   :1970
注册时间:2006-06-12
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 3 楼]

节点名称:没名字
采集页面地址:http://www.youthcy.com/Html/zhidao11/index.html
图片/FLASH地址前缀(内容):  (有图片就自己填)
替换:(针对标题与内容) </a>
过滤广告正则:<a[!--ad--]>,<p><div align="right">[!--ad--]</div></p>
信息链接区域正则:<TABLE cellSpacing=0 cellPadding=0 width=357 border=0>[!--smallurl--]</TABLE>
信息页链接正则:<a  target="_blank"  href="[!--newsurl--]" title="*">*</a>
标题正则:<DIV align=center><BIG><B><br>
                  [!--title--]</B>
新闻正文正则:<TD class=p14 style="LINE-HEIGHT: 150%" vAlign=top
            width=550>[!--newstext--]</TD></TR></TBODY></TABLE>
      <TABLE cellSpacing=0 cellPadding=0 width=570 border=0>
分页形式:  全部列出式  
分页区域正则([!--smallpageallzz--])  <p><div align="right">本新闻共[!--smallpageallzz--]</div></p>
分页链接正则([!--pageallzz--])  <a href="[!--pageallzz--]">*</a>




2006-10-25 19:04:56 已设置保密 顶部 回复 引用 报告 编辑 删除

yjian1
用户头衔:进士

精华贴   :0
发贴数   :525
经验值   :1970
注册时间:2006-06-12
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 4 楼]

帝国MJJ,导出都不整一个。




2006-10-25 19:05:45 已设置保密 顶部 回复 引用 报告 编辑 删除

快速回复
内容

表情
使用EBB代码 使用smile代码 显示签名 自动分析url 自动分析img
     【进入高级模式】   (按 Ctrl+Enter 直接提交)
    顶部  加入收藏夹
关于帝国 | 广告服务 | 联系我们 | 法律声明 | 隐私条款 | 许可协议
Powered by: EBB Version 2.2.1