试着用帝国的采集,好像也很方便,采集http://www.chinahtml.com/netnews/1/这样的一列式的很容易,我5分钟搞定了。可就是http://www.chinahtml.com/webdesign/1/这样的两列式的,搞了很久都不成功,预览时找不到“内容页列表”的链接内容,郁闷。 请大家帮忙看看我哪里出错了,谢谢。下面是我的设置内容
============================================
采集内容正则(不采集项,请留空) 信息链接区域正则: 信息页链接正则:<a title="*" href="[!--newsurl--]">*</a> 标题图片正则:
内容页(文件过大的请不要选择保存本地) 标题正则:<h1>[!--title--]</h1> 副标题正则: 发布时间正则:<strong>[!--newstime--]</strong> 标题图片正则: 内容简介正则: 作者正则:<strong>[!--writer--]</strong> 信息来源正则:<strong>[!--befrom--]</strong> 新闻正文正则:<div class="content">[!--newstext--]<div class="tool">
===========================================
”内容页分页采集设置:(如没有分页请留空,只对newstext有效)“ 我都没有设置,至今没有发现内容有分页的
|