以下页面:http://os.yesky.com/windowsvista/214/3334214.shtml 采集规则: 网址:http://vista.yesky.com/yyjqwzlb/ 信息页链接正则:<li class="bigpointli"><div class="left"><a class="blue-b" href="[!--newsurl--]" 标题正则: <div id="contitle"><h1>[!--title--]</h1> 新闻正文正则: <span id="contentAdv"></span></div>[!--newstext--]<P align=center> 分页形式: 全部列出式 分页区域正则<div id="numpage">[!--smallpageallzz--]</div> 分页链接正则<a href="[!--pageallzz--]" 无法采集到第一页,只能采集到第二页的数据,请问WC为什么,应该怎样修改规则才能采集到全部页面,谢谢。
|