<div class='pagebox' id='_function_code_page'> <span class='pagebox_pre_nolink'>上一页</span> <span class='pagebox_num_nonce'>1</span> <span class='pagebox_num'><a href='http://news.sina.com.cn/c/2008-07-17/114915949446.shtml'>2</a></span> <span class='pagebox_num'><a href='http://news.sina.com.cn/c/2008-07-17/114915949449.shtml'>3</a></span> <span class='pagebox_next'><a href='http://news.sina.com.cn/c/2008-07-17/114915949446.shtml'>下一页</a></span> </div>
全部列出式 分页区域正则: <div class='pagebox' id='_function_code_page'>[!--smallpageallzz--]下一页
分页链接正则: <a href='[!--pageallzz--]'>
望指点,感谢。。。采集出来的新闻内容会有重复的。采集第二页,重复出现第一二页的内容的。求解。。。
|