 我采集一个站,它的分页代码在正文内容之内: 有分页的文章的正文结束部分的代码如下: <p align='center'><b><font color='red'>[1]</font> <a href='?id=5811&Page=2'>[2]</a> <a href='?id=5811&Page=2'>下一页</a></b></p></div> <DIV class=yesgoogle><script language="javascript" src="/adfile/neirong1.js"></script></DIV>
没有分页的文章的正文结束部分的代码如下: <DIV class=yesgoogle><script language="javascript" src="/adfile/neirong1.js"></script></DIV> </DIV>
我该怎么采集到分页代码呢?应该说,我只能以后者作为正文的结束判断!可是这样的话都只能采集到一页,而且带分页的内容分页代码也做为正文内容了! 谢谢帮忙!
|