WC老大,你提供的正则确定通过测试了么?只有最新的一篇文章还有第一页的内容在,其他的都没有内容。
我把正文正则:
"></IFRAME>[!--newstext--]<br clear=all>
可以采集第一页的内容,也不用过滤广告。
但是分页还是搞不定。你提供的
<font STYLE='color:#FF0000;'>[!--smallpageallzz--]下一页
我没有测试成功。
而且最下面提示:
3.对于特殊字符请在前面加上“\\”,当然直接将特殊字符改为“*”最合适了。特殊字符如下: ),(,{,},[,],\,?
上面的分页正则是不是应该是?
<font STYLE='color:#FF0000;'>[!--smallpageallzz--]\\[下一页
还是没有成功。
并没有表示什么意思,有问题大家一起讨论解决哦。哪位兄弟也帮忙测试一下采集PCONLINE的信息。。谢了。。
|