我想采http://tech.163.com/special/000915AD/nettools_07.html这个网页 因为它同时有两种格式的文章, http://tech.163.com/06/0614/09/2JIOCO1O000917GR.html http://tech.163.com/06/0613/12/2JGEKQL0000917GR.html 所以我的正文正则的范围比较大. 我的正文正则是: <div id="*main"> <div id="*text">[!--newstext--]文章 -->
我想用过滤广告将多出来的部分过滤掉,但出了问题.
我的过滤广告正则:href="http://tech.163.com/"><img[!--ad--]<!-- 相关
用这个正则什么也过滤不了,为什么?
|