在采集网站时,
信息页链接正则: <td height="25" valign="top"><b><a style="font-size:12px;color:#333333" href="[!--newsurl--]" target="_self">*</a> </b></td>
这样设置就不行了, 后我也发现凡有链接前页有 <td height="25" valign="top"><b><a style="font-size:12px;color:#333333" href="../html/?681.html" target="_self">英语写作基础一考通</a> </b></td> 红色部分都不能采集,
请问有方法可以继续采集吗?
这是原代码, <td height="25" valign="top"><b><a style="font-size:12px;color:#333333" href="../html/?681.html" target="_self">英语写作基础一考通</a> </b></td>
|