前两天 采集一个站点 结果被对方的反采集 给屏蔽IP了 幸亏我有一个备用站点 IP 不同 为了珍惜这最后一次机会 我们分析一下原因 以免再次被屏蔽IP
各位高人的意见是 对方采用的是
"如果一个IP一分钟内访问的频率过多,判断为采集,自动封闭"
我的想法是采集是因为短时间内太快 那么我把时间拉长 采集频率降低 也就是慢采集咯,是不是可以避免被屏蔽? 
那么以下这些项目 该怎么给数值比较保险?
每组列表采集个数: 每组采集 ? 个列表页(防止采集超时) 每组信息采集个数: 每组采集 ? 个信息页(防止采集超时) 每组入库数: 每组入 ? 条记录(防止入库超时) 每组采集时间间隔 ? 秒 (0为连续采集)
|