最近的爬虫也是疯狂,每天早上9点开始
每天早上9点开始,每个请求都是一个IP,UA头模拟的浏览器若是只访问静态也就算了,动态页还不能关闭,部分内容是动态显示的。疯狂请求动态页
找规律找到吐血。每天早上9点关闭msyql半小时,要么机器满载。。
你们都有啥好办法不? 有什么用 装waf、屏蔽掉bot UA、具体再看日志拉黑ip 除了waf,其他都做了
python爬虫的UA头是模拟浏览器,还不是bot类型的,头疼。
IP得有上千个,清理日志后,瞬间出现几百个请求。一次性请求上百个动态页,就废了 都一样,保证服务不死就行 所以报警的时候,没办法了,只能关闭mysql半小时。头疼。 特别是字节跳动的ai训练爬虫 疯狂爬取数据 直接屏蔽就好~ 我也是。。。几百个请求还算好,我碰到的基本上是一小时几十万……基本上是同一个地区的IP,但是基本上没啥规律。。我总不能把这个区域的IP全部屏蔽了吧……头疼,这些狗真的是…… 暂时封那个地区的
页:
[1]
2