文章目录
前情回顾滑块验证码介绍破解思路传统爬虫浏览器爬虫 验证码图片处理模拟滑块拖动总结参考文献前情回顾
上一篇文章大麦网滑块验证码自动识别,主要是针对大麦网最近新增加的滑块验证码如何进行处理、自动识别进行了讲解,本篇文章在上述文章的基础上,更详细进行了总结和复盘,针对后面其他类似含有验证码的网站,可以直接套用。
下面就详细说下。
滑块验证码介绍
有爬虫,自然就有反爬虫,两者相辅相成,相互促进。
最早的,从最简单的检测 UserAgent 或者 Referrer 等头部,到限制访问频率封 IP 等手段,到关键路径的行为识别,到前端页面的混淆和加密,到目前最流行的验证码技术,可以说,为了防止网络上大量爬虫的肆意妄为,特别是一些垃圾机器人,技术人员真的是绞