python爬虫刷博客访问量教程三:使用Selenium让Chrome浏览器自动化

一、前言 前面两篇文章介绍了两种简单的刷流量方法,但是在实际应用上总会碰到许许多多的问题。比如,《python爬虫刷博客访问量教程二:欺骗第三方统计服务》的方法不是很完美,很多大型网站请求数非常多,请求的数据也许会加密混淆,这样的话,逐一分析会浪费很多时间。而且前面两种方法还不是模拟真正的浏览器,这…

python爬虫刷博客访问量教程二:欺骗第三方统计服务

前言 有些网站为了方便和减少开发工作,往往会使用第三方的统计服务。第三方服务作为插件的形式是无法通过直接请求提升访问量。往往把访问数据从前端发送到第三方服务后端进行统计。直接请求只是请求目标页面的内容,并不包括其中的引入的js和css等资源。 原理分析 先拿Wordpress举个例子,Wordpre…

python爬虫刷博客访问量教程一:直接请求

前言 爬虫还有一个很好玩的地方就是可以刷访问量/浏览量。对于不同的网站有不同的统计访问量的方法。有的会限制同一个IP的统计,有的是条件触发的统计(如视频播放网站,点击播放算一次)。这个系列教程会结合web技术尝试解决这些问题,实现稳定刷访问量。 分析原理 一些小型网站会把统计代码写进php里面,每次…

使用python抓取广西科技大学教务系统课程表

因学校教务系统课程表查询功能累赘,服务器经常挂,同时也不适合手机端查询,所以用python开发爬虫抓取所有课程表,放到我的服务器上面。 本文仅供学习。 特性 中途退出程序再次运行不会抓取到重复课程表 使用MySQL数据库储存数据,方便管理课程表 注意 请勿复制粘贴本文章代码,因为python对于代码…