【PHP】获取任意QQ历史头像

项目介绍 利用webdriver打开Chrome浏览器,让其自动登录目标链接,获取Cookies,把cookies写入文件,再利用该Cookies请求头像接口地址,获取历史头像。   项目地址: https://gitee.com/LiangJiaping/qq_history  …

python爬虫刷博客访问量教程三:使用Selenium让Chrome浏览器自动化

一、前言 前面两篇文章介绍了两种简单的刷流量方法,但是在实际应用上总会碰到许许多多的问题。比如,《python爬虫刷博客访问量教程二:欺骗第三方统计服务》的方法不是很完美,很多大型网站请求数非常多,请求的数据也许会加密混淆,这样的话,逐一分析会浪费很多时间。而且前面两种方法还不是模拟真正的浏览器,这…

python爬虫刷博客访问量教程二:欺骗第三方统计服务

前言 有些网站为了方便和减少开发工作,往往会使用第三方的统计服务。第三方服务作为插件的形式是无法通过直接请求提升访问量。往往把访问数据从前端发送到第三方服务后端进行统计。直接请求只是请求目标页面的内容,并不包括其中的引入的js和css等资源。 原理分析 先拿Wordpress举个例子,Wordpre…

python爬虫刷博客访问量教程一:直接请求

前言 爬虫还有一个很好玩的地方就是可以刷访问量/浏览量。对于不同的网站有不同的统计访问量的方法。有的会限制同一个IP的统计,有的是条件触发的统计(如视频播放网站,点击播放算一次)。这个系列教程会结合web技术尝试解决这些问题,实现稳定刷访问量。 分析原理 一些小型网站会把统计代码写进php里面,每次…

PHP爬虫通过L2TP VPN进入校园网抓取数据

一、 前言 学校在前段时间关闭了校外访问,但学校在最近突然开放了VPN给学生连接进入校园网。有了入口,在外网就有可能使用爬虫爬取数据。可以简单修改之前的代码,达到外网查询成绩的效果。 二、初步想法 整理了下现在手头拥有的资源。1台香港Linux虚拟主机,无系统权限。1台阿里云Windows serv…

PHP爬虫登录查询并抓取广西科技大学成绩

一 介绍 对于新手使用正则表达式开发PHP爬虫的话,难以入手。这里使用了一个html解析类库:simple_html_dom。通过php的curl获取网页内容,传入simple_html_dom进行解析。 因为外网无法访问教务信息管理系统,外网能查询成绩的只有柳苑晨曦网站,所以本文就以柳苑晨曦成绩查…

使用python抓取广西科技大学教务系统课程表

因学校教务系统课程表查询功能累赘,服务器经常挂,同时也不适合手机端查询,所以用python开发爬虫抓取所有课程表,放到我的服务器上面。 本文仅供学习。 特性 中途退出程序再次运行不会抓取到重复课程表 使用MySQL数据库储存数据,方便管理课程表 注意 请勿复制粘贴本文章代码,因为python对于代码…