猿人学第三题比赛题目
开始水第三篇,哈哈哈哈
URL:http://match.yuanrenxue.com/match/3
老规矩:F12,刷新
上面两个一个是名单,一个是空,所以此次请求有关的就是在下面两个
logo后面的状态码是202,看下202状态码的解释:
点击,打开我们看一下
就是一个链接,再看看其他的
POST + 202,假想一下,表单提交了某个东西到服务器,但是并未处理,像不像正在验证什么东西
接着往下看
那么可以确定,点击这个网页
通过POST访问上面整个网址,设置sessionid,好,先假想第一个请求,接下来看第二个
这其实就是有数据的一个请求
200 + GET + 数据是不是就和之前的假想一样了
现在已经很清楚了,先这样再那样再那样,我好了,你们呢~
不要慌,我们再来个断点看看~
断哪里呢,哪里有数据就断哪里
直接来看这里~
不懂js都可以的啦,POST + /logo,
通过request的session.post请求/logo再通过session.get请求3
忘记session那块内容的,这里推荐https://python3webspider.cuiqingcai.com/
复习下2.4章及其他的内容
爬取情况如下: