用python爬取2018世界杯总决赛获取课表

  鉴于近期在念书python,看到人家写度过此雕刻个,己己己也练习壹下,

  因此就拿见方教养政体系联绕爬取课表。

  写的不咋的,条是效实到臻就好。

  剖析页面伸荐chrome,进入页面点击F12翻开开辟者器,切换到Network

  恣意输入下账号稠密码,我们却以看到Headers和提提交的表单信息

  

  登录表单

  post表单

  不一的校能提提交的不比样,但也迥然不一。我们却以看到提提交的拥有:

  __VIEWSTATE,__EVENTVALIDATION,TextBox1,TextBox2,TextBox3,RadioButtonList1,Button1,

  经度过度析我们知道TextBox1体即兴账号,TextBox2是稠密码,TextBox3是验证码,RadioButtonList1是身份

  其他的我们却以直接骈制(带拥有表头信息),我们堵写的也就此雕刻几个。验证码鉴于还没拥有拥有深募化切磋,还是采取下载到该地,顺手触动输入的方法吧。

  获取验证码

  

  获取验证码

  犯得着剩意的是登陆时身份要替换壹下:在表单中点击view decoded就却以看到身份成了英公了:%D1%A7%C9%FA

  处理了验证码后登陆就没拥有什么父亲效实了。

  和登陆时壹样,我们找到课程表的页面看壹下央寻求

  

  课程表页面

  接上坚硬是找到课程表table,并获取,如次:

  

  找到table的id

  找到id,此雕刻么就却以欢快的去敲代码了。

  import os

  import requests

  from bs4 import BeautifulSoup

  from PIL import Image

  header={

  ? ? "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8",

  ? ? "Accept-Encoding": "gzip, deflate, sdch",

  ? ? "Accept-Language": "zh-CN,zh;q=0.8",

  ? ? "User-Agent": "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 10.0; WOW64; Trident/7.0; .NET4.0C; \

  ? ? ? ? .NET4.0E; .NET CLR 2.0.50727; .NET CLR 3.0.30729; .NET CLR 3.5.30729)",

用python爬取2018世界杯总决赛获取课表

鉴于近期在念书python,看到人家写度过此雕刻个,己己己也练习壹下, 因此就拿见方教养政体系联绕爬取课表。 写的不咋的,条是效实到臻就好。 剖析页面伸荐chrome,进入页面点击...

阅读全文 »
 

正西服置提交畅通父亲学2016年在内蒙古区各

【注】内蒙古区历年壹本线:2016理484文477,2015理464文487,2014理501文525。历年招生方案:2016理29文4,2015理28文4,2014理30文2。历年录取人数:2016理39文5,2015理29文4,2014理38文2。专业名...

阅读全文 »
 
 
About Simple Magazine

Lorem ipsum dolor sit amet, consectetur adipiscing elit.

Learn more »
Help & Support

Quam velit dapibus quam, ornare suscipit tortor nisl ut tellus.

Frequently Asked Questions (FAQ) »
Get in touch

Phone: +46 7152 5412
Email: info@simplemagazine.com

Online contact form »