当前位置: 首页 > news >正文

茶叶响应式网站百度关键词优化软件网站

茶叶响应式网站,百度关键词优化软件网站,半成品公司 网站,网站导航栏动效怎么做的工具:python 3.7.3 、Chrome 、PyCharm 爬取过程 一、安装库:requests requests库:在python2 和python3中通用,方法完全一样,简单易用,能够自动帮助我们解压(gzip压缩的等)网页内容。…

f85e8719366716de90157919ec01bea8.png

工具:python 3.7.3 、Chrome 、PyCharm

爬取过程

一、安装库:requests

requests库:在python2 和python3中通用,方法完全一样,简单易用,能够自动帮助我们解压(gzip压缩的等)网页内容。requests提供了session类,来实现客户端和服务端的会话保持。

session=requests.session()
session.post("http://www.renren.com/PLogin.do",headers=headers,data=data)
response=session.get("http://www.renren.com/328724207",headers=headers)

二、爬取

1.寻找包含登陆信息的url和data

Chrome浏览器中打开人人网直接跳转至登录页面,打开检查点击Network下的Preview寻找包含响应的url。依次查看左侧除图片和Js外的响应发现登录信息在http://www.renren.com响应中。

44c8573828e9fe27ace58c17be67cbe0.png

转到Headers观察发现发送get请求,复制url和User-Agent,运行代码

import requests
session=requests.session()#实例化session
url="http://www.renren.com"
headers={"User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36"}
session.get(url,headers=headers)
response=session.get("http://www.renren.com/328724207",headers=headers)
# print(response.status_code,response.content.decode())
with open("renren.html","w",encoding="utf-8") as f:f.write(response.content.decode())

打开得到的html文件发现并不包含用户个人信息

320941da009fc029f0c7171f2348f131.png

说明发送请求的url地址不正确,分析为form表单登陆,需发送POST请求。
转到Network下的Response下搜索form,发现url地址为 http://www.renren.com/PLogin.do , data参数的数据为input标签下的内容,name属性下的值为字典的键,用户个人用户名和密码为字典的值。

c08b8421048ec8323014ec37079737f7.png

2.代码

import requests
session=requests.session()#实例化session
url="http://www.renren.com/PLogin.do"
headers={"User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36"}
data={"email": "35xxxxxx0@qq.com","password":"xxxxxxxxxx" }#个人用户名密码
session.post(url,headers=headers,data=data)#请求登陆页面
response=session.get("http://www.renren.com/328724207",headers=headers)#请求个人主页页面
# print(response.status_code,response.content.decode())
with open("renren.html","w",encoding="utf-8") as f:f.write(response.content.decode())

三、结果及出现问题

5746cfe38881ff5d1cad270acca111f7.png
http://www.khdw.cn/news/37082.html

相关文章:

  • ps做网站首页怎么百度里面的站长工具怎么取消
  • 温州网站建设网站推广seo
  • 深圳很多90后做虚假彩票网站诈骗电商培训机构有哪些哪家比较好
  • 网站建设服务器费用免费seo推广软件
  • 做网站导航用什么开元程序盘古百晋广告营销是干嘛
  • 做网站骗子网络营销推广服务商
  • 网站做竞价经常会被攻击吗北京债务优化公司
  • 徐州做网站建设的公司seo点击工具
  • 电子商务网站设计与建设如何搭建自己的网站
  • 厦门建设网站最好的搜索引擎
  • 网页制作做网站左侧导航百度推广关键词规划师
  • 政府网站 数据中心建设中国十大企业管理培训机构
  • php网站开发薪资新手怎么开始做电商
  • 保定网站建设方案推广所有代刷平台推广
  • 新冠疫情再次升温seo168小视频
  • 网站怎么做全屏的佛山竞价账户托管
  • 做网站程序黑科技推广软件
  • 金华建设学校继续教育网站链网
  • 网站设计的公司蒙特个人建网站步骤
  • 公司如何做网站建设重庆店铺整站优化
  • 常用的网页编辑软件是什么免费seo快速排名系统
  • 万州论坛网站建设线上营销课程
  • 网站建设自学网手机优化是什么意思
  • 现在有什么推广平台seo是谁
  • 阿里云 域名 做网站百度客服人工服务电话
  • 官方网站welcome怎么注册网站搜索引擎优化技术
  • 沧州做网站价格深圳百度
  • 网站怎么做链接百度首页网址是多少
  • wordpress换空间 403百度竞价优化
  • 厚街做网站热门推广平台