当前位置: 首页 > news >正文

注册公司什么网站百度官方人工客服电话

注册公司什么网站,百度官方人工客服电话,深圳工程建设服务网,有没有可以做兼职的网站吗import requestsurl https://movie.douban.com/top250 response requests.get(url) # 查看结果 print(response)在requests使用一文中我们有讲到,当状态码不是200时表示爬虫不可用,也就是说我们获取不到网页源代码。但是我们还是可以挣扎一下&#xff…
import requestsurl = 'https://movie.douban.com/top250'
response = requests.get(url)
# 查看结果
print(response)

在这里插入图片描述

  在requests使用一文中我们有讲到,当状态码不是200时表示爬虫不可用,也就是说我们获取不到网页源代码。但是我们还是可以挣扎一下,不是说不可用就放弃了。爬虫时经常会遇到有些网站有反爬机制,为了能够请求成功该如何操作?那当然是把我们伪装成浏览器了!

  那么如何把自己伪装成浏览器代替我们发送请求呢?pycharm有个字典Headers,我们需要在浏览器中找到键User-Agent对应的值

User-Agent:对应的值包含了浏览器、操作系统的各项信息。如果没有User-Agent,就相当于赤裸裸的去访问对方服务器,只要对方有反爬虫机制,就能发现你是爬虫。

在浏览器中打开想要爬取的网站,右键 --> 检查然后如下图操作:

在这里插入图片描述

  也有的网站刷新后出现的项目很少,甚至点开没有User-Agent对应的值,但是有一个项目里面一定有 : 项目名跟网站地址很相近的项目中。例如在本例中名为www.zhihu.com的项目里一定含有。

  在以贝壳租房为例,打开网页后,右键 --> 检查,在项目名为zufang中一定含有User-Agent对应的值

在这里插入图片描述

获取键user-agent对应的值后,我们把键与值写入字典Headers中

import requests# 1. 浏览器伪装
url = 'https://movie.douban.com/top250'
headers = {'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.0.0 Safari/537.36'
}
# 获取响应结果
response = requests.get(url, headers=headers)
# 查看状态码
print(response.status_code)  # 200
# 获取网页源代码
# print(response.text)
http://www.khdw.cn/news/16533.html

相关文章:

  • 动态交互网站建设2021年网络营销考试题及答案
  • 网站建设尾款wix网站制作
  • 北碚集团网站建设网络推广公司运营
  • wordpress当前分类名大型网站seo课程
  • 玉林做绿化苗木网站的是哪个单位长沙网站seo技术厂家
  • 网站推广新手入门教程企业qq
  • 网站的做用百度竞价推广效果怎么样
  • 包头建站营销网络是什么意思
  • 单位网站设计制作广告代发平台
  • asp.net c 网站开发网站排名顾问
  • 武汉做网站深圳百度快速排名提升
  • 商业门户网站有哪些关键词排名怎么查
  • 青岛做优化网站哪家好人力资源培训与开发
  • 网站登录按钮点击没反应什么原因免费创建属于自己的网站
  • 南昌网站开发培训班外链工具在线
  • 西红门做网站合肥头条今日头条新闻最新消息
  • 做网站硬件跨境电商seo什么意思
  • qq空间怎么跟网站做链接吗如何在百度上发表文章
  • 网站安全建设目的图片优化网站
  • 上海专业建站公seo兼职平台
  • 收费网站有哪些免费自动推广手机软件
  • 建设工程监理招标网站引流用什么话术更吸引人
  • 网站建设服务价格上海网络公司seo
  • 江西做网站多少钱常见网络营销推广方法
  • 一键制作网站软件正规的计算机培训机构
  • 新乡专业做网站公司如何创建自己的卡网
  • 网站公告怎么做百度app推广方法
  • 定制高端网站建设报价免费发布信息网
  • 建设了网站怎么管理系统产品网络营销方案
  • 什么做自己的网站最新网络营销方式有哪些