当前位置: 首页 > news >正文

展示网站开发推广普通话主题手抄报图片大全

展示网站开发,推广普通话主题手抄报图片大全,久久韩剧网,美妆网站设计我们来讲最常见的反反爬虫方法 import requests r requests.get(网页网址) print(r.requests.headers) 一.使用简单的方法把请求头改为真的浏览器模式 import requests link网页地址 heraders{User-Agent:} rrequests.get(link,headersheaders) print(r.requsts.headers)我们…我们来讲最常见的反反爬虫方法 import requests r requests.get(网页网址) print(r.requests.headers) 一.使用简单的方法把请求头改为真的浏览器模式 import requests link网页地址 heraders{User-Agent:} rrequests.get(link,headersheaders) print(r.requsts.headers)我们可以使用python的fake-uesragent可以容易的切换User-Agent pip install fake-uesragent from fake_useragent import UserAgent  import requestslink uaUserAgent() hearders{User-Agent:} responserequests.grt(urlurl,headersheaders)print(response.status_code) print(r.request.headers) 这里可以使用ua.random实现随机变换headers。每次生成的伪装表名不一样。我们还需要在headers里面写上Host和Referer 二.我们爬取的时候应该设置一段的时间限制 import time t1time.time() time.sleep(2 t2time.time() total_timet2-t1 print(total_time)我们的时间应该不能确定为一个固定的值我们现在可以加入random模块来实现时间的随机性。 import random import timesleep_timerandom.randint(0,2)random.random print(sleep_time) time.sleep(sleep_time)现在我们可以把爬虫和时间间隔结合在一起了 import requests from bs4 import BeautifulSoup import time import randomlinkdef scrap(link):headers{User-Agent:}rrequests.get(link,headersheaders)hemlr.textsoupBeautifulSoup(html,ixml)return soup soupscrap(link) title_listsoup.find_all(h1,class_post-title) for eachone in title_list:urleachone.a[href]print(开始爬取,url)soup_artscrap(url)titlesoup_art.find(h1,class_view-title).text.strip()print(标题,title)sleep_timerandom.randint(0,2)random.random()print(开始休息,sleep_time,秒)time.sleep(sleep_time) 我们可以把爬取的放入文件里面
http://www.hkea.cn/news/14375670/

相关文章:

  • 企业网站建设网站深圳广告公司招聘
  • 商城网站建设哪个公司好wordpress公众号管理员
  • 环翠区网站建设东乡做网站
  • app推广的常用方法河北seo基础教程
  • php网站开发cms企业网站搜索推广
  • 如何注册申请chn网站经典的软文广告
  • 采购公告 校园网站建设深圳外包网站
  • 模板网站也需要服务器吗搜索引擎优化seo网站
  • 无锡优化网站价格网站自适应与响应式
  • 网站项目流程表四川凡术品牌策划有限公司
  • 公司做网站走什么费中外人才网
  • 外贸多语言网站建设网站建设是啥
  • 做外贸网站费用十大网络公司
  • 福利WordPress网站自动采集源码免费视频网站建设
  • 做公司网站员工保险购买域名的网站
  • 培训网网站源码数字营销沙盘
  • 海南省建设培训与执业资格注册中心网站厦门网站建设哪家不错推荐
  • 网站做301跳转需解析品牌推广与传播方案
  • 旅游网站设计源代码网站建设事宜
  • 学校网站设计流程哪里有app项目开发
  • m99ww094cn 苍井空做的网站三国类网页游戏前十名
  • 宁波学校网站建设产品设计工程师
  • 怎么编辑网站代码响应网站模板下载
  • iis应用程序池 网站湖北在线网站建设
  • 网站开发 模块化怎样使用网站模板
  • 查商家信息有哪些网站百度app安装下载
  • 潮州建设网站深圳前十大包装设计公司排名
  • 计算机网站建设与管理是什么意思昆明企业网站建设
  • 附近哪里有建筑模板卖网站seo诊断分析和优化方案
  • 网站建设费用资本化为企业设计网站