当前位置: 首页 > news >正文

网站建设汇报稿博客网站设计方案

网站建设汇报稿,博客网站设计方案,网站建设连接,h5素材库在采集网页信息的时候#xff0c;经常需要伪造报头来实现采集脚本的有效执行 下面#xff0c;我们将使用urllib2的header部分伪造报头来实现采集信息 方法1、 #!/usr/bin/python -- coding: utf-8 -- #encodingutf-8 #Filename:urllib2-header.py import urllib2 import…在采集网页信息的时候经常需要伪造报头来实现采集脚本的有效执行 下面我们将使用urllib2的header部分伪造报头来实现采集信息 方法1、 #!/usr/bin/python -- coding: utf-8 -- #encodingutf-8 #Filename:urllib2-header.py import urllib2 import sys #抓取网页内容-发送报头-1 url “https://www.jb51.net” send_headers { ‘Host’:‘www.jb51.net’, ‘User-Agent’:‘Mozilla/5.0 (Windows NT 6.2; rv:16.0) Gecko/20100101 Firefox/16.0’, ‘Accept’:‘text/html,application/xhtmlxml,application/xml;q0.9,/;q0.8’, ‘Connection’:‘keep-alive’ } req urllib2.Request(url,headerssend_headers) r urllib2.urlopen(req) html r.read() #返回网页内容 receive_header r.info() #返回的报头信息 sys.getfilesystemencoding() html html.decode(‘utf-8’,‘replace’).encode(sys.getfilesystemencoding()) #转码:避免输出出现乱码 print receive_header print ‘####################################’ print html -- coding: utf-8 -- #encodingutf-8 #Filename:urllib2-header.py import urllib2 import sys #抓取网页内容-发送报头-1 url “https://www.jb51.net” send_headers { ‘Host’:‘www.jb51.net’, ‘User-Agent’:‘Mozilla/5.0 (Windows NT 6.2; rv:16.0) Gecko/20100101 Firefox/16.0’, ‘Accept’:‘text/html,application/xhtmlxml,application/xml;q0.9,/;q0.8’, ‘Connection’:‘keep-alive’ } req urllib2.Request(url,headerssend_headers) r urllib2.urlopen(req) html r.read() #返回网页内容 receive_header r.info() #返回的报头信息 sys.getfilesystemencoding() html html.decode(‘utf-8’,‘replace’).encode(sys.getfilesystemencoding()) #转码:避免输出出现乱码 print receive_header print ‘####################################’ print html 方法2、 #!/usr/bin/python -- coding: utf-8 -- #encodingutf-8 #Filename:urllib2-header.py import urllib2 import sys url ‘https://www.jb51.net’ req urllib2.Request(url) req.add_header(‘Referer’,‘https://www.jb51.net/’) req.add_header(‘User-Agent’,‘Mozilla/5.0 (Windows NT 6.2; rv:16.0) Gecko/20100101 Firefox/16.0’) r urllib2.urlopen(req) html r.read() receive_header r.info() html html.decode(‘utf-8’).encode(sys.getfilesystemencoding()) print receive_header print ‘#####################################’ print html #!/usr/bin/python
http://www.hkea.cn/news/14528966/

相关文章:

  • 做网站的公司新手学做网站vs
  • 网站卡密代理怎么做yeti wordpress
  • 公众号里的网站怎么做的软装设计师招聘
  • 网站建设的目的及目标专业的企业网站建设公司
  • 重庆提供行业网站建站报价智慧团建pc端注册入口
  • 手机软件制作网站平台关于门户网站建设方案
  • 网站大屏轮播图效果怎么做的镇江网站建设dmooo
  • 北斗手表官方网站天猫交易网站
  • 网站开发最快框架网站素材资源
  • 贵阳建站常州建站服务
  • 网站的静态页面用什么做网站建设分金手指专业二七
  • 东莞网站设计如何看公狍和女人做爰网站
  • 精品网站免费申请做网站平台
  • 报社网站建设之思考无锡手机网站建设服务
  • 简单的网站有哪些重庆工商大学
  • 第二章营销型网站建设测验网站访问频率
  • 备案期间 网站想正常北京如何做网站
  • 龙华做棋牌网站建设西安有哪些做网站的公司
  • 男女性男女直接做的视频网站二级建造师执业资格考试
  • 电商网站规划论文浙江台州做网站的公司
  • 返利网站开发一般要多少钱孝感市建设网站
  • 实验一 电子商务网站建设与维护做网站seo的步骤
  • 国外网站为啥速度慢dw网站模板免费下载
  • 用python做美食网站青海省建设厅网站公示公告
  • 金华网站建设工程网站建设个人网站制作流程
  • 网站建设公司哪家好服装网站建设比较好
  • 简述网站制作流程wdcp网站无法访问
  • 网站关键词怎么优化排名主做熟人推荐的招聘网站
  • 网站建设合同有法律效益吗山西建设机械网站首页
  • 长春专业企业网站建设价格网站建设网站备案所需资料