当前位置: 首页 > news >正文

建立网站批复建设银行总行网站

建立网站批复,建设银行总行网站,会展设计是干什么的,学做美食交流网站有哪些一、关于中间件 之前文章说过#xff0c;scrapy有两种中间件#xff1a;爬虫中间件和下载中间件#xff0c;他们的作用时间和位置都不一样#xff0c;具体区别如下#xff1a; 爬虫中间件#xff08;Spider Middleware#xff09; 作用#xff1a; 爬虫中间件主要负…一、关于中间件 之前文章说过scrapy有两种中间件爬虫中间件和下载中间件他们的作用时间和位置都不一样具体区别如下 爬虫中间件Spider Middleware 作用 爬虫中间件主要负责处理从引擎发送到爬虫的请求和从爬虫返回到引擎的响应。这些中间件在请求发送给爬虫之前或响应返回给引擎之前可以对它们进行处理。 下载中间件Downloader Middleware 作用 下载中间件主要负责处理引擎发送到下载器的请求和从下载器返回到引擎的响应。这些中间件在请求发送给下载器之前或响应返回给引擎之前可以对它们进行处理。 中间件作用优先级 只需要记住级别越小的越接近scrapy的引擎结合scrapy的数据流就能记住每个中间件的作用时机。 结合图可知 在下载中间件中 对于process_request()来说优先级数字越小越先被调用对于process_response()来说优先级数字越大越先被调用 在爬虫中间件中 对于process_spider_input()来说优先级数字越小越先被调用对于process_spider_output()来说优先级数字越大越先被调用 那么哪来的这些方法 二、定义中间件的通用模板 先看一个内置的中间件UserAgentMiddleware init: 在这里进行中间件的初始化可以使用 settings 对象获取配置信息from_crawler:在这里通过 crawler 对象创建中间件的实例可以获取全局配置信息spider_opened(可选): 在这里执行爬虫启动时的初始化操作例如打开文件、连接数据库等process_request(可选): 在这里对请求进行预处理例如修改请求头、添加代理等那么同理process_response(可选) 爬虫中间件模板 class MySpiderMiddleware(object):def __init__(self, settings):# 在这里进行中间件的初始化可以使用 settings 对象获取配置信息passclassmethoddef from_crawler(cls, crawler):# 在这里通过 crawler 对象创建中间件的实例可以获取全局配置信息settings crawler.settingsreturn cls(settings)def process_spider_input(self, response, spider):# 在这里处理从下载器传递给爬虫的响应对象return responsedef process_spider_output(self, response, result, spider):# 在这里处理爬虫生成的结果例如对结果进行过滤或修改return resultdef process_spider_exception(self, response, exception, spider):# 在这里处理爬虫产生的异常pass 下载中间件模板 class MyDownloaderMiddleware(object):def __init__(self, settings):# 在这里进行中间件的初始化可以使用 settings 对象获取配置信息passclassmethoddef from_crawler(cls, crawler):# 在这里通过 crawler 对象创建中间件的实例可以获取全局配置信息settings crawler.settingsreturn cls(settings)def process_request(self, request, spider):# 在这里对请求进行预处理例如修改请求头、添加代理等return None # 返回 None 表示继续处理请求或者返回一个新的请求对象def process_response(self, request, response, spider):# 在这里对响应进行处理例如修改响应内容、判断是否重新发送请求等return response # 返回响应对象或者返回一个新的响应对象def process_exception(self, request, exception, spider):# 在这里处理请求异常例如记录日志、发送通知等pass三、位置 我们自定义的中间件在middlewares.py中编写类就可以
http://www.hkea.cn/news/14323592/

相关文章:

  • 梵讯企业网站建设网站建设需要什么功能
  • 怎么制作一个网站首页php网站虚拟机价格
  • 腾讯云怎么做网站移动端应用开发
  • 做百度移动端网站外贸网址大全
  • 深圳建站定制公司开源的网站建设平台
  • 怎么把网站提交专门做网站的科技公司
  • iis 一个网站多个应用程序个人网页制作成品下载
  • 12306网站开发成本建设工程公司组织架构图
  • 大余网站做网站怎么报价
  • 男女明星直接做的视频网站西安网站制作网站
  • 麻涌企业网站建设软件发布网
  • 国家重大项目建设库网站打不开wordpress高级设置
  • 开发建设网站需要什么人才百度浏览器网址链接
  • 国内网站空间宁波建站价格
  • 陕西金顶建设公司网站上海网网站建
  • 企业网站管理系统怎么用亿网行网站建设114企业网
  • 温州网站建设优化公司建站优化一条龙
  • 电子商务和网络营销哪个好最新黑帽seo培训
  • 广元市建设局网站ftp网站上传之后怎么办
  • 公司网站更换域名led灯散热片技术支持 东莞网站建设
  • 网站做跳转的意义临邑网站制作
  • 哪家做外贸网站好公司黄页网
  • 自学做网站一般要多久wordpress修改永久链接后无法访问
  • 都有什么类别的网站广告设计软件cdr
  • 信息发布网站模板下载网站内容设计要求
  • 成都网站设计制作公司杭州市建设工程招标网
  • 手机网站友情链接怎么做如何查询网站接入商
  • 在线支付 网站模板企业管理系统大全免费
  • 做室内设计的网站有哪些淘宝客网站推广工具
  • 金融投资网站 php源码微墨小程序制作平台