当前位置: 首页 > news >正文

外贸网站建站系统dw网页制做教程

外贸网站建站系统,dw网页制做教程,安卓开发软件安装教程,商业网站有哪些crawlab 单节点docker安装 此处介绍的是单节点的方式#xff0c;多节点的情况可以把爬虫上传到一个节点中#xff0c;之后会同步到其它节点上 version: 3.3 services:master:image: crawlabteam/crawlabcontainer_name: crawlab_masterrestart: alwaysenvironment:CRAWLAB…crawlab 单节点docker安装 此处介绍的是单节点的方式多节点的情况可以把爬虫上传到一个节点中之后会同步到其它节点上 version: 3.3 services:master:image: crawlabteam/crawlabcontainer_name: crawlab_masterrestart: alwaysenvironment:CRAWLAB_NODE_MASTER: Y # Y: 主节点CRAWLAB_MONGO_HOST: mongo # mongo host address. 在 Docker-Compose 网络中直接引用 service 名称CRAWLAB_MONGO_PORT: 27017 # mongo port CRAWLAB_MONGO_DB: crawlab # mongo database CRAWLAB_MONGO_USERNAME: username # mongo usernameCRAWLAB_MONGO_PASSWORD: password # mongo password CRAWLAB_MONGO_AUTHSOURCE: admin # mongo auth source volumes:- ./master:/data # 持久化 crawlab 数据master是win中的相对目录ports:- 8080:8080 # 开放 api 端口depends_on:- mongomongo:image: mongo:4.2restart: alwaysenvironment:MONGO_INITDB_ROOT_USERNAME: username # mongo usernameMONGO_INITDB_ROOT_PASSWORD: password # mongo passwordvolumes:- /opt/crawlab/mongo/data/db:/data/db # 持久化 mongo 数据ports:- 27017:27017 # 开放 mongo 端口到宿主机docker-compose up -d运行访问localhost:8080用户密码均为admin 上传爬虫 此处上传一个爬取图片的简单爬虫上传requirements.txt或者package.json文件crawlab会自动扫描并安装依赖但是如果存在多版本依赖的话还没尝试希望大神知道的留言告知。 爬虫是一个下载美女图片的爬虫进入到crawlab的终端中执行pip3 list 可以看到安装的包其中常见的如requests、parsel都已经安装了 // ceshi.py import requests import parsel import os os.mkdir(/data/aa) for page in range(1, 2):print(f-------正在爬取第{page}页----------)sub_url if page 1 else _ str(page)url fhttps://pic.netbian.com/4kmeinv/index{sub_url}.htmlif not os.path.exists(/data/aa/ f第{page}页):os.mkdir(/data/aa/ f第{page}页)response requests.get(urlurl)response.encoding gbkdata_html response.textselector parsel.Selector(data_html)a_href_list selector.css(#main div.slist ul li a::attr(href)).getall() # 获取每个图片的urlfor a_href in a_href_list:a_href https://pic.netbian.com a_hrefresponse_1 requests.get(a_href)selector_1 parsel.Selector(response_1.text) # 每个图片的网页链接img selector_1.css(#main div div div a img::attr(src)).getall()[0] # 照片的urldownload_url https://pic.netbian.com/ imgtitle img.split(/)[-1]download requests.get(download_url).contentwith open(f/data/aa/第{page}页/{title}, modewb)as f:f.write(download)print(title, 下载完成)print(f第{page}页全部下载完成)图片下载到data目录下而data又通过docker映射到了本机的master目录中 填写如下 总结 简单的用了下感觉crawlab很好用能把多个爬虫方便的管理起来还有cron的功能当作脚本管理也很不错
http://www.hkea.cn/news/14581751/

相关文章:

  • 成都旅游网站建设规划wordpress 统计ip
  • 阿里云建站中级版和高级版新加坡网站域名
  • 阿里云服务器搭建wordpress惠州seo排名收费
  • 网站建设在电子商务中的作用怎样买空间做网站
  • 网站源码绑定域名处理网络推广方法
  • 协同办公oa福州seo网站建设
  • 阿里建设网站建筑人才网筑才网
  • 制作投票网站怎样建设打字网站
  • 代做网站排名wordpress搜索字段
  • 学校门户网站是什么意思河南工程建设交易信息网
  • 旅游网站建设ppt模板下载潍坊专业网站建设最新报价
  • 铜陵市建设局网站做网站域名的设置
  • 昆明网站建设方案托管上海网页设计公司名单
  • 专门做单页的网站食品包装设计风格
  • 新乡 网站开发招商码头无忧查询系统
  • 网站管理系统有哪些网站建设不备案后果
  • 北京高端网站制作做qq链接的网站
  • 石景山 网站建设设计页面尺寸图
  • 广东省建设网站天津票网网站
  • 惠州网站建设哪家好深圳免费建站
  • 网站色彩的搭配原则有哪些潍坊网站建设潍坊
  • 阿里云做视频网站温州乐清哪里有网络公司
  • 北京哪家网站建设好汉口企业制作网站的
  • 贵阳市建设局网站网站建设可行性分析
  • 做网站赚钱还是企业宣传片wap网站模板
  • 伊春市住房和城乡建设局网站免费引流推广的方法
  • 中国建设银行官网站企业网银通付盾 公司网站建设
  • 网站开发 需要用到什么软件有哪些基于p2p的网站建设
  • 做网站需要注册商标吗大秀平台app下载
  • 中小型网站建设与管理 唐军民长春市长春网站建设网