当前位置: 首页 > news >正文

北京网站代理备案做网站就用建站之星

北京网站代理备案,做网站就用建站之星,做谷歌推广一定要网站吗,南京公司网站建设费用Scrapy是基于Python的分布式爬虫框架。使用它可以非常方便地实现分布式爬虫。Scrapy高度灵活#xff0c;能够实现功能的自由拓展#xff0c;让爬虫可以应对各种网站情况。同时#xff0c;Scrapy封装了爬虫的很多实现细节#xff0c;所以可以让开发者把更多的精力放在数据的…        Scrapy是基于Python的分布式爬虫框架。使用它可以非常方便地实现分布式爬虫。Scrapy高度灵活能够实现功能的自由拓展让爬虫可以应对各种网站情况。同时Scrapy封装了爬虫的很多实现细节所以可以让开发者把更多的精力放在数据的提取上。 一、在Windows下安装Scrapy Windows是目前最主流的操作系统在日常的使用中Windows有着非常好的用户体验。不过对于程序开发来说Windows在某些方面会让工作变得比较麻烦例如安装Scrapy。         要保证Scrapy在Windows中正确安装请严格按照以下步骤执行。 1. 安装Visual C Build Tools 由于在Scrapy的依赖库文件中pywin32和Twisted的底层是基于C语言开发的因此需要安装C语言的编译环境。对于Python3.6来说可以通过安装Visual C BuildTools来安装这个环境。Visual C Build Tools是微软公司开发的下载地址为https://visualstudio.microsoft.com/thank-you-downloading-visual-studio/?skuBuildToolsrel15下载下来的只是一个大小为1MB左右的安装器运行以后的界面如图 单击“安装”按钮进行安装这个安装器会自动下载需要的文件。安装过程视网速和计算机性能而定一般需要30~60min。 出现上图所示这是因为系统没有安装.Net Framework或者安装的版本太低。此时下载并安装一个4.5.1或以上版本的.Net Framework即可。         安装好.Net Framework以后Microsoft Visual C Build Tools应该就可以正常安装了。 2. 安装pywin32 在Windows系统中搭建Scrapy的环境有两个第三方库不能使用常规的方法安装。第一个是lxml第二个是pywin32。pywin32和lxml一样不建议使用pip来安装因为10次至少有9次都会安装出错。pywin32甚至也不能使用安装lxml的方式来安装。pywin32 必须使用.exe安装包来进行安装。         根据计算机上的Python版本和位数下载并安装最新版的pywin32安装程序会自动寻找Python的安装路径所以不需要做任何修改一直单击“下一步”按钮即可。 3. 安装Twisted Scrapy需要依赖Twisted。Twisted是Python中的一个非常重要的基于事件驱动的异步输入/输出Input/OutputI/O引擎。Twisted的安装依赖于pywin32和前面的Visual C Build Tools所以必须先安装前面这两个东西才能安装Twisted。         到目前为止已经可以直接在CMD中使用pip来安装Twisted了 pip install twisted 不过先别着急这样安装虽然从功能上说没有问题但并不是一个好方法。因为Twisted和之后的Scrapy的安装会附带安装大量的依赖库而这些库仅在Scrapy中会用到平时的普通开发中几乎不会用到。所以如果把它们安装到系统的Python环境中会导致Python环境的混乱。而且发布爬虫的时候也不便于导出涉及的依赖库文件。         因此建议使用Virtualenv创建一个虚拟的Python环境来安装Scrapy剩下的部分。         Virtualenv是Python的一个第三方库使用它可以创建Python的虚拟环境。使用安装普通第三方库的方法就可以安装Virtualenv pip install virtualenv 最理想的情况是系统的Python环境中只安装Virtualenv之后的所有开发都在Virtualenv创建的虚拟Python环境中进行。每个项目都有它自己独立的虚拟Python环境各个环境之间互不干扰。但是在Windows系统中这个最理想的情况有时候没有办法实现。例如在搭建Scrapy时通过安装.exe文件的方式来安装pywin32的时候是没有办法指定安装位置的所以pywin32必定会安装到系统的Python环境中。在这种情况下就必须让Virtualenv创建的虚拟Python环境可以使用系统Python中的第三方库。         要让Virtualenv使用系统Python环境的第三方库就需要在CMD中使用下面的命令来创建虚拟环境 virtualenv --always-copy --system-site-packages venv 创建虚拟环境以后可以使用下面的命令来激活虚拟环境 venv\scripts\activate 不要关闭现在这个CMD窗口接下来的所有操作都要在这里进行。安装Twisted pip install twisted 这个文件比较大需要几分钟的时间才能安装完成。         安装完成Twisted以后在虚拟的Python环境中安装lxml。 4. pip安装Scrapy 前面的环境都准备好以后就可以使用pip来安装Scrapy了 pip install scrapy 二、在Linux下安装Scrapy 在Linux下安装Scrapy比在Windows下安装简单得多可以完全通过命令来操作。 1. 安装依赖库 在Linux的终端中执行下面的命令来安装依赖库 sudo apt-get install python3-dev python3-pip libxml2-dev libxslt1-dev zlib1g-dev libffi-dev libssl-dev 不用担心这里面的某些库已经安装因为apt-get会自动检测并跳过这些已经安装的库。 2. 创建Virtualenv虚拟Python环境并安装Scrapy 在Linux的终端中创建虚拟的Python环境 virtualenv --always-copy –pythonpython3 venv 激活虚拟的Python环境 . venv/bin/activate 安装Scrapy pip install scrapy 注意在Virtualenv创建的虚拟Python环境中执行pip命令安装第三方库时是不需要使用sudo命令的。 三、在Mac OS下安装Scrapy 在Mac OS下面安装Scrapy非常简单大多数人可以直接从Linux安装流程的第2步开始 在终端中创建虚拟的Python环境 virtualenv --always-copy --pythonpython3 venv 激活虚拟的Python环境 . venv/bin/activate 安装Scrapy pip install scrapy 不过由于pip的网络经常会受到干扰所以可能有在安装的时候会得到在线连接超时等报错信息。这个时候可以使用一些代理工具来让网络变得稳定比如ProxyChains 代理工具的安装和使用解决下载依赖库的网络超时的问题。 -------------------------------------- 没有自由的秩序和没有秩序的自由同样具有破坏性。
http://www.hkea.cn/news/14262731/

相关文章:

  • 学做衣服的网站有哪些电子商务网站建设课程性质
  • 高端网站设计报价表如何获取免费域名
  • 长沙做网站找哪家好宁阳县住房和城乡建设局网站
  • 怎样在工商网站做遗失wordpress文章图片显示错误
  • idc网站模版title 网站建设
  • 发帖秒收录的网站app开发模板网站
  • 深圳龙华住房和建设局网站官网公司网站用什么语言开发
  • 免费自助建设网站unsplash素材网站
  • wp大学wordpress建站流程茶网站建设
  • 西安行业网站制作百度糯米网站怎么做
  • 深圳十大网站建设营销活动推广策划
  • 网站接入商html表格编辑器
  • 手机微信官方网站首页微信手机网站开发
  • 保定网站建设多少钱广东网站建设制作价格
  • 浙江网站建设技术公司大兴安岭网站建设
  • 网站开发工程师和软件工程iis 配置网站 404页面
  • 网站模板 帝国 phpcms婚庆网站模板
  • 建设部网站拆除资质网站后台程序怎么做
  • 原创网站设计网站建设意义必要性
  • 郫都区规划建设局网站站长工具的使用seo综合查询排名
  • 网站列表页怎么做的景观设计论文
  • 最牛的房地产网站建设新注册的公司在哪里可以查到
  • 淮南建网站公司枣庄科技馆里度周末
  • 神农架网站建设wordpress导航栏的文件在哪里
  • 常熟建设网站国外好的设计网站有哪些
  • 厦网站建设培训佛山美容院网站建设
  • 做微商童装网站辽宁省建设信息网
  • ico 众筹网站开发做网站是什么时候分页
  • dede网站 异步生成自己做网站系统
  • 用阿里巴巴做公司网站怎么样工信部网站备案怎么查询