当前位置: 首页 > news >正文

搭建个人网站的两种方法网站建设属于什么类的采购

搭建个人网站的两种方法,网站建设属于什么类的采购,兰州营销型网站,关键词优化排名技术前言#xff1a; TaoTao之前在前几期推文中发布了一个篇weibo评论的爬虫。主要就是采集评论区的数据#xff0c;包括评论、评论者ip、评论id、评论者等一些信息。然后有很多的小伙伴对这个代码很感兴趣。TaoTao也都给代码开源了。由于比较匆忙#xff0c;所以没来得及去讲这…前言 TaoTao之前在前几期推文中发布了一个篇weibo评论的爬虫。主要就是采集评论区的数据包括评论、评论者ip、评论id、评论者等一些信息。然后有很多的小伙伴对这个代码很感兴趣。TaoTao也都给代码开源了。由于比较匆忙所以没来得及去讲这个代码。今天刚好使用这个代码去爬取了一些数据刚好借着这个机会给大伙讲讲代码思路。 思路讲解 其实这个代码比较简单其实就是通过使用request这个python的库向目标url发送对应的请求然后服务器在相应了请求以后然后再给数据返回回来。然后我们再对对应的数据进行解析就可以了。 大体上如下图所示 图画的有的地方不是特别严谨还请见谅 代码讲解 首先需要明确我们需要使用的类库这里主要使用到的库如下 import re # 进行数据正则化 import time # 跟时间有关主要是为了请求休眠使用 import csv # 数据持久化保存到csv import random # 随机化数据 import requests # request请求的库主要是为了发送请求 from datetime import datetime # 进行数据格式化主要是为了对评论时间进行转换 from fake_useragent import UserAgent # 模拟各种浏览器一种反反爬手段这些库都是需要使用的所以需要提前安装安装方法可以使用pip 进行安装如果直接安装不上的话可以使用清华镜像站进行安装安装方法如下 pip install 库名 -i https://pypi.tuna.tsinghua.edu.cn/simple然后就是登录weibo账号然后找到对应的文章点进去可以看到hotflow这个其实就是评论的数据。我们点击它然后就可以看到对应的cookie值了然后复制它 之后需要给这个cookie值写在代码中具体如下 设置好cookie之后就是需要给这个创建request请求了。我们还是回到之前的打开文章的界面复制url链接就可以了。 之后写如下的代码就完成了request请求的操作了 其实现在就可以获取到数据了但是我们可以看一下hotflow哪些是我们需要的数据。 可以看到我们需要的是like_count、source、text等这些数据 所以我们就需要写下面的代码对数据进行解析至于为什么要写一个for循环就是为了迭代多条数据。 然后就是数据进行持久化了持久化这里我这里使用的是csv代码如下 下面的这个是进行表格以及表头的创建 下面的是对数据进行保存的操作 到这里基本上代码就已经写完了 爬取数据 完成了上面的代码以后我们就可以爬取数据了 首先我们需要找到需要爬取文章的id,获取方式如下 然后给这个id复制到代码的下面的位置就可以了 然后就可以爬取数据了这里可以在pycharm或者cmd中执行都是可以的。我比较喜欢在cmd中执行代码具体就是在cmd中使用python youcodeName.py就可以了。比较省事的方式其实就是使用pycharm直接run 下面是我在cmd中运行结束的截图 然后下面的是我爬取到的数据 数据可视化 拿到了数据其实我们还可以对数据进行可视化这样方便观察数据的规律 TaoTao使用pyecharts简单的做了几个仅供大家参考 其实我们可以看到有重复数据。我看了一下评论区其实是有人多刷的就是说一个账号刷了多条同样的评论。我理解这些人可能是水军。 源码获取关注“python小胡说”回复“微博评论”既可获取源码 希望大家可以动手实践光说不练假把式 由于TaoTao能力有限在一些问题表述上难免有不准确的地方还请多多包涵
http://www.hkea.cn/news/14543128/

相关文章:

  • 做网站注册会员加入实名认证功能网站建设 广州网站建设专业公司
  • 如何把网站上传到网上专业网站建设人工智能
  • 用dw怎么做酷炫的网站给前端做网站的图片叫什么
  • wordpress知更鸟主题茶叶seo网站推广与优化方案
  • 做网站如何下载别人网站图片国内wordpress大牛
  • 做网站和网页有什么区别建设京东物流网站的目标是什么
  • 临沂网站制作专业全国互联网安全管理服务平台
  • 网站开发业务ppt信用门户网站建设方案
  • 景宁建设局网站官网微信推广是什么意思
  • 网站优化方法网站建设与维护新的体会
  • 网站建设经费预算表公司网站制作的费用
  • 网站模版制作做网站要钱嘛
  • 网站首页效果图怎么设计wordpress更新文章
  • 什么网站做论坛签名义乌婚介网站建设
  • 做网站私活wordpress 禁用搜索功能
  • 网站建设如何交税在线图片编辑器马赛克
  • 徐州网站推广公司集美网站建设
  • 长沙整站优化seo网站设计招聘
  • 做h5网站设计泉州网站建设选择讯呢
  • 公司网站用什么语言开发国家商标注册官网入口
  • 旅游型网站建设谷歌推广代理
  • 网站建设属于技术服务吗wordpress安装插件无法创建目录
  • 郑州 外包网站seo技术优化
  • 怎样建设手机网站购物网站首页模板
  • 免费服务器的网站有哪些计算机培训包就业
  • 鲁山网站建设兼职WordPress火车采集描述
  • 怎样做网站公司游戏网络公司名字
  • 厦门网站制作建设丽水建设公司网站
  • 网站论文首页布局技巧自己做的网站怎么上传到网络
  • 排名轻松seo 网站网络营销基础网站建设与运营