当前位置: 首页 > news >正文

给网站做蜘蛛抓取宁波网站制作首荐荣盛网络好

给网站做蜘蛛抓取,宁波网站制作首荐荣盛网络好,720云 wordpress,论坛网站开发demo目录 我们发现csdn的文章 首先为了印证我们的想法 我们用postman往csdn我们任意一篇文章发起post请求 发送请求 ​编辑获得响应结果 我们发现我们的阅读量上涨 PostRequestSender类 但是我们经过测试发现 定义一个字符串数组 把URL放进去 然后延迟启动 在线程池里面…目录 我们发现csdn的文章 首先为了印证我们的想法 我们用postman往csdn我们任意一篇文章发起post请求 发送请求 ​编辑获得响应结果 我们发现我们的阅读量上涨 PostRequestSender类 但是我们经过测试发现 定义一个字符串数组 把URL放进去 然后延迟启动 在线程池里面设置任务的延迟和每次执行的间隔 主方法代码 博客的阅览量也在增长 然而为了防止被网站监测出来 我们可以采取其他策略 比如说往请求体里面塞一个随机数 注意不要写的太复杂 防止电脑卡爆 个人号推广 博客主页 Web后端开发 Web前端开发 数据库开发 项目实战 算法与数据结构 计算机基础 回忆录 我们发现csdn的文章 只要你点进去 就会增长阅读量 结合我们学习的计算机网络相关知识 不难猜测是只要向网页发送post请求 就能获得一次阅读量的增长。 POST请求是HTTP协议中的一种方法用于向服务器提交数据通常用于创建或更新资源或者执行一些操作比如提交表单数据、上传文件等。在Web开发中POST请求比GET请求更安全因为它将数据包含在请求体中而不是像GET请求一样在URL中可见。 首先为了印证我们的想法 我们用postman往csdn我们任意一篇文章发起post请求 打开postman 发送请求 获得响应结果 我们发现我们的阅读量上涨 证实了我们的想法 我们只要往文章发送请求就行 利用网络编程的知识 我们写个发起请求的类 PostRequestSender类 import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.OutputStream; import java.net.HttpURLConnection; import java.net.URL; import java.nio.charset.StandardCharsets; import java.util.Random;public class PostRequestSender {private String url;static long ans0;public PostRequestSender(String url) {this.url url;}public void sendPostRequest() throws IOException {// 创建URL对象URL obj new URL(url);// 打开连接HttpURLConnection con (HttpURLConnection) obj.openConnection();// 设置请求方法为POSTcon.setRequestMethod(POST);// 设置请求头con.setRequestProperty(User-Agent, Java client);con.setRequestProperty(Content-Type, application/json);// 可选设置请求体Random randomnew Random();int randomValue random.nextInt(1000); // 生成一个0到999的随机整数String postData {\key1\:\value1\, \key2\:\ randomValue \};con.setDoOutput(true);try (OutputStream os con.getOutputStream()) {byte[] input postData.getBytes(StandardCharsets.UTF_8);os.write(input, 0, input.length);}// 获取响应int responseCode con.getResponseCode();System.out.println(Sending POST request to URL: url);System.out.println(Response Code: responseCode);System.out.println(run (ans) ...);// 读取响应内容try (BufferedReader in new BufferedReader(new InputStreamReader(con.getInputStream(), StandardCharsets.UTF_8))) {String inputLine;StringBuilder response new StringBuilder();while ((inputLine in.readLine()) ! null) {response.append(inputLine);} // System.out.println(Response Body: response.toString());}} }但是我们经过测试发现 在同一时间内连续发送多次post请求 只会记录一次阅读量 这说明 CSDN自带有反爬的程序 我们可以规定在1分钟内依次爬取100篇文章 定义一个字符串数组 把URL放进去 然后延迟启动 利用的是多线程的知识 创建线程池 在线程池里面设置任务的延迟和每次执行的间隔 我们遍历数组 主方法代码 import java.io.IOException; import java.util.concurrent.Executors; import java.util.concurrent.ScheduledExecutorService; import java.util.concurrent.TimeUnit;public class Main {public static void main(String[] args) throws Exception {String[] urls {https://blog.csdn.net/qq_30500575/article/details/139987333?spm1001.2014.3001.5501,https://blog.csdn.net/qq_30500575/article/details/139962431?spm1001.2014.3001.5501,https://blog.csdn.net/qq_30500575/article/details/139962247?spm1001.2014.3001.5501,https://blog.csdn.net/qq_30500575/article/details/139926411?spm1001.2014.3001.5501,https://blog.csdn.net/qq_30500575/article/details/139920678?spm1001.2014.3001.5501,https://blog.csdn.net/qq_30500575/article/details/139920678?spm1001.2014.3001.5501,https://blog.csdn.net/qq_30500575/article/details/139904327?spm1001.2014.3001.5501,https://blog.csdn.net/qq_30500575/article/details/139904250?spm1001.2014.3001.5501,https://blog.csdn.net/qq_30500575/article/details/139841808?spm1001.2014.3001.5501,https://blog.csdn.net/qq_30500575/article/details/139841808?spm1001.2014.3001.5501,https://blog.csdn.net/qq_30500575/article/details/139842155?spm1001.2014.3001.5501,https://blog.csdn.net/qq_30500575/article/details/139857617?spm1001.2014.3001.5501,https://blog.csdn.net/qq_30500575/article/details/139857996?spm1001.2014.3001.5501,https://blog.csdn.net/qq_30500575/article/details/139858097?spm1001.2014.3001.5501// Add more URLs as needed};// 创建定时执行的线程池ScheduledExecutorService executor Executors.newScheduledThreadPool(1);// 循环访问多个网址并每隔20秒执行一次for (String url : urls) {Runnable task () - {try {PostRequestSender sender new PostRequestSender(url);sender.sendPostRequest();} catch (IOException e) {e.printStackTrace();}};// 初始延迟10秒每隔50秒执行一次任务executor.scheduleAtFixedRate(task, 10, 50, TimeUnit.SECONDS);}// 等待所有任务完成后关闭线程池executor.awaitTermination(Long.MAX_VALUE, TimeUnit.NANOSECONDS);executor.shutdown();} }启动 查看控制台信息 注意联网哦 依次爬取打印 博客的阅览量也在增长 同时还会打印状态码和URL地址 然而为了防止被网站监测出来 我们可以采取其他策略 比如说往请求体里面塞一个随机数 注意不要写的太复杂 防止电脑卡爆 个人号推广 博客主页 多多!-CSDN博客 Web后端开发 https://blog.csdn.net/qq_30500575/category_12624592.html?spm1001.2014.3001.5482 Web前端开发 https://blog.csdn.net/qq_30500575/category_12642989.html?spm1001.2014.3001.5482 数据库开发 https://blog.csdn.net/qq_30500575/category_12651993.html?spm1001.2014.3001.5482 项目实战 https://blog.csdn.net/qq_30500575/category_12699801.html?spm1001.2014.3001.5482 算法与数据结构 https://blog.csdn.net/qq_30500575/category_12630954.html?spm1001.2014.3001.5482 计算机基础 https://blog.csdn.net/qq_30500575/category_12701605.html?spm1001.2014.3001.5482 回忆录 https://blog.csdn.net/qq_30500575/category_12620276.html?spm1001.2014.3001.5482
http://www.hkea.cn/news/14574309/

相关文章:

  • 企业网站建设网站专业服务refile自己做的网站
  • 成品网站源码下载网站存在风险什么意思
  • 张家界市网站建设设计我有域名跟空间能教我做网站吗
  • 织梦网站添加视频教程视频制作软件排行榜前十名
  • 网站后台图片上传失败青岛做教育的网站
  • 广东平台网站建设制作网站开发前后端分离
  • 办公用品网站建设策划书个人备案 做网站
  • 大学生作业做网站可以在手机建网站的
  • 如何做的网站排第一网站的重要性
  • 国外建设工程招聘信息网站网业游戏大全
  • 江苏城乡建设学院网站seo教程技术
  • 企业服务网站住房和城乡建设部网站公告
  • 有网站教做水电资料吗中山哪里有做微网站的
  • 帝国cms做漫画网站教程小程序制作单位
  • 联科三网合一网站建设系统邮件营销
  • 网站建设服务费入中山网站设计制作
  • 沈阳网站建设找德泰诺怎么做直播室的网站
  • 网站关键词排名突然没了农村网站建设必要性
  • 如何规范网站使用wordpress本地传图片
  • 如何提高网站访问量最美情侣高清免费视频播放
  • 哪里做网站排名外贸网站建设平台
  • 孝昌县建设局网站河北省建设厅网站网上建设大厅
  • 官网网站优化公司有做分期海淘的网站吗
  • 外贸网站建设网页wordpress解封
  • 中国建设银行投诉网站银铃建设通官方网站
  • 网站整体克隆包含后台wordpress分享到微信二维码
  • 网站框架是什么有没有专做自驾游的网站
  • 织梦网站首页重庆项目经理在建项目查询
  • 做网站的商家怎么赚取流量费网站如何做直播
  • 网站系统是什么电脑做ppt一般下载哪个网站好