当前位置: 首页 > news >正文

网站建设开发案例求会wordpress的人

网站建设开发案例,求会wordpress的人,电子商务平台的类型,网站备案号官网爬虫post收尾以及cookie加代理 目录 1.post请求收尾 2.cookie加代理 post收尾 post请求传参有两种格式#xff0c;载荷中有请求载荷和表单参数#xff0c;我们需要做不同的处理。 1.表单数据#xff1a;data字典传参 content-type: application/x-www-form-urlencoded; …爬虫post收尾以及cookie加代理 目录 1.post请求收尾 2.cookie加代理 post收尾 post请求传参有两种格式载荷中有请求载荷和表单参数我们需要做不同的处理。 1.表单数据data字典传参 content-type: application/x-www-form-urlencoded; charsetUTF-8(这种方法是上一篇文章讲到的) 查询字符串参数跟在url后面的参数 2.请求载荷json字典 content-type 告知服务端传入的参数类型是什么类型 application/json;charsetUTF-8 传入的参数是个json格式数据 两种处理办法 一 1- 伪装指定content-type 2- 传参还是使用data参数,参数值是一个json字符串 二 直接使用json参数字典 第一种方法: import requests url https://join.qq.com/api/v1/position/searchPosition?timestamp1727440821893 headers {user-agent:Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML,like Gecko) Chrome/129.0.0.0 Safari/537.36,content-type:application/json;charsetUTF-8 } data {projectIdList:[1],keyword:,bgList:[],workCountryType:0,workCityList: [],recruitCityList:[],positionFidList:[],pageIndex:3,pageSize:10} res requests.post(url,datadata,headersheaders) print(res.text)第二种方法: import requests url https://join.qq.com/api/v1/position/searchPosition?timestamp1727440821893 data {projectIdList:[1],keyword:,bgList:[],workCountryType:0,workCityList: [],recruitCityList:[],positionFidList:[],pageIndex:3,pageSize:10} res requests.post(url,jsondata) print(res.text)cookie cookie是存储在浏览器中的一组键值对,用来保存当前用户身份 存在时效性的会过期过期的时间一般都是服务端指定 如果访问的目标网站需要cookie, 处理的办法: 1.直接复制浏览器中登录之后的cookie, 伪装请求头中有一个cookie 存储在客户端浏览器中的一组键值对, 能够用于保存一些状态, 但有个要求必须要先登录。 import requests url https://my.4399.com/forums/index-getMtags?typegamepage1 headers {cookie:UM_distinctid18f5d84be7ab12-0d4fcf3a09be2e-26001d51-1fa400-18f5d84be7bf28;_4399tongji_vid171526094309656; _4399stats_vid17152609431943750; _gprp_c;smidV2202405111957567078c442e11c09b2676e719231c52c1f00ffe8aacc95bce90; home4399yes;Puser3073859018; Pnick%E4%B8%AD%E9%87%8E%E5%B7%A7%E5%AE%89%E6%9B%BC%E5%A6%AE; Qnick;Sauth4078826105%7C3073859018%7C1724907026%7C1725771373%7Cad31369854452fbfe2af%7C%E4%B8%AD%E9%87%8E%E5%B7%A7%E5%AE%89%E6%9B%BC%E5%A6%AE%7C%E4%B8%AD%E9%87%8E%E5%B7%A7%E5%AE%89%E6%9B%BC%E5%A6%AE%7C47e7e4cfced0bcb5a19d88b03d094613;Hm_lvt_334aca66d28b3b338a76075366b2b9e81724391240,1724906618,1724932650;ptusertypemy.4399_login; zone_guide_date1724947200; zone_guide_time2;_4399tongji_st1724933289; USESSIONIDe61b6eb4-3e07-48dd-b354-c9fe6ef545d2;Hm_lvt_5c9e5e1fa99c3821422bf61e662d4ea51724906645,1724932678,1724933289;HMACCOUNT13108745FF137EDD;Hm_lvt_e5a07b5994f78634294b9c347a5be7d21724906645,1724932678,1724933289; phlogactl1493;Uauth4399|1|2024829|my.|1724933589815|d59a0688a9891db73745cf920f83aa63;Pauth4078826105|3073859018|t3ce7n2813b76b1e854c4b9428c211e1|1724933589|10002|690950f30d878aa6ed7e245af0c9fb18|2; ck_accname3073859018; Xauth6b199edef659802ab9fac4d9eea16604;Hm_lpvt_e5a07b5994f78634294b9c347a5be7d21724933589;Hm_lpvt_5c9e5e1fa99c3821422bf61e662d4ea51724933589;Pmtime85fe178bc1e94ed171d3%7C1724933590; ol1 }res requests.get(url,headersheaders) res.encoding utf-8 print(res.text)爬虫获取群组数据 1- 找数据所在的url https://my.4399.com/forums/index-getMtags?typegamepage1 2- 请求成功之后得到的反馈信息是要先登录明明浏览器已经登录了为什么还要登录因为浏览器和代码没有关系 3- 如何解决登录问题 1- 带上登录之后的cookie:当你登录完成之后会保存一些用户信息在里面cookie中保存的内容不会永久有效时间期 限服务端决定 优点简单直接缺点会过期 2.通过模拟登录登录成功之后获取cookie(大部分网站实现登录密码都进行了加密所以这种方式不适用所有 网站但是4399可以直接传入明文服务端没做密码是否为密文的检测只做了密码是否正确的检测) # 1- 登录请求 # 2- 获取数据请求 # 模拟登录 login_url https://ptlogin.4399.com/ptlogin/login.do?v1 # post请求传入参数 import requests data {loginFrom:uframe,postLoginHandler:refreshParent,layoutSelfAdapting:false,externalLogin:qq,displayMode:embed,layout:vertical,appId:u4399,css:https://uc.img4399.com/root/css/ptlogin.css?a3993b7,mainDivId:embed_login_div,includeFcmInfo:false,level:0,regLevel:4,userNameLabel:4399用户名,userNameTip:请输入4399用户名,welcomeTip:欢迎回到4399,sec:1,password:hkyx8888, # 4399服务端支持密码传入明文但是其它网站的登录不一定支持username:3073859018, } # 登录之后的响应对象 如果登录成功服务端返回cookie保存在响应对象中 login_res requests.post(login_url,datadata) # 目标url url https://my.4399.com/forums/index-getMtags?typegamepage2 res requests.get(url,cookieslogin_res.cookies) res.encoding utf-8 print(res.text)因为访问群组页面需要先登录账号 爬虫也可以先登录服务端会返回cookie包含了用户信息 再获取目标url的时候带上登录后的cookie 小tips: 我们可以看到data里面的数据, 有这么多的键值对, 都从网上赋值过来的文本数据, 那怎么一键变为键值对数据呢? 这个其实很简单, 我们在pycharm里面打开替换文本的工具(Ctrlr快捷键打开)。 注意: 需要点亮星星哦, 就是最上面中间的地方, .*那个符号。 代码区自动会帮我们选中需要替换的区域 我们点击全部替换, 然后再给它放到一个字典里面去。 d {hca: 7AB3E94A75916BE3,cc: 1,ck: 1,cl: 24-bit,ds: 1536x960,vl: 264,ep: 5029,566,et: 3,ja: 0,ln: zh-cn,lo: 0,lt: 1727441846,rnd: 1855248226,si: e5a07b5994f78634294b9c347a5be7d2,su: https://my.4399.com/forums/mtags,v: 1.3.2,lv: 2,sn: 25299,r: 0,ww: 1523,u: https://my.4399.com/forums/mtag-78097 }以后大家可以多使用这种方法哦, 既方便又快捷, 但是需要注意的是在我们把修改好的数据全部放到新的字典里面去的时候, 每一句话的最后一行都要加分号。 实战: 获取腾讯招聘的招聘项目每一个框里面的数据(应届生的岗位投递信息, 就最下方最大的红色框里面的信息)。 自己先尝试的去做一做, 不要马上看答案哦。 参考答案: import requestspageIndex 1 count 1 # 分页获取数据 while True:url https://join.qq.com/api/v1/position/searchPosition?timestamp1727532633390headers {user-agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/129.0.0.0 Safari/537.36,cookie: UserInfo1kij6FX225E8Xm5SldigGuGG8cYEEgznyKdgtlbiSLV5y/bsU4j/m2d1S8dYWCQx0yLKUpGj4XJ3ZRiN5VrTuBbk3TnGGbSg7faVuROyuNOoS5pgSyNqCS6nc51VLWrECSpiILWyPk2xP32aoS1cWGP37hTHHQzLZeJYd/QsSTJ/sSuDenS9g26yEgmphPnHE0Bfq/EDG1XZUS41Pni2nwHYHeEgEfhNspL25x67XXcVhZgb7NYaSnklM/I2GLEH8c3gXpVU6/4jC4i6kg; loginMark02}data {bgList: [],pageIndex: pageIndex,pageSize: 10,positionFidList: [],projectIdList: [1, 2, 12, 14],recruitCityList: [],workCityList: [],workCountryType: 0}response requests.post(url, headersheaders, jsondata)data response.json()if data[data][positionList] is not None:for i in data[data][positionList]:# 工作岗位work_title i[positionTitle]# 应届生的背景bgs i[bgs]# 工作地点workCities i[workCities]print(count)print(工作岗位:, work_title)print(应届生的背景:, bgs)print(工作地点:, workCities)count 1else:breakpageIndex 1这个实战题你写出来了吗?如果写出来的话, 给自己一个掌声哦。 以上就是爬虫post收尾以及cookie的所有内容了, 如果有哪里不懂的地方,可以把问题打在评论区, 欢迎大家在评论区交流!!! 如果我有写错的地方, 望大家指正, 也可以联系我, 让我们一起努力, 继续不断的进步. 学习是个漫长的过程, 需要我们不断的去学习并掌握消化知识点, 有不懂或概念模糊不理解的情况下,一定要赶紧的解决问题, 否则问题只会越来越多, 漏洞也就越老越大. 人生路漫漫, 白鹭常相伴!!!
http://www.hkea.cn/news/14469084/

相关文章:

  • 网站服务器有什么用芯片设计公司排名
  • 模板网站首页设计wordpress免费会员中心
  • 广安 网站建设展陈公司排名
  • 品牌网站建设小蝌蚪a辽宁省网站制作
  • 在网站和网页的区别项目开发平台
  • 如何查询一个网站的空间阿里云网站建设里云官网模版
  • 深圳 德 网站建设网站开发系统
  • 网站建设哪家好网站建设哪家好网站建设哪家专业做网站 台州玉环
  • 网站建设前期开发有哪些微信开发公司
  • 做电影网站的流程门店管理系统推荐
  • 一个网站怎么优化网站都到哪里做推广
  • 四川省建设工程质量监理协会网站WordPress结婚主题模板
  • 关键词搜索工具好站网企业crm系统
  • 廊坊百度网站排名沃尔玛
  • 某种网站怎么找目前最好的免费网站
  • 手机版的学习网站个人免费开发app
  • 广州制作网站seo井陉网站建设
  • 做门户网站长沙社区赚钱吗什么推广平台好
  • 网站建设改革情况汇报app封装平台
  • 对网站专业性建设_宣传推广设计整体改进方案网站做竞价需要什么信息
  • 理县网站建设做网站没资源
  • 创业网站建设怎么样在线销售型网站
  • 免费开源建站教学网站响应式网站 解决方案
  • 自媒体横行还有做网站三门峡市建设局网站
  • 有没有专业做艺术品的网站不关闭网站备案
  • vs2013如何做网站手机网页设计尺寸
  • 邹平网站开发常见网页制作工具
  • 甘肃网站开发公司做阿里巴巴网站需要哪些资料
  • 巴中建设机械网站在中国做外国网站怎么收钱
  • 内蒙古乌海建设局网站js音乐网站模板