当前位置: 首页 > news >正文

深圳做外贸网站公司如何对网站做进一步优化

深圳做外贸网站公司,如何对网站做进一步优化,网店模板图片,wordpress小工具找不到正则表达式基础 元字符 B站教学视频#xff1a; 正则表达式元字符基本使用 量词 贪婪匹配和惰性匹配 惰性匹配如下两张图#xff0c;而 .* 就表示贪婪匹配#xff0c;即尽可能多的匹配到符合的字符串#xff0c;如果使用贪婪匹配#xff0c;那么结果就是图中的情况三 p…正则表达式基础 元字符 B站教学视频 正则表达式元字符基本使用 量词 贪婪匹配和惰性匹配 惰性匹配如下两张图而 .* 就表示贪婪匹配即尽可能多的匹配到符合的字符串如果使用贪婪匹配那么结果就是图中的情况三 python中re模块 re模块的常用方法 import re# findall(正则表达式 待匹配的字符串) - 符合正则表达式的内容以列表的形式返回 # 含义匹配字符串中所有符合正则表达式的内容以列表的形式返回 res_findall re.findall(r\d, 中国移动10086中国联通10010) print(res_findall) # [10086, 10010]# re.finditer(正则表达式 待匹配的字符串) - 符合正则表达式的内容以迭代器的形式返回 # 含义匹配字符串中所有符合正则表达式的内容以迭代器的形式返回 res_finditer re.finditer(r\d, 中国移动10086中国联通10010) print(res_finditer) # callable_iterator object at 0x000001CB2875B340 for item in res_finditer:下面两行输出语句的输出结果如下re.Match object; span(5, 10), match1008610086re.Match object; span(16, 21), match1001010010item 中还有其他的方法如item.start()/item.end()分别表示匹配到的字符串在原字符串中的起始索引和结束索引print(item) # 得到match对象print(item.group()) # 得到匹配的字符串# re.search(正则表达式 待匹配的字符串) - 符合正则表达式的内容返回match对象 # 含义匹配字符串中第一个匹配到的符合正则表达式的内容返回match对象 res_search re.search(r\d, 中国移动10086中国联通10010) print(res_search) # re.Match object; span(5, 10), match10086 print(res_search.group()) # 10086# 上述三种方法都是全文匹配而match是从头开始匹配 # re.match(正则表达式 待匹配的字符串) - 符合正则表达式的第一个字符串内容返回match对象 # 含义从待匹配的字符串的第一个字符开始匹配将匹配到的第一个结果返回返回的是match对象 res_match re.match(r\d, 中国移动10086中国联通10010) print(res_match) # None字符串开头不是数字所以等于匹配不成功结果为空 # print(res_match.group()) # 报错 res_match re.match(r\d, 10086中国联通10010) print(res_match) # re.Match object; span(0, 5), match10086 print(res_match.group()) # 10086# 预加载 # 应用场景在爬虫中想要从网页中匹配到想要的内容匹配的正则表达式可能会很复杂 # 而又多次的使用到该正则表达式则可以预加载正则表达式 # 如下好处就是该正则可以反复使用 obj re.compile(r\d) res1 obj.findall(中国移动10086中国联通10010) res2 obj.finditer(中国移动10086中国联通10010) res3 obj.search(中国移动10086中国联通10010) res4 obj.match(中国移动10086中国联通10010) 分组匹配 s div classjay周杰伦/divdiv classjj林俊杰/div# (?Pname.*?) 分组匹配P为大写相当于把括号中的.*?匹配到的内容给变量name # 然后通过item.group(name)获取到name的值 # 只要把想要单独获取的内容按以上形式(?Pxxx正则表达式) 即可获取 # re.S 的作用就是让 . 也可以匹配到换行符 # flags 是re模块中compile、match、findall等方法的一个参数具体用法可以百度 obj re.compile(rdiv class.*?(?Pname.*?)/div, re.S) res obj.finditer(s) print(res) # callable_iterator object at 0x0000020F2E89AEC0 for item in res:输出结果如下re.Match object; span(5, 31), matchdiv classjay周杰伦/divdiv classjay周杰伦/div周杰伦re.Match object; span(36, 61), matchdiv classjj林俊杰/divdiv classjj林俊杰/div林俊杰print(item) # re.Match object; span(5, 31), matchdiv classjay周杰伦/divprint(item.group()) # div classjay周杰伦/divprint(item.group(name)) # 周杰伦 注关于re模块方法中的flags参数作用可以百度一下 案例——豆瓣top250re解析版 B站视频教程爬取豆瓣top250电影 import requests import re import csvurl https://movie.douban.com/top250 headers {User-Agent: xxx写上自己电脑的 } resp requests.get(url, headersheaders) # print(resp.text) # 没加headers之前结果为空说明网站有一些反扒机制 pattern (rli.*?div classitem.*?span classtitle(?Pname.*?)/span.*?r导演: (?Pdirector.*?)nbsp;.*?主演: (?Pperformer.*?)...br.*?rspan classrating_num propertyv:average(?Pscore\d.\d)/span)obj re.compile(pattern, re.S) res obj.finditer(resp.text) # 把获取到的数据存入CSV文件方便以后对数据进行操作 # 关于CSV文件请百度 f open(data.csv, modew, encodingutf-8) csv_writer csv.writer(f) # 表示向文件写入数据 for i in res:# print(i.group(name))# print(i.group(director))# print(i.group(performer))# print(i.group(score).strip())dic i.groupdict() # 将数据以字典形式返回# print(dic)# 将字典的值按行写入文件文件中的每一行就是一部电影的信息# csv文件中每一行数据以逗号分隔每个值csv_writer.writerow(dic.values()) f.close() resp.close() print(数据解析完成)部分csv文件内容如下
http://www.hkea.cn/news/14564067/

相关文章:

  • 做旅行同业的网站建筑设计网课
  • 新网站友链建设工程安全信息网
  • 公司企业文化内容优化英文
  • 网站反连接php网站开发试卷
  • 南昌网站优化方案网站后台登入密码忘记了
  • python能否做网站做网站彩票网站吗
  • 徐州建站公司模板牙科医院网站源码
  • 网站建设与管理个人总结百度收录快速提交
  • 上海简约网站建设公司电子商务网站设计步骤
  • 网站建设分录织梦系统seo网站模板
  • 免费销售网站模板网站开发用哪个linux
  • wordpress 制作网站网上学电脑培训中心
  • 相城做网站的公司网站建设 鄂icp备
  • 17网站一起做网批广州开发网站报价
  • 公司建站方案前端asp网站开发
  • 湖北二师网站建设排名郴州做网站的公司
  • 能够做代理的网站网站建设怎么打广告
  • 网站建设制做暧小说在线观看网站
  • 可以做分析图的地图网站网络营销的未来发展趋势
  • 东莞网站制作品牌祥奔科技企业设计公司
  • 网站开发设计流程文档今天足球赛事推荐
  • 新蒲建设集团网站网站建设企业网站怎么做
  • seo站点是什么意思mysql python开发网站开发
  • 专业行业网站建站报价沈阳手机端建站模板
  • 站长平台怎么做网站网站建设 丽水
  • 创建本地网站做系统的网站
  • 免费网站自助建站企业网络信息安全
  • 用局域网建设网站海南工程建设招标网
  • 网站关键词基础排名怎么做wordpress自动上传至cdn
  • 怎么做网站关键词排名花房姑娘直播