当前位置: 首页 > news >正文

替朋友做网站wordpress get_post_custom_values

替朋友做网站,wordpress get_post_custom_values,wordpress需要钱吗,网站域名费一年多少钱关于整理日常练习的一些爬虫小练习#xff0c;可用作学习使用。 爬取项目以学习为主#xff0c;尽可能使用更多的模块进行练习#xff0c;而不是最优解。 爬虫概要 示例python 库爬取模块request解析模块BeautifulSoup存储类型list#xff08;方便存入数据库#xff09… 关于整理日常练习的一些爬虫小练习可用作学习使用。 爬取项目以学习为主尽可能使用更多的模块进行练习而不是最优解。 爬虫概要 示例python 库爬取模块request解析模块BeautifulSoup存储类型list方便存入数据库 解析 代码示例 # -*- coding: utf-8 -*-import requests from requests.exceptions import ReadTimeout, ConnectionError, RequestException from bs4 import BeautifulSoup# 爬虫主体 def get_page(url):headers {Connection: keep-alive,Cache-Control: max-age0,User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.70 Safari/537.36,Accept: text/html,application/xhtmlxml,application/xml;q0.9,image/webp,image/apng,*/*;q0.8,application/signed-exchange;vb3,Referer: https://maoyan.com/board,}try:response requests.get(urlurl, headersheaders).textreturn responseexcept ReadTimeout: # 访问超时的错误print(Timeout)except ConnectionError: # 网络中断连接错误print(Connect error)except RequestException: # 父类错误print(Error)# 解析网页 def parse_page(html):soup BeautifulSoup(html, lxml)grid soup.find(nameol, attrs{class: grid_view})movie_list grid.find_all(li)for movie in movie_list:rank movie.find(nameem).getText()name movie.find(namespan, attrs{class: title}).getText()rating_num movie.find(namespan, attrs{class: rating_num}).getText()# bd movie.find(namep).getText().strip().replace( , \n).replace(...\n , ...\n).replace( / , \n).split(\n) # 头皮发麻字符串分解系列因为练习没用 re果然原生字符串处理麻烦的一匹strip去除空格replace替换旨在将不同信息分类存储到不同的参数如导演、主演、上映时间、上映时间和电影类型bd movie.find(namep).getText().strip().replace( , \n).replace(...\n , ...\n).replace( / , \n).split(\n) # 头皮发麻字符串分解系列因为练习没用 re果然原生字符串处理麻烦的一匹strip去除空格replace替换旨在将不同信息分类存储到不同的参数如导演、主演、上映时间、上映时间和电影类型# 豆瓣有些主演没有。。。贼蛋疼为了简便只能写个烂代码再增加一次了if len(bd) 4:bd.insert(1, 没爬到)inq movie.find(namespan, attrs{class: inq})# 处理 inq 为空的情况if not inq:inq 暂无else:inq inq.getText()# 这里直接存储到字典方便存到数据库douBanDict[rank] rankdouBanDict[name] namedouBanDict[director] bd[0]douBanDict[actor] bd[1]douBanDict[release_time] bd[2].strip() # 某些列表有空格直接strip()去除空格douBanDict[country] bd[3]douBanDict[movie_types] bd[4]douBanDict[rating_num] rating_numdouBanDict[inq] inqdouBanList.append(str(douBanDict)) # 字典先转为字符串再累加到列表中否则无法字典值会一直变return douBanListif __name__ __main__:douBanList []douBanDict {}for start in range(0, 250, 25):url https://movie.douban.com/top250?start{}filter.format(start)html get_page(url)douBanList parse_page(html)print(douBanList) 数据存储 直接是列表格式同时包含各个电影信息的字典。
http://www.hkea.cn/news/14433901/

相关文章:

  • 完整酒店网站开发网站制作com cn域名有什么区别
  • 微信电影网站怎么做的福田网站建设论文结论
  • 网站网页设计htmlseo百度推广
  • 建网站怎么赚流量网页网站的区别是什么
  • 大连网站建设开发网站建设与推广培训学校
  • 镇江做网站网站开发遇到的问题
  • 网站如何进行网络推广福州网站怎么做的
  • seo网站推广建站服务商买网站服务器
  • 淄博网站制作优化专业建设网站技术
  • 用dw做简单图片网站wordpress注册登录
  • 东莞网站自动化推广综合性门户网站是什么意思
  • 文登做网站微信上怎么做网站链接
  • 河南app手机网站制作昆明官网优化公司
  • 网站域名怎么改谁有wap网站
  • 网站开发需要干什么wordpress树形导航注册
  • html购物网站源码wordpress博客主题源码
  • 大学生做推送的网站仙桃网站设计公司
  • 推广网站优化怎么做网站建设方案服务器
  • 网站外包维护一年多少钱东莞英文建站公司
  • 企业网站建设制作公司创业邦使用什么网站模板
  • 上海网站建设百度推广公司哪家好广州广告公司有哪些
  • 做房产的一般用哪个网站好展馆设计的主题有哪些
  • ui设计师怎么做简历网站wordpress 调用模板
  • 网站建设的架构设计个人网站模版
  • 网站个人微信收款方案做1688网站到哪里找图片
  • 建设 网站协议开发软件难吗
  • 女人与狗做网站哪些人需要做网站
  • 建一个网站 服务器机房托管价格简述企业网站维护的重要性
  • 苏州网站建设营销百度开放云 wordpress
  • 东莞网站推广企业圣辉友联北京网站建设公司