当前位置: 首页 > news >正文

广州商务网站建设电话网站建设sem

广州商务网站建设电话,网站建设sem,房屋设计图软件免费,wordpress替换文章目录 书籍推荐正则抓取腾讯动漫数据Flask展示数据 书籍推荐 如果你对Python网络爬虫感兴趣#xff0c;强烈推荐你阅读《Python网络爬虫入门到实战》。这本书详细介绍了Python网络爬虫的基础知识和高级技巧#xff0c;是每位爬虫开发者的必读之作。详细介绍见#x1f44… 文章目录 书籍推荐正则抓取腾讯动漫数据Flask展示数据 书籍推荐 如果你对Python网络爬虫感兴趣强烈推荐你阅读《Python网络爬虫入门到实战》。这本书详细介绍了Python网络爬虫的基础知识和高级技巧是每位爬虫开发者的必读之作。详细介绍见 《Python网络爬虫入门到实战》 书籍介绍 正则抓取腾讯动漫数据 import requests import re import threading from queue import Queuedef format_html(html):li_pattern re.compile(li classret-search-item clearfix[\s\S]?/li)title_pattern re.compile(title(.*?))img_src_pattern re.compile(data-original(.*?))update_pattern re.compile(span classmod-cover-list-text(.*?)/span)tags_pattern re.compile(span href/Comic/all/theme/.*? target_blank(.*?)/span)popularity_pattern re.compile(span人气em(.*?)/em/span)items li_pattern.findall(html)for item in items:title title_pattern.search(item).group(1)img_src img_src_pattern.search(item).group(1)update_info update_pattern.search(item).group(1)tags tags_pattern.findall(item)popularity popularity_pattern.search(item).group(1)data_queue.put(f{title},{img_src},{update_info},{#.join(tags)},{popularity}\n)def run(index):try:headers {User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36}response requests.get(fhttps://ac.qq.com/Comic/index/page/{index}, headersheaders)html response.textformat_html(html)except Exception as e:print(fError occurred while processing page {index}: {e})finally:semaphore.release()if __name__ __main__:data_queue Queue()semaphore threading.BoundedSemaphore(5)lst_record_threads []for index in range(1, 3):print(f正在抓取{index})semaphore.acquire()t threading.Thread(targetrun, args(index,))t.start()lst_record_threads.append(t)for rt in lst_record_threads:rt.join()with open(./qq_comic_data.csv, a, encodinggbk) as f:while not data_queue.empty():f.write(data_queue.get())print(数据爬取完毕) Flask展示数据 上面能够实现爬取数据但是我希望展示在前端。 main.py代码如下 # coding gbk from flask import Flask, render_template import csvapp Flask(__name__)def read_data_from_csv():with open(qq_comic_data.csv, r, encodingutf-8) as f:reader csv.reader(f)data list(reader)[1:] # 跳过标题行# 统一转换人气数据为浮点数单位亿for row in data:popularity row[4]if 亿 in popularity:row[4] float(popularity.replace(亿, ))elif 万 in popularity:row[4] float(popularity.replace(万, )) / 10000 # 将万转换为亿# 按人气排序并保留前10条记录data.sort(keylambda x: x[4], reverseTrue)return data[:10]app.route(/) def index():comics read_data_from_csv()return render_template(index.html, comicscomics)if __name__ __main__:app.run(debugTrue) templates/index.html如下 !DOCTYPE html html langen headmeta charsetUTF-8title漫画信息/titlestylebody {font-family: Arial, sans-serif;background-color: #f4f4f4;color: #333;line-height: 1.6;padding: 20px;}.container {width: 80%;margin: auto;overflow: hidden;}h1 {text-align: center;color: #333;}.comic {background: #fff;margin-bottom: 20px;padding: 15px;border-radius: 10px;box-shadow: 0 5px 10px rgba(0,0,0,0.1);}.comic h2 {margin-top: 0;}.comic p {line-height: 1.25;}.comic:nth-child(even) {background: #f9f9f9;}/style /head bodydiv classcontainerh1人气前10的漫画/h1{% for comic in comics %}div classcomich2{{ comic[0] }}/h2pstrong更新信息/strong{{ comic[2] }}/ppstrong类型/strong{{ comic[3] }}/ppstrong人气/strong{{ comic[4] }}/p/div{% endfor %}/div /body /html 效果如下
http://www.hkea.cn/news/14411692/

相关文章:

  • 做的公司网站风格跟样式和别人一样做网站 推广
  • 网站服务器申请高埗仿做网站
  • 可不可以建网站做微商一个女装店网站建设的策划模板
  • 做练习题的网站建筑行业的公司有哪些
  • 做设计赚钱的网站叫人做网站多少钱
  • 沈阳网站建设开发深圳微信网站运营
  • 建设企业网站有什么好处wordpress防注册
  • 公司网站建设注意phpwind 手机网站模板
  • 山东网页制作网站北京互联网金融公司排名
  • 读经典做临床报名网站网站建站网站哪家好
  • 免费的网站建造建立网站例题
  • 如何做手机app开发长春seo公司
  • 做视频网站的服务器什么是网站内页
  • 网站建设设计制作 熊掌号域名服务器查询
  • 毕设做网站怎么命题建设部网站 合同格式
  • 网站开发语言开发网站宝建站助手
  • 做网站还需要买空间吗境外服务器代理平台
  • 在微信上做彩票网站c2c模式的基本要素不包括( )?
  • 如何做网站不容易被攻击网页设计免费模板代码下载
  • 深圳 网站策划陕西交通建设集团公司网站
  • c 做网站开发菜鸟是什么网站
  • 活动汪活动策划网站asp网站源码下载
  • 做网站用什么笔记本配置l兰州网站建设
  • 网站建设需要固定ip地址吗建设凡科网站
  • 怎么做废品收购网站如何在网站上做网页链接
  • 上海婚恋网站排名网站建设毕业设计目录
  • 关于我校校园网站建设的调研报告做盗版电影网站
  • 苏州营销型网站开发公司系部网站建设管理方案
  • wordpress加载模板扬中如何优化网站
  • 网站备案时间就是正式上线时间吗网站开发 工期安排