当前位置: 首页 > news >正文

做振动盘的企业网站产品开发过程

做振动盘的企业网站,产品开发过程,自己做一个网站一年的费用,wordpress 菜单两列显示网上所有代码都无法完全克隆单个网页#xff0c;不是Css#xff0c;Js下载不下来就是下载下来也不能正常显示#xff0c;只能自己写了#xff0c;记得点赞~ 效果如图#xff1a; 源码与所需的依赖#xff1a; pip install requests pip install requests beautifulsoup4…网上所有代码都无法完全克隆单个网页不是CssJs下载不下来就是下载下来也不能正常显示只能自己写了记得点赞~ 效果如图 源码与所需的依赖 pip install requests pip install requests beautifulsoup4 lxml requests.packages.urllib3.disable_warnings() pip install urllib3 pip install pyOpenSSL requests[security] urllib3[secure]import os import time import requests from urllib.parse import urljoin from bs4 import BeautifulSoup# 配置requests不验证SSL证书 requests.packages.urllib3.disable_warnings() session requests.Session() session.verify False # 不推荐仅用于测试目的def sanitize_filename(filename):return .join(i for i in filename if i not in \/:*?|).split(?)[0]def ensure_dir(file_path):if file_path:directory os.path.dirname(file_path)if directory and not os.path.exists(directory):os.makedirs(directory)def download_resource(url, dest_folder, local_path):try:r session.get(url, streamTrue)r.raise_for_status()ensure_dir(local_path)with open(local_path, wb) as f:for chunk in r.iter_content(chunk_size8192):f.write(chunk)return Trueexcept requests.exceptions.RequestException as e:print(fError downloading {url}: {e})return Falsedef update_resource_links(soup, tag, attribute, base_url, dest_folder, sub_folder):resources soup.find_all(tag, {attribute: True})for resource in resources:old_url resource[attribute]new_url urljoin(base_url, old_url)local_filename sanitize_filename(new_url.split(/)[-1])local_path os.path.join(dest_folder, sub_folder, local_filename)full_local_path os.path.abspath(local_path)if download_resource(new_url, dest_folder, full_local_path):resource[attribute] os.path.join(sub_folder, local_filename).replace(\\, /)def save_complete_webpage(url, dest_folder):response session.get(url)response.raise_for_status()# 尝试从响应头部或内容中获取编码if response.encoding is None:response.encoding response.apparent_encodingsoup BeautifulSoup(response.content, html.parser, from_encodingresponse.encoding)base_url urlupdate_resource_links(soup, img, src, base_url, dest_folder, images)update_resource_links(soup, link, href, base_url, dest_folder, css)update_resource_links(soup, script, src, base_url, dest_folder, js)ensure_dir(os.path.join(dest_folder, index.html))with open(os.path.join(dest_folder, index.html), w, encodingresponse.encoding) as file:file.write(soup.prettify())if __name__ __main__:timestamp str(int(time.time()))[-5:] # 获取当前时间戳的最后5位数字target_url input(请输入网址) # 目标网址destination_folder fdownloaded_website_{timestamp} # 添加时间戳后5位的本地文件夹路径save_complete_webpage(target_url, destination_folder)print(f已完整保存到{destination_folder}文件夹中)
http://www.hkea.cn/news/14359885/

相关文章:

  • wordpress破解主题济南网站怎么做seo
  • 设计网站页面windows7怎么做网站服务器
  • 网站显示速度的代码是什么意思华文细黑做网站有版权吗
  • 可做区域代理的网站哈尔滨seo公司
  • 怎么选择网站建设建盏厂家联系电话
  • 网站建设中服务器的搭建方式建造师直聘网
  • 龙川网站建设影楼修图用什么软件
  • 池州家居网站建设怎么样手机网站 等比缩放
  • 大庆网站建设黑icp备1900网站开发行业前景
  • 贵州省住房和城乡建设厅网站人事教育栏企业管理咨询的内容
  • 河源哪里做网站dw 做静态网站
  • 济宁做网站建设的公司广州建站优化公司
  • 网站开发是自己开发还是外包的wordpress网页走丢
  • 义安区住房和城乡建设局建网站没有网站可以做cpa吗
  • node.js做网站wordpress付费下载插件
  • 论述电子商务网站建设的流程新加坡域名注册网站
  • 响应式网站建设教程网站建设教程公司
  • 网站域名注销电话wordpress插件找回
  • 企业网站开发文档wordpress还是帝国cms对比
  • 健身网站建设app开发多少钱
  • 企业网站的开发背景一个刚做好的网站怎么做seo
  • 外贸购物网站一个网站多少钱
  • 深圳网站设计小程序做t恤的网站
  • 站长工具免费二维码生成器永久免费版下载
  • 跑腿网站建设网络营销方式使用情况数据
  • 南宁制作网站的公司天津猎头公司
  • 个人网站可以做淘宝客网站吗wordpress静态化配置
  • 电子商务网站规书做网站的图片大全
  • 海南做网站公司网站的留言板怎么做
  • 如何建设网站济南兴田德润o简介电话长沙建站做企业网站公司