当前位置: 首页 > news >正文

济南建网站品牌自适应网站建设

济南建网站,品牌自适应网站建设,seo关键词的优化技巧,北京网站建设有哪些公司好文章目录 需求爬取星巴克产品以及图片#xff0c;星巴克菜单 python爬虫爬取结果 需求 爬取星巴克产品以及图片#xff0c;星巴克菜单 网页分析#xff1a; 首先#xff0c;需要分析星巴克官方网站的结构#xff0c;了解菜单栏的位置、布局以及菜单项的标签或类名等信息… 文章目录 需求爬取星巴克产品以及图片星巴克菜单 python爬虫爬取结果 需求 爬取星巴克产品以及图片星巴克菜单 网页分析 首先需要分析星巴克官方网站的结构了解菜单栏的位置、布局以及菜单项的标签或类名等信息。发送 HTTP 请求 使用 Python 的 requests 模块发送 HTTP GET 请求获取星巴克网页的 HTML 内容。解析 HTML 使用一个 HTML 解析库如 BeautifulSoup解析网页的 HTML 内容以便从中提取出菜单栏的数据。定位菜单栏元素 使用解析库的选择器功能如 CSS 选择器或 XPath定位菜单栏所在的 HTML 元素。提取菜单数据 从菜单栏元素中提取菜单项的信息可能包括菜单项名称、图片等。数据存储 将提取的菜单数据存储到适合的数据结构中。 python爬虫 获取网页源码这里没有反爬手段不需要添加其他参数 import urllib from bs4 import BeautifulSoup import requestsbase_url https://www.starbucks.com.cn/menu/ response urllib.request.urlopen(base_url) content response.read().decode(utf-8)soup BeautifulSoup(content, lxml)方法一soup的select方法 # 方法一select方法 import os# 文件保存路径 save_path ./practice_071_星巴克/ if not os.path.exists(save_path): os.makedirs(save_path)name_list soup.select(ul[classgrid padded-3 product]) # name_list[0].select(li div)[0][style] for name in name_list:submenu_pic name.select(li div)submenu_name name.select(li strong)for pic_url,name in zip(submenu_pic, submenu_name):suffix pic_url[style].split(()[-1].split())[0]# 文件地址 和 名称picture_url https://www.starbucks.com.cn suffixpicture_name name.get_text() .jpg# 文件不支持名称中含有字符 /, picture_name picture_name.strip().replace(/, or)# 方法1urlretrieve# urllib.request.urlretrieve(urlpicture_url, filenameos.path.join(save_path,picture_name))# 方法2写入文件形式src_response urllib.request.urlopen(picture_url)pic_content src_response.read()with open(os.path.join(save_path,picture_name), wb) as fp:fp.write(pic_content)print({} 完成地址为 {}.format(picture_name, picture_url)) 方法二soup的find\find_all方法 # 方法二find/find_all方法 menu_list soup.find(div, class_wrapper fluid margin page-menu-list).find_all(li)for name in menu_list:suffix name.find(div)[style].split(()[-1].split())[0]# 文件地址 和 名称picture_url https://www.starbucks.com.cn suffixpicture_name name.find(strong).get_text() .jpg# 文件不支持名称中含有字符 /, picture_name picture_name.strip().replace(/, or)urllib.request.urlretrieve(urlpicture_url, filenameos.path.join(save_path,picture_name))print({} 完成地址为 {}.format(picture_name, picture_url))爬取结果
http://www.hkea.cn/news/14479603/

相关文章:

  • 建筑网站建设赏析免费网站下载大全
  • 企业做网站公司排名口碑详情页设计策划
  • 更新网站的步骤wordpress建站如何微信
  • 花生壳动态域名做网站做两个阿里网站吗
  • 云网站建设017年青吴忠市建设工程质量监督站网站
  • 怎么知道网站哪家公司做的网络营销导向的网站建设
  • 文化网站前置审批定位网站关键词
  • 搭建网站宣传建设小说网站小说源
  • 主题网站设计域名防红直连
  • 作文库网站娱乐网站设计多少行业
  • ppt免费下载完整版免费下载西安做网站优化公司报价
  • 网站设计建设有限公司国外 电子 商务 网站 欣赏
  • 济南做网站的公司有哪些十大永久免费财务软件
  • 个性化网站建设定制苏州电商关键词优化
  • 驻马店市住房和城乡建设局网站wordpress二维码管理插件下载
  • 网站建设的面试要求公司网站建设费如何入账
  • 年栾洪全单页做网站教程百度上海总部
  • 怎么样网站吸引人天天向上做图网站
  • 企业网站seo推广技巧类似于美团的网站怎么做
  • 有源码手机怎么搭建网站国内wordpress主题免费
  • 网站开发什么意思p2p理财网站开发框架
  • 如何请人创建一个网站旅游网站建设网
  • 成都网站制作公司电话c 还可以做网站
  • 建站公司是外包吗陕西省建设网三类人员证书查询系统
  • 卫浴洁具网站模板建设银行嘉兴分行官方网站
  • 优秀英文企业网站大型旅行社自建网站
  • 晋城市建设局网站山西大同专业网站建设制作价格
  • php中英双语农业公司网站源码wordpress微商
  • 怎么进入网站后台管理系统app下载量查询
  • 房地产公司网站建设pptwordpress post_class