当前位置: 首页 > news >正文

php+网站开发+pdf素材网下载

php+网站开发+pdf,素材网下载,建设 投资基金管理有限公司网站,WordPress内容页面加边框准备工作 selenium安装 Selenium是广泛使用的模拟浏览器运行的库#xff0c;用于Web应用程序测试。 Selenium测试直接运行在浏览器中#xff0c;就像真正的用户在操作一样#xff0c;并且支持大多数现代 Web 浏览器。 #终端pip安装 pip install selenium #清华镜像安装 p…准备工作 selenium安装 Selenium是广泛使用的模拟浏览器运行的库用于Web应用程序测试。 Selenium测试直接运行在浏览器中就像真正的用户在操作一样并且支持大多数现代 Web 浏览器。 #终端pip安装 pip install selenium #清华镜像安装 pip install selenium -i https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/win-64/安装Chrome driver 查看Google版本并下载对应版本的驱动 下载路径 安装在anaconda的Scripts文件夹中 测试 from selenium import webdriver # 初始化WebDriver browser webdriver.Chrome() 如果弹出Chrome浏览器则说明安装成功  爬虫 示例爬取【AppleiPhone 13】Apple/苹果 iPhone 13 (A2634)128GB 绿色 支持移动联通电信5G 双卡双待手机【行情 报价 价格 评测】-京东 先导入所用的包这样一步一步跟着做不会出错 from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC from bs4 import BeautifulSoup import time 初始化并访问 # 初始化WebDriver browser webdriver.Chrome() # 访问商品页面 browser.get(https://item.jd.com/100034710036.html) # 等待页面加载完成 time.sleep(5) 登录  QQ、微信登录或扫码登陆均可 正常登录后的界面如下 控制点击商品评价按钮 # 点击“商品评价”按钮 try:# 等待“商品评价”按钮可点击WebDriverWait(browser, 10).until(EC.element_to_be_clickable((By.XPATH, //*[iddetail]/div[1]/ul/li[5]))).click() except Exception as e:print(fError clicking the 商品评价 button: {e})browser.quit()exit() 正则表达式要通过F12检查页面源码去看 爬取评论数据 # 设置要爬取的页数 num_pages_to_scrape 5# 循环爬取多页评论 for page_num in range(1, num_pages_to_scrape 1):print(fScraping page {page_num}...)# 等待评论加载完成try:WebDriverWait(browser, 10).until(EC.presence_of_element_located((By.CSS_SELECTOR, .comment-item .comment-con)))except Exception as e:print(fError waiting for comments to load on page {page_num}: {e})break# 获取页面源码html browser.page_source# 使用BeautifulSoup解析HTMLsoup BeautifulSoup(html, html.parser)# 提取评论数据comments soup.select(.comment-item .comment-con)# 检查是否有评论if comments:for comment in comments:# 提取评论内容content comment.get_text(separator\n)print(content)else:print(No comments found on page {page_num}.)检查是否有下一页不是必要操作  因为测试时报错找不到下一页因此添加检查是否有下一页的操作。如果上述操作没有错误就可以不加。 # 检查是否还有下一页if page_num num_pages_to_scrape:# 点击“下一页”按钮try:# 等待“下一页”按钮可点击next_page_button WebDriverWait(browser, 10).until(EC.element_to_be_clickable((By.CLASS_NAME, ui-pager-next)))# 点击下一页按钮next_page_button.click()# 等待Ajax请求完成WebDriverWait(browser, 10).until(EC.invisibility_of_element_located((By.CLASS_NAME, loading-indicator)))except Exception as e:print(fError clicking the 下一页 button or waiting for Ajax request on page {page_num}: {e})break 结果 爬取结果如下每爬一页都会显示是第几页
http://www.hkea.cn/news/14381938/

相关文章:

  • 平面设计师如何做网站济南营销型网站建设公司
  • 泉州市华泰建设工程有限公司网站乐清外贸网站建设
  • 网站返回指定位置怎么做简体转繁体wordpress插件
  • wordpress 默认站点投诉网站怎么做
  • 商城网站设计定制中级网站开发工程师 试题
  • 设计家官网室内设计视频网站页面优化分析
  • 青岛制作企业网站深圳中装建设集团网站
  • wordpress无法拖动小工具seo的最终是为了达到
  • 如何在建设银行网站预约纪念币深圳做h5网站
  • wordpress 附件目录网站建设优化排名推广
  • 电子商务网站开发工具九度互联网站推广公司
  • 手机开发和网站开发前景wordpress必装的插件
  • 北京门户网站制作中信建设有限责任公司董事长
  • 鞍山网站建设公司做新闻的网站怎样赚钱
  • 推荐几个设计网站网站没有域名设置
  • 网站内容与目录结构最好的看vr影片的设备是哪个
  • 网站建设的经验总结知道源码做网站
  • 购买idc网站服务器官方网站建设必要性
  • 南京一等一网站建设无极网络科技有限公司
  • 教育行业网站制作找人做一个小网站需要多少钱
  • 网站建设技术文案品牌型网站案例
  • 网站世界排名怎么做为什么建设银行网站打不开
  • 手机模板网站商业空间设计要求
  • 网站怎么做sem优化网站做配置文件的作用
  • 河源哪里做网站设计师网站赚钱
  • 重庆市建设工程管理协会网站高端建站咨询
  • 共同建设网站协议网站建设价位
  • 大连市建设工程网官网网页设计优化网站建设可以吗
  • 蛋糕网站网页设计有没有手机网站推荐
  • 微信投票网站怎么做宁波模板建站多少钱