当前位置: 首页 > news >正文

做网站让用seo刷新是哪个键安徽seo优化规则

做网站让用seo刷新是哪个键,安徽seo优化规则,多种语言网站制作,如何提高网站pr值准备工作 selenium安装 Selenium是广泛使用的模拟浏览器运行的库,用于Web应用程序测试。 Selenium测试直接运行在浏览器中,就像真正的用户在操作一样,并且支持大多数现代 Web 浏览器。 #终端pip安装 pip install selenium #清华镜像安装 p…

准备工作

selenium安装

Selenium是广泛使用的模拟浏览器运行的库,用于Web应用程序测试。 Selenium测试直接运行在浏览器中,就像真正的用户在操作一样,并且支持大多数现代 Web 浏览器。

#终端pip安装
pip install selenium
#清华镜像安装
pip install selenium -i https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/win-64/

安装Chrome driver

查看Google版本,并下载对应版本的驱动

下载路径

安装在anaconda的Scripts文件夹中

测试

from selenium import webdriver
# 初始化WebDriver
browser = webdriver.Chrome()

如果弹出Chrome浏览器,则说明安装成功 

 

爬虫

示例:爬取【AppleiPhone 13】Apple/苹果 iPhone 13 (A2634)128GB 绿色 支持移动联通电信5G 双卡双待手机【行情 报价 价格 评测】-京东

先导入所用的包,这样一步一步跟着做不会出错

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from bs4 import BeautifulSoup
import time

 初始化并访问

# 初始化WebDriver
browser = webdriver.Chrome()
# 访问商品页面
browser.get('https://item.jd.com/100034710036.html')
# 等待页面加载完成
time.sleep(5)

登录 

QQ、微信登录或扫码登陆均可

正常登录后的界面如下

 控制点击商品评价按钮

# 点击“商品评价”按钮
try:# 等待“商品评价”按钮可点击WebDriverWait(browser, 10).until(EC.element_to_be_clickable((By.XPATH, '//*[@id="detail"]/div[1]/ul/li[5]'))).click()
except Exception as e:print(f"Error clicking the '商品评价' button: {e}")browser.quit()exit()

正则表达式要通过F12检查页面源码去看!!!

爬取评论数据

# 设置要爬取的页数
num_pages_to_scrape = 5# 循环爬取多页评论
for page_num in range(1, num_pages_to_scrape + 1):print(f"Scraping page {page_num}...")# 等待评论加载完成try:WebDriverWait(browser, 10).until(EC.presence_of_element_located((By.CSS_SELECTOR, '.comment-item .comment-con')))except Exception as e:print(f"Error waiting for comments to load on page {page_num}: {e}")break# 获取页面源码html = browser.page_source# 使用BeautifulSoup解析HTMLsoup = BeautifulSoup(html, 'html.parser')# 提取评论数据comments = soup.select('.comment-item .comment-con')# 检查是否有评论if comments:for comment in comments:# 提取评论内容content = comment.get_text(separator='\n')print(content)else:print("No comments found on page {page_num}.")

检查是否有下一页(不是必要操作) 

因为测试时报错找不到下一页,因此添加检查是否有下一页的操作。如果上述操作没有错误,就可以不加。

# 检查是否还有下一页if page_num < num_pages_to_scrape:# 点击“下一页”按钮try:# 等待“下一页”按钮可点击next_page_button = WebDriverWait(browser, 10).until(EC.element_to_be_clickable((By.CLASS_NAME, 'ui-pager-next')))# 点击下一页按钮next_page_button.click()# 等待Ajax请求完成WebDriverWait(browser, 10).until(EC.invisibility_of_element_located((By.CLASS_NAME, 'loading-indicator')))except Exception as e:print(f"Error clicking the '下一页' button or waiting for Ajax request on page {page_num}: {e}")break

结果

爬取结果如下,每爬一页都会显示是第几页

http://www.hkea.cn/news/11817/

相关文章:

  • 丹阳网站设计产品全网营销推广
  • 网络专题策划方案网站推广优化的公司
  • 高端网站建设多少钱无锡seo网站排名
  • 网站如何做百度百科深圳网站优化平台
  • 怎么给你新网站做seo株洲今日头条新闻
  • 手机做公司网站谷歌广告开户
  • 网站开发报价单 doc网站优化的方式有哪些
  • 网站建设服务定制深圳网站做优化哪家公司好
  • 国外注册域名的网站百度seo入驻
  • 程序员做赌博类网站关键词seo培训
  • 如何做网站关键词霸屏软文广告示范
  • 建设婚纱摄影网站的重要性淘宝关键词优化
  • wordpress电商模板下载快手seo
  • 哪里网站做的好免费海报模板网站
  • 上海高凡猎头公司晋城网站seo
  • 深圳培训学校搜索广告优化
  • 网站开发费属于研发费用吗网络营销方案3000字
  • 深圳网站开发培训徐州seo外包公司
  • 自己做发小说网站外贸做网站公司哪家好
  • 北京天通苑 做网站如何推广app让别人注册
  • 大型b2b电子商务平台开发成都百度推广优化创意
  • 全国企业查询系统官网合肥正规的seo公司
  • php帝国建站系统站长工具爱情岛
  • 桂林象鼻山离哪个高铁站近网络营销公司哪家好
  • 怎样在门户网站做网络推广建站系统cms
  • 湘潭seo网站优化搜索引擎分析论文
  • 个人网站开发如何赚钱吗seo比较好的优化方法
  • 动漫新闻资讯站最大免费广告发布平台
  • 直接用ip做网站汕头seo排名收费
  • 用手机可以做网站嘛抖音怎么推广