当前位置: 首页 > news >正文

网站建站服务的公司成都seo外包

网站建站服务的公司,成都seo外包,漳州微信网站建设,用织梦做网站费用xpath是python做数据解析的库 目录 1 安装 2 解析本地的html文件 2.1 只有一个标签的情况 2.2 有多个标签的情况 3 解析网上的页面 4 xpath表达式 4.1 绝对路径 4.2 两个斜杠表示中间隔了0级或多级 4.3 通过属性查找 4.4 通过索引查找 4.5 获取文本内容…

xpath是python做数据解析的库

目录

1  安装

2  解析本地的html文件

2.1  只有一个标签的情况

2.2  有多个标签的情况

3  解析网上的页面

4  xpath表达式

4.1  绝对路径

4.2  两个斜杠表示中间隔了0级或多级

4.3  通过属性查找

4.4  通过索引查找

4.5  获取文本内容

4.6  获取属性

4.7  或运算

5  xpath返回的对象使用xpath

6  常见错误

6.1  存在没闭合的标签


1  安装

pip install lxml

2  解析本地的html文件

2.1  只有一个标签的情况

比如我想找到test.html中的title

xpath()中接的是xpath表达式,xpath就和linux中的路径一样,先是html然后是head最后找到title

由于title只有一个,所以返回的结果列表中只有一个title对象

2.2  有多个标签的情况

比如我现在想找到这两个div

3  解析网上的页面

4  xpath表达式

4.1  绝对路径

4.2  两个斜杠表示中间隔了0级或多级

可以表示0级

也可以表示多级

由于两个斜杠表示多级,所以一开始的html也没必要写了

4.3  通过属性查找

比如我找这个

再比如我找这个

4.4  通过索引查找

上面我是对tree.xpath()返回的列表进行索引,我们也可以直接写在xpath表达式中,比如我找第二个div

  • xpath表达式是从第1个算的,不算从第0个算的

4.5  获取文本内容

上面我是在外部使用的text,你也可以在里面使用text(),比如我想获得所有div的文本内容

text()只能拿到直系的文本内容,隔一层就拿不到了

如果你写 //text() 就可以拿到了

4.6  获取属性

比如我想取所有div的something属性值

只有一个div有something这个属性,所以只显示一个

换一个属性也一样,比如class

4.7  或运算

比如我现在想那 span或div 的内容

5  xpath返回的对象使用xpath

6  常见错误

6.1  存在没闭合的标签

我现在想找这个title

那我可以这样写

运行后会报错

这个错误的原因就是有没闭合的标签,比如这里的meta

我们需要闭合这里的标签

|然后再运行就可以了

http://www.hkea.cn/news/6665/

相关文章:

  • 二级域名网站如何申请吗百度精准搜索
  • 伪原创对网站的影响网站优化工具
  • 营销型网站建设空间必须是营销策划的重要性
  • 网页设计素材书店照片seo外包资讯
  • 苗木门户网站模板网络推广策划
  • 个人作品集网站模板免费下载肇庆seo
  • 怎样使用模板建立网站重庆森林经典台词独白
  • wordpress 接入小程序seo常见优化技术
  • 2019年做网站2022最近热点事件及评述
  • wordpress做seo站长工具seo综合查询是什么
  • 漳州网站建设企业网络推广公司名字大全
  • 江苏网站推广公司关键词怎么找出来
  • 西安招聘网结构优化设计
  • 娱乐网站怎么制作windows优化大师是自带的吗
  • dw做动态网站站点怎么一键免费创建论坛网站
  • 足球比赛直播平台seo网络公司
  • 跨境电商网站开发公司百度竞价托管公司
  • 设计图片网站哪个好seo入门培训学校
  • mvc做的网站aso安卓优化公司
  • 怎么做微信小程序商城优化视频
  • 企业网站优化方式做网站怎么赚钱
  • wordpress建站怎么学惠州seo推广优化
  • 黄骅港引航站seo优化网站排名
  • wordpress wedocs广州网络seo优化
  • 网站底部版权信息字体颜色淘宝指数转换工具
  • php做网站最容易百度联盟官网
  • 网站被入侵后需做的检测(1)2019年度最火关键词
  • 网站运营和维护北京关键词排名推广
  • wordpress响应式编辑器重庆关键词seo排名
  • 做问卷调查用哪个网站利尔化学股票