当前位置: 首页 > news >正文

网站建站服务的公司传媒公司

网站建站服务的公司,传媒公司,网站建设和架构,1688登陆首页登录xpath是python做数据解析的库 目录 1 安装 2 解析本地的html文件 2.1 只有一个标签的情况 2.2 有多个标签的情况 3 解析网上的页面 4 xpath表达式 4.1 绝对路径 4.2 两个斜杠表示中间隔了0级或多级 4.3 通过属性查找 4.4 通过索引查找 4.5 获取文本内容…

xpath是python做数据解析的库

目录

1  安装

2  解析本地的html文件

2.1  只有一个标签的情况

2.2  有多个标签的情况

3  解析网上的页面

4  xpath表达式

4.1  绝对路径

4.2  两个斜杠表示中间隔了0级或多级

4.3  通过属性查找

4.4  通过索引查找

4.5  获取文本内容

4.6  获取属性

4.7  或运算

5  xpath返回的对象使用xpath

6  常见错误

6.1  存在没闭合的标签


1  安装

pip install lxml

2  解析本地的html文件

2.1  只有一个标签的情况

比如我想找到test.html中的title

xpath()中接的是xpath表达式,xpath就和linux中的路径一样,先是html然后是head最后找到title

由于title只有一个,所以返回的结果列表中只有一个title对象

2.2  有多个标签的情况

比如我现在想找到这两个div

3  解析网上的页面

4  xpath表达式

4.1  绝对路径

4.2  两个斜杠表示中间隔了0级或多级

可以表示0级

也可以表示多级

由于两个斜杠表示多级,所以一开始的html也没必要写了

4.3  通过属性查找

比如我找这个

再比如我找这个

4.4  通过索引查找

上面我是对tree.xpath()返回的列表进行索引,我们也可以直接写在xpath表达式中,比如我找第二个div

  • xpath表达式是从第1个算的,不算从第0个算的

4.5  获取文本内容

上面我是在外部使用的text,你也可以在里面使用text(),比如我想获得所有div的文本内容

text()只能拿到直系的文本内容,隔一层就拿不到了

如果你写 //text() 就可以拿到了

4.6  获取属性

比如我想取所有div的something属性值

只有一个div有something这个属性,所以只显示一个

换一个属性也一样,比如class

4.7  或运算

比如我现在想那 span或div 的内容

5  xpath返回的对象使用xpath

6  常见错误

6.1  存在没闭合的标签

我现在想找这个title

那我可以这样写

运行后会报错

这个错误的原因就是有没闭合的标签,比如这里的meta

我们需要闭合这里的标签

|然后再运行就可以了

http://www.khdw.cn/news/41755.html

相关文章:

  • 别人做的网站百度网站验证百度智能建站平台
  • 网页设计建网站流程营销软件排名
  • 网站怎么设置标题关键词分析工具有哪些
  • 药品在哪些网站做推广电脑优化软件排行榜
  • 怎么用hbuilder做网站成都seo优化推广
  • 网站开发费用明细电商seo是什么
  • 制作网站的花多少钱seocui cn
  • 天津做网站公司百度移动权重
  • 黔西南做网站的有几家邯郸seo优化公司
  • 新公司网站建设云建站
  • 毕业设计网站设计十大搜索引擎神器
  • 昌平网站建设浩森宇特小红书关键词热度查询
  • 网站制作吧西安核心关键词排名
  • 怎么架设个人网站谷歌搜索引擎大全
  • 做公司网站写什么信息seo是什么单位
  • 做网站的框架软文是什么东西
  • 什么平台可以找客源成都网站建设seo
  • dw做网站一般需要多大尺寸品牌运营中心
  • 怎么在b2b网站上发信息让百度收录怎么做广告sem是什么意思
  • 网站软件开发招聘外贸建站服务推广公司
  • 营商环境建设局网站怎么接推广
  • 沈阳 建设工程 招标中心网站网络营销策划的内容
  • 做代购网站如何缴税谷歌商店paypal下载官网
  • 中国建设银行官网站企业网银什么是搜索引擎销售
  • jfinal网站开发模板网站优化比较好的公司
  • 做变形字的网站百度网站优化公司
  • 网站制作的管理微信营销推广
  • 免费网站打包google关键词工具
  • 没有自己的网站做百度竞价福州短视频seo公司
  • 网站数据库空间增大如何注册域名