Python爬虫怎么循环截取html标签中间的内容?

要循环匹配,截取一个页面里面的所有所需求的数据,定位前后两个html标签,然后获取中间的内容!

如果是中间的数据直接就用bs4最简单

from bs4 import BeautifulSoup

#这里是请求过来的额数据处理,提取标签

html = BeautifulSoup(response.text, 'html.parser')

 body = html.body       # 获取body部分数据

div = body.find("div",{'id','today'}) #用find去找div标签,id叫 today的标签里面的数据

就可以了

如果要提取标签内容比如value的值

div = body.find("input",id='hidden_title')['value']

温馨提示:答案为网友推荐,仅供参考
第1个回答  2021-03-29
正则表达式匹配
或者xpath进行匹配追问

能打个代码案例给我吗

相关了解……

你可能感兴趣的内容

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 非常风气网