python 小问题

links=soup.find_all('a',herf=re.compile(r"/view/\d+\.htm"))
for link in links:
new_url=link['herf']#请问这句什么意思?

这段代码应该是用到了python的BeautifulSoup库,这个库主要用来解析html。
首先:
links=soup.find_all('a',herf=re.compile(r"/view/\d+\.htm")) 这句意思是从一个html文本中抽取所有满足特定条件的tag并把这些tag保存到links中,特定条件有两个:1.tag=a;2.这个tag的herf属性为.../view/2119622856886100507.html结尾的网址。
其次:
for link in links:
new_url=link['herf']这个循环表示把links中所有tag的herf属性也就是网址取出来。
这段代码应该是用来爬取网址用的。
温馨提示:答案为网友推荐,仅供参考
第1个回答  2016-07-13
抓取 所有a标签中 链接地址符合 /view/数字 .html 的地址追问

new_url=link['herf']
我问的是这句,link['herf']这是什么意思

追答

links 代表一个 a标签的数组, link['href'] 就是取 a标签的 href 的值啊

相关了解……

你可能感兴趣的内容

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 非常风气网