links=soup.find_all('a',herf=re.compile(r"/view/\d+\.htm"))
for link in links:
new_url=link['herf']#请问这句什么意思?
这段代码应该是用到了python的BeautifulSoup库,这个库主要用来解析html。
首先:
links=soup.find_all('a',herf=re.compile(r"/view/\d+\.htm")) 这句意思是从一个html文本中抽取所有满足特定条件的tag并把这些tag保存到links中,特定条件有两个:1.tag=a;2.这个tag的herf属性为.../view/2119622856886100507.html结尾的网址。
其次:
for link in links:
new_url=link['herf']这个循环表示把links中所有tag的herf属性也就是网址取出来。
这段代码应该是用来爬取网址用的。
首先:
links=soup.find_all('a',herf=re.compile(r"/view/\d+\.htm")) 这句意思是从一个html文本中抽取所有满足特定条件的tag并把这些tag保存到links中,特定条件有两个:1.tag=a;2.这个tag的herf属性为.../view/2119622856886100507.html结尾的网址。
其次:
for link in links:
new_url=link['herf']这个循环表示把links中所有tag的herf属性也就是网址取出来。
这段代码应该是用来爬取网址用的。
温馨提示:答案为网友推荐,仅供参考
第1个回答 2016-07-13
抓取 所有a标签中 链接地址符合 /view/数字 .html 的地址追问
new_url=link['herf']
我问的是这句,link['herf']这是什么意思
links 代表一个 a标签的数组, link['href'] 就是取 a标签的 href 的值啊