python爬虫怎么获取到的网站的所有url

如题所述

推荐答案 2015-12-08

首先我们可以先获取要下载图片的整个页面信息。
getjpg.py
#coding=utf-8
import urllib

def getHtml(url):
page = urllib.urlopen(url)
html = page.read()
return html

print html
　　Urllib 模块提供了读取web页面数据的接口，我们可以像读取本地文件一样读取www和ftp上的数据。首先，我们定义了一个getHtml()函数:
　　urllib.urlopen()方法用于打开一个URL地址。
　　read()方法用于读取URL上的数据，向getHtml()函数传递一个网址，并把整个页面下载下来。执行程序就会把整个网页打印输出。

温馨提示：答案为网友推荐，仅供参考

当前网址：https://verywind.cn/ee/3x2rfvyvyyv2yxre23.html

你可能感兴趣的内容

大家正在搜

非常风气网www.verywind.cn

python爬虫怎么获取到的网站的所有url

相关了解……

你可能感兴趣的内容