爬虫是爬URL还是 HTML的文本内容啊?哪位大神可以解释一下嘞

如题所述

第1个回答  2016-03-05
爬虫爬得是文本内容。首先你的网址并不能反映出你这网站到底是做什么的,再次网址是你网站的路径,爬虫是根据你的网址找到你的网站的。
爬虫爬得是你的网站文件,不是你的网站页面。
再有就是在代码里面,只有文本是一目了然可见的,所以爬虫也只有爬文本才知道你的网站到底在表达什么。
rul只是一个路径,在网络上指向你想表现的内容。它的功能就跟导航一样,只能带着爬虫去目的地,但是它不知道目的地种的是什么花本回答被网友采纳

相关了解……

你可能感兴趣的内容

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 非常风气网