如题所述
Disallow: /*?* 意思是禁止收录页面地址带有问号、问号前后有任意值的页面(*表示任意值)。
disallow在字典中是这样定义的“舍弃”(deny)这个词的拒绝,谢绝同意,不接受,的意思,在网络中的意思就是告诉搜索引擎蜘蛛都有哪些文件不被抓取,也成为禁止抓取。
扩展资料
例如:
. 禁止所有SE(搜索引擎)收录本站:
User-agent: *
Disallow: /
它的用途是告诉上一子集,确定某个对象用的。
网站日志中比较常见的问题:
1、反馈代码200:这个是正常抓取代码,表示页面能够正常访问,出现这个代码没什么太多问题。
2、反馈代码300:属于正常代码,个人认为是根据用户的需求跳转到对应页面。
3、反馈代码301:没什么毛病,用户访问某一个页面,自动跳转到另一个页面,301是可以传递权重的
参考资料来源:百度百科-Disallow
Disallow: /*?*表示禁止带问号的页面以及问号前后的任何值(*表示任何值)。
一般情况下,大多数网站创建者或管理员都会在网站的放置一个名为的文本文件,用来控制自己的网站哪些目录允许SE爬行并收录,哪些目录禁止搜索引擎收录,Disallow,正是robots.txt文件中设置禁止搜索引擎收录哪些目录的一个词语。
扩展资料
User-agent:_____ 空白处为定义搜索引擎的类型;
Crawl-delay:_____ 空白处为定义抓取延迟;
Disallow:_____ 空白处为定义禁止搜索引擎收录的地址;
Allow:_____ 空白处为定义允许搜索引擎收录的地址;
参考资料来源:
本回答被网友采纳Disallow: /
Disallow: /*?* 意思是禁止收录页面地址带有问号、问号前后有任意值的页面(*表示任意值)。追问
以前没有添加这些限制的时候,百度收录了,现在添了这些限制好像百度不怎么收录,而谷歌有收录这是怎么回事
追答添加后需要一定时间的,收不收录还要受到其它很多因素的影响。论坛的话,一般伪静态可能做得不是很完善,比如Discuz!,点击分类后,帖子列表是没有伪静态的,可以自己做一下修改。不想被收录的链接加上nofollow。
本回答被提问者采纳