如何书写robots.txt和robots.txt的都能干什么
允许所有的robot访问
User-agent: *
Disallow:
或者也可以建一个空文件 "/robots.txt" file
禁止所有搜索引擎访问网站的任何部分
User-agent: *
Disallow: /
禁止所有搜索引擎访问网站的几个部分(下例中的01、02、03目录)
User-agent: *
Disallow: /01/
Disallow: /02/
Disallow: /03/
禁止某个搜索引擎的访问(下例中的BadBot)
User-agent: BadBot
Disallow: /
只允许某个搜索引擎的访问(下例中的Crawler)
User-agent: Crawler
Disallow:
User-agent: *
Disallow: /
robots.txt的用法
第一,用robots屏蔽网站重复页
很多网站一个内容提供多种浏览版本,虽然很方便用户却对蜘蛛造成了困难,因为它分不清那个是主,那个是次,一旦让它认为你在恶意重复,兄弟你就惨了
User-agent: *
Disallow: /sitemap/ 《禁止蜘蛛抓取 文本网页》
第二,用robots保护网站安全
很多人纳闷了,robots怎么还和网站安全有关系了?其实关系还很大,不少低级黑客就是通过搜索默认后台登陆,以达到入侵网站的目标
User-agent: *
Disallow: /admin/ 《禁止蜘蛛抓取admin目录下所有文件》
第三,防止盗链
一般盗链也就几个人,可是一旦被搜索引擎“盗链”那家伙你100M宽带也吃不消,如果你做的不是图片网站,又不想被搜索引擎“盗链”你的网站图片
User-agent: *
Disallow: .jpg$
第四,提交网站地图
现在做优化的都知道做网站地图了,可是却没几个会提交的,绝大多数人是干脆在网页上加个链接,其实robots是支持这个功能的
Sitemap:https://www.sem-home.com/sitemap.html
第五,禁止某二级域名的抓取
一些网站会对VIP会员提供一些特殊服务,却又不想这个服务被搜索引擎检索到
User-agent: *
Disallow: /
以上五招robots足以让你对搜索引擎蜘蛛掌控能力提升不少,就像百度说的:我们和搜索引擎应该是朋友,增加一些沟通,才能消除一些隔膜。
下面说说nofollow
最先提出nofollow的是领头新创的一个标签,目的是尽量减少垃圾链接对搜索引擎的影响。这个标签的意义是告诉搜索引擎这个链接不是经过作者自己编辑的,所以这个链接不是一个信任票。搜索引擎看到这个标签就可能减少或完全取消链接的投票权重。最初的原因是,随着网络博客的流行,垃圾评论和垃圾链接逐渐泛滥,引起Google的重视并率先提出了反抗方案。Google的措施是通过一种新型标签有效的阻止这类垃圾评论和垃圾链接。自此一旦Google发现超链接中含有该属性(“rel=nofollow”),这类链接不会被作为某站点在搜索结果排名中的评价依据;同时该标签不会成为垃圾评论所在博客或网页的负面投票,它仅用于防止垃圾制造者博客评论,反馈表单或推荐列表等公众领域通过混淆视听而受益。Nofollow标签对搜索引擎很重要。
但是讲了这么多nofollow,什么是nofollow标签呢?如何使用nofollow标签?下面是Google对于rel=“nofollow”的解释:When Google sees the attribute rel=“nofollow” on hyperlinks, those links won‘t get any credit when we rank websites in our search results. 就是一旦Google发现超链接中含有该属性(“rel=nofollow”),这类链接不会被作为某站点在搜索结果排名中的评价依据。
nofollow标签还有另外一个作用,如果你在网站上卖广告,可以使用这个标签。因为买卖网页广告的初衷应该是流量,而不是PR值或试图影响搜索引擎排名。加上这个标签完全不会影响流量,但是有可能减少对搜索引擎排名的影响。
现在谈谈nofollow标签对链接的作用,有人会问加了这个标签真的对链接投票权重和PR值有影响吗?这一点是存有疑问的在博客评论和论坛帖子里面的链接就不一样了,这些链接是用户和读者自己加的,而不是网站拥有人或作者加的。在很多情况下,作者也不会去看这些链接去了什么网站。所以对这些网站的质量当然是不知道的。我从来没有说从我的网站连出去的评论链接很重要,然后收钱让大家加链接,或者要求读者链接回来。博客评论里的链接虽然是外部链接,但对搜索引擎排名和PR值来说没什么用。
为什么单独说说这两个呢,听一个哥们说经过实践证明robots.txt和nofollow 两个都不管用,具体我是没试过,感兴趣的朋友可以试试。更多的精彩内容尽在北京seo
文章评论