SEO过程中可能遇到不希望搜索引擎收录的页面和链接,noindex和nofollow两个标签就是为了解决这个问题。
noindex:禁止收录该页
nofollow:禁止抓取该链接
一、noindex和nofollow用法
noindex用法
Meta robots标签必须放在<head>和</head>之间,格式:<meta name="robots" content="noindex">。
作用:告诉搜索引擎不要收录该页,如果该页已经收录,那么删除已经收录页面。
nofollow用法
nofollow有两种用法
1、Meta robots标签必须放在<head>和</head>之间,格式:<meta name="robots" content=”nofollow”>。
作用:告诉搜索引擎不要抓取该页所有链接。
2、放在链接中<a rel=” nofollow” href=”url”>
作用:告诉搜索引擎不要抓取该链接。
二、noindex和nofollow混合使用
INDEX命令:告诉搜索引擎允许抓取这个页面
FOLLOW命令:告诉搜索引擎可以从这个页面上抓取链接,然后继续访问抓取下去。
NOINDEX命令:告诉搜索引擎不允许抓取这个页面
NOFOLLOW命令:告诉搜索引擎不允许从此页面抓取链接、拒绝其继续访问。
四种使用情况
根据以上的命令,我们就有了一下的四种组合
<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">:可以抓取本页,而且可以顺着本页继续索引别的链接
<META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">:不许抓取本页,但是可以顺着本页抓取索引别的链接
<META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW">:可以抓取本页,但是不许顺着本页抓取索引别的链接
<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">:不许抓取本页,也不许顺着本页抓取索引别的链接。
这里需要注意的是,不要把两个对立的反义词写到一起,例如
<META NAME="ROBOTS" CONTENT="INDEX,NOINDEX">
三、noindex和nofollow使用环境情况
1、让搜索引擎不要收录该页,如果已经收录则删除(去掉已经有排名的网页),允许搜索引擎抓取该页其他链接。
使用:<meta name="robots" content="noindex">。
<meta name="robots" content="noindex">和<META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">效果一样。
2、让搜索引擎不要收录该页,如果已经收录则删除(去掉已经有排名的网页),禁止搜索引擎抓取该页其他链接。
使用<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">。
3、不允许搜索引擎抓取该页链接(该页可以正常抓取)。
使用:<meta name="robots" content=”nofollow”>或者<META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW">。
4、不允许抓取本文某一个链接。
使用:<a rel=” nofollow” href=”url”>。
备注:
META NAME="ROBOTS"指所有的搜索引擎的,也可以指定某一个搜索引擎,例如META NAME="Googlebot(谷歌蜘蛛)"、META NAME="Baiduspider(百度蜘蛛)、META NAME="HaoSouSpider(好搜蜘蛛)”、META NAME="Sogou News Spider ”(搜狗蜘蛛)"等。content部分有四个命令:index、noindex、follow、nofollow,命令间以英文的“,”分隔。