如何使用元标记(Meta tags)
->
在前几天的教你如何使用 robots.txt 一文中我们讲到,运用 robots.txt 文件拦截或删除整个网站,那么今天就谈谈它的亲兄弟“Robots meta标签”, 它主要是针对一个个具体的页面的访问限制。它和其他的META标签(如使用的语言、页面的描述、关键词等)一样,Robots meta标签也是放在页面的<head></head>中间,专门用来告诉搜索引擎的R obots 如何抓取该页 面 的内容。
Robots meta 标签的写法:
Robots meta标签中没有大小写之分,name=”Robots”表示所有的搜索引擎, 当然也可以针对 某个具体的搜索引擎编写,如百度写为name=”BaiduSpider”。 content部分有四个指令选项:index、noindex、follow、nofollow, 指令间以“,”分隔。 index 指令告诉搜索机器人抓取该页面; follow 指令表示搜索机器人可以沿着该页面上的链接继续抓取下去; Robots meta标签的缺省值是INDEX和FOLLOW,只有inktomi除外,对于它,缺省值是index、noindex。
一般有四种组合 方法 :
要防止所有漫游器将您网站中的一页编入索引,请将以下元标记置入网页的 <head> 部分: <META NAME=”ROBOTS” CONTENT=”NOINDEX, NOFOLLOW”>
要允许其他漫游器将您网站中的页面编入索引,而只防止 Google 的漫游器将您网站中页面编入索引,应使用以下标记:
<META NAME=”GOOGLEBOT” CONTENT=”NOINDEX, NOFOLLOW”>
要允许漫游器将您网站中的页面编入索引,但要指示它不追踪外部链接,应使用以下标记: <META NAME=”ROBOTS” CONTENT=”NOFOLLOW”>
要允许漫游器将您网站中的页面编入索引,但要指示它不将该页面中的图片编入索引,应使用以下标记: <META NAME=”ROBOTS” CONTENT=”NOIMAGEINDEX”>
其中 <META NAME=”ROBOTS” CONTENT=”INDEX,FOLLOW”>可以写成<META NAME=”ROBOTS” CONTENT=”ALL”>;
<META NAME=”ROBOTS” CONTENT=”NOINDEX,NOFOLLOW”>可以写成<META NAME=”ROBOTS” CONTENT=”NONE”>
目前看来,绝大多数的搜索引擎机器人都遵守robots.txt的规则,但是对于Robots meta标签,目前支持的并不多,但是Google 搜索引擎是完全支持。
Related Posts
Subscribe to LoveBlogEarn Receive (Blogging tips and Marketing news )!
2 Comments
Trackbacks
Leave a Comment