网站优化教程:对robots.txt的优化 -东北IT网

登录论坛 | 注册会员

设为首页 | 收藏本站

top

濞戞挻绮岀€垫娊寮堕崘銊㈡瀱IT闂傚倶鍔嶉崺娑氱博閿燂拷

adtop

当前位置 : 首页>软件学院>程序开发>网页设计>正文

网站优化教程:对robots.txt的优化

http://www.dbit.cn　2010/5/7 7:18:21 　来源:东北IT网　编辑:叶子

首先，我来介绍一下什么是robots.txt：robots.txt是搜索引擎中访问网站的时候要查看的第一个文件。Robots.txt文件告诉蜘蛛程序在服务器上什么文件是可以被查看的。当一个搜索蜘蛛访问一个站点时，它会首先检查该站点根目录下是否存在robots.txt，如果存在，搜索机器人就会按照该文件中的内容来确定访问的范围；如果该文件不存在，所有的搜索蜘蛛将能够访问网站上所有没有被口令保护的页面。最后，robots.txt必须放置在一个站点的根目录下。

大家可以参考一下谷歌、百度和腾讯的robots写法：

http://www.google.com/robots.txt

http://www.baidu.com/robots.txt

http://www.qq.com/robots.txt

大家了解完robots.txt后，那么我们可以用robots.txt来做什么？

1、用robots.txt屏蔽相似度高的页面或没内容的页面。

我们知道，搜索引擎收录网页后，会对网页进行“审核”，而当两个网页的相似度很高时，那么搜索引擎就会删除掉其中一个，并且会降低一点你网站的得分。

假设以下这两个链接，内容其实差不多，那么第一个链接就应该屏蔽掉。

/XXX?123

/123.html

像第一个的链接这样的链接非常多，那么我们要怎么屏蔽呢?其实只要屏蔽/XXX?就可以屏蔽所有的链接了。

代码如下：

Disallow： /XXX?

同理，一些没有内容的页面我们也可以利用相同的办法将其屏蔽掉。

2、用robots.txt屏蔽多余的链接，一般保留静态的链接（既HTML、htm、shtml等）。

由于网站中经常会出现多个链接指向同一个页面的情况，而这样会让搜索引擎对网站的友好度降低。为了避免这一个情况，我们就可以通过robots.txt把非主要的链接去掉。

比如以下两个链接指向同样的页面：

/OOO?123

/123.html

那么我们就应该去掉第一个垃圾，代码如下：

Disallow： /OOO?123

3、用robots.txt屏蔽死链

死链就是曾经存在的网页，因为改版或其他原因而失去效用后就变成死链，也就是说看似一个正常的网页链接，但点击后不能打开相对应的网页页面。

比如，原来在目录为/seo下的所有链接，因为目录地址的改变，现在都变成死链接了，那么我们可以用robots.txt把他屏蔽掉，代码如下：

Disallow： /seo/

4、告诉搜索引擎你的sitemap.xml地址

利用robots.txt可以告诉搜索引擎你sitemap.xml文件的地址，而不需要在网站上添加sitemap.xml的链接。具体代码如下：

Sitemap：你的sitemap地址

以上就是robots.txt的基本用法，一个好的网站必定会有一个好的robots.txt，因为robots.txt是搜索引擎了解你网站的一个途径。另外在这里我推荐一下一个比较适合wordpress用户使用的robots.txt写法：

User-agent： *

Disallow： /wp-

Disallow： /feed/

Disallow： /comments/feed

Disallow： /trackback/

Sitemap： http://rainjer.com/sitemap.xml

最后，如果你觉得上面所说的还不能满足你的需要，那么你可以在谷歌或百度官方提供的robots.txt使用指南学习：

百度：http://www.baidu.com/search/robots.html

谷歌：http://www.google.com/support/forum/p/webmasters/thread?tid=4dbbe5f3cd2f6a13&hl=zh-CN

【收藏】【打印】【进入论坛】

推荐文章

2016年第五届中国国际POS机及相关设备展

互联网电视熟了吗 2013最火电视深解析

桑达获邀出席2015中国（广州）国际POS机

宝获利报名参加“2015年度中国POS机行业

八卦图解

More>>


叛逆嫩模性感写真	宫如敏不雅照疯传看张馨予韩一菲

周伟童魔鬼身材日本性感写真图	联想V360笔记本模特写真

闁稿繐鍘栫花顒勫嫉椤掑倻褰� - 闁艰鲸姊婚柈鎾箣閹存粍绮� - 闁归攱绋戦崣鐑樼▕娴肩补鏀� - 妤犵偛鐏濋幉锟犲嫉瀹ュ懎顫� - 闁告瑥顑嗛崕蹇涙煣閻愵剙澶�

閺夊牏绁P濠㈣鎷�06014875闁告瑱鎷�

Tel:024-88340056 Mob:13066598927 Email:WebMaster QQ:69424720

缂傚啯鍨归悵鐤㏎缂傚浄鎷�:缂備礁绻橀弨銏ゅ疮閿燂拷:65477551 闁瑰灈鍋撻柡鍫灣閸忥拷:28526281 濞存粌鏈晶婊堟偨娴ｅ啫澹�:24536322 缂傚洢鍊涚€氳櫕瀵煎鍗炲弮:24815709 缂佹梹鐟╅弳杈╃礃閿燂拷:8052026 濞存粌鏈晶婊堟偨娴ｅ啫澹�:57897142 缂備礁绻橀弨銏ゅ疮閿燂拷:20966008 婵炴挸鎲￠崹娆戠礃閿燂拷:65477153