《Robots.txt 協議標準》介紹

[複製鏈接]
查看: 6043|回覆: 35

1584

主題

1萬

回帖

5萬

積分

管理員

Rank: 9Rank: 9Rank: 9

積分
58749
發表於 2016-2-23 13:32:37 | 顯示全部樓層 |
近期有很多站長諮詢,如何精確設置"robots.txt"文件。爲懂得決廣大年夜站長同慌綾喬的疑問,我們對《Robots.txt 協定標準》進行了翻譯,慾望此篇譯文可以或許贊助大年夜家對"robots.txt"文件有更深的懂得。


Robots.txt 是存放在站點根目次下的一個純文本文件。固然它的設置很簡單,然則感化卻很強大年夜。它可以指定引擎蜘蛛只抓取指定的內容,或者是禁止引擎蜘蛛抓取網站的部分或全部內容。


下面我們就來具體介紹一下它的應用辦法:


Robots.txt 文件應當放在網站根目次下,並且該文件是可以經由過程互聯網進行拜訪的。


例如:


Disallow: /[/td]
        [/tr]
   
[/table]


那麼,該文件必須可以或許經由過程 http://www.yourdomain.com/robots.txt 打開並看到琅綾擎的內容。


例一:經由過程"/robots.txt"禁止所有引擎蜘蛛抓取"/bin/cgi/"目次,以及 "/tmp/"目次和 /foo.html 文件,設置辦法如下:


格局:


User-agent:


用於描述引擎蜘蛛的名字,在" Robots.txt "文件中,如不雅有多條User-agent記錄解釋有多個引擎蜘蛛會受到該協定的限制,對該文件來說,至少要有一條User-agent記錄。如不雅該項的值設爲*,則該協定對任何引擎蜘蛛均有效,在" Robots.txt "文件中,"User-agent:*"如許的記錄只能有一條。


Disallow:


用於描述不欲望被拜訪到的一個URL,這個URL可所以一條完全的路徑,也可所以部分的,任何故Disallow開首的URL均不會被Robot拜訪到。


舉例:


例二:經由過程"/robots.txt"只許可某個引擎抓取,而禁止其他的引擎抓取。


例一:"Disallow:/help"


如不雅您的網站地址是 http://www.yourdomain.com/


是指/help.html 和/help/index.html都不許可引擎蜘蛛抓取。


例二:"Disallow:/help/"


是指許可引擎蜘蛛抓取/help.html,而不克不及抓取/help/index.html。


例三:Disallow記錄爲空


解釋該網站的所有頁面都許可被引擎抓取,在"/robots.txt"文件中,至少要有一條Disallow記錄。


如不雅"/robots.txt"是一個空文件,則對於所有的引擎蜘蛛,該網站都是開放的可以被抓取的。


#:
Robots.txt 協定中的註釋符。


舉例:



以下爲引用的內容:
User-agent: *
Disallow: /bin/cgi/
Disallow: /tmp/
Disallow: /foo.html




如:只許可名爲"slurp"的引擎蜘蛛抓取,而拒絕其他的引擎蜘蛛抓取 "/cgi/" 目次下的內容,設置辦法如下:



以下爲引用的內容:

            
User-agent: *
Disallow: /cgi/

            
User-agent: slurp
Disallow:

            




例三:禁止任何引擎抓取我的網站,設置辦法如下:



以下爲引用的內容:
User-agent: *
Disallow: /




例四:只禁止某個引擎抓取我的網站


如:只禁止名爲“slurp”的引擎蜘蛛抓取,設置辦法如下:



[table]
   
        [tr]
            [td]以下爲引用的內容:
User-agent: slurp
更多,請參考譯文出處:http://www.robotstxt.org/wc/norobots.html
回覆

1933

主題

1萬

回帖

5萬

積分

網站編輯

Rank: 8Rank: 8

積分
58764
發表於 2016-7-4 03:55:20 | 顯示全部樓層
難得一見的好帖
回覆 支持 反對

1584

主題

1萬

回帖

5萬

積分

管理員

Rank: 9Rank: 9Rank: 9

積分
58749
 樓主| 發表於 2016-7-4 03:27:48 | 顯示全部樓層
說的非常好
回覆 支持 反對

1943

主題

1萬

回帖

5萬

積分

網站編輯

Rank: 8Rank: 8

積分
58422
發表於 2016-7-4 04:07:11 | 顯示全部樓層
很好哦
回覆 支持 反對

1584

主題

1萬

回帖

5萬

積分

管理員

Rank: 9Rank: 9Rank: 9

積分
58749
 樓主| 發表於 2016-7-4 03:30:06 | 顯示全部樓層
不錯不錯
回覆 支持 反對

1584

主題

1萬

回帖

5萬

積分

管理員

Rank: 9Rank: 9Rank: 9

積分
58749
 樓主| 發表於 2016-7-4 03:36:58 | 顯示全部樓層
LZ真是人才
回覆 支持 反對

1584

主題

1萬

回帖

5萬

積分

管理員

Rank: 9Rank: 9Rank: 9

積分
58749
 樓主| 發表於 2016-7-29 09:33:31 | 顯示全部樓層
樓主是超人
回覆 支持 反對

1584

主題

1萬

回帖

5萬

積分

管理員

Rank: 9Rank: 9Rank: 9

積分
58749
 樓主| 發表於 2016-7-29 09:05:40 | 顯示全部樓層
頂頂多好
回覆 支持 反對

0

主題

1萬

回帖

4萬

積分

論壇元老

Rank: 8Rank: 8

積分
44163
發表於 2016-7-29 09:12:47 | 顯示全部樓層
真心頂
回覆 支持 反對

0

主題

1萬

回帖

4萬

積分

論壇元老

Rank: 8Rank: 8

積分
44163
發表於 2016-7-29 09:58:58 | 顯示全部樓層
說的非常好
回覆 支持 反對

您需要登錄後纔可以回帖 登錄 | 立即註冊

本版積分規則

精彩推薦

網站優化如何利用META標籤提升網站關鍵詞排

2017-07-04 陝西

爲什麼爲了更好的SEO優化而在網站上拼命寫

2018-02-27 泰安

如何做好網站的站內優化以及網站建設的SEO

2018-02-27 淄博

網站如何用三個方法做到讓用戶和搜索引擎都

2018-02-27 青島

爲何現在較少的網站優化站外這一個非常重要

2018-02-27 菏澤

網站優化做不好怎麼辦?SEO服務分析網站優化

2017-06-23 海南

歸納總結網站推廣中seo優化爲何離不開多元

2018-02-27 日照

美麗說的SEOseo多牛

2016-06-07 四平

讓SEO服務更專業

  • 拓客網絡服務有限公司
  • 客服電話:13410526041
  • 深圳市南山區西麗硅谷
    大學城創業園C區117

精彩SEO教程,快速SEO查詢

關注我們

Copyright 東莞SEO優化  Powered by©拓客網絡優化公司  技術支持:東莞SEO優化服務公司