真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

Robots.txt是什么

Robots.txt是你穿告訴搜索機(jī)器人哪些頁面你會(huì)喜歡他們不能夠訪問您的網(wǎng)站的文本(而不是html)文件。Robots.txt是不是強(qiáng)制性的搜索引擎,但是搜索引擎一般遵守他們都問什么不該做。務(wù)必要澄清robots.txt不從防止搜索引擎抓取您的網(wǎng)站(即它是不一的防火墻或密碼保護(hù)的一種)的一種方法,您放置一個(gè)robots.txt文件的事實(shí)是有點(diǎn)像把一條注釋"請(qǐng)不要輸入"一個(gè)解鎖的門——上如不能防止小偷進(jìn)來,但好人,將不打開門,然后輸入。也就是為什么我們說是否真的有森sitive數(shù)據(jù),是太依賴robots.txt,以防止被索引,并顯示在搜索結(jié)果的不完善。

創(chuàng)新互聯(lián)長期為上千家客戶提供的網(wǎng)站建設(shè)服務(wù),團(tuán)隊(duì)從業(yè)經(jīng)驗(yàn)10年,關(guān)注不同地域、不同群體,并針對(duì)不同對(duì)象提供差異化的產(chǎn)品和服務(wù);打造開放共贏平臺(tái),與合作伙伴共同營造健康的互聯(lián)網(wǎng)生態(tài)環(huán)境。為增城企業(yè)提供專業(yè)的成都網(wǎng)站制作、做網(wǎng)站、外貿(mào)營銷網(wǎng)站建設(shè),增城網(wǎng)站改版等技術(shù)服務(wù)。擁有10余年豐富建站經(jīng)驗(yàn)和眾多成功案例,為您定制開發(fā)。


robots.txt的位置是非常重要的。它必須是主目錄中,因?yàn)榉駝t用戶代理(搜索引擎)不會(huì)能夠找到它——他們不中搜索名為robots.txt的文件的整個(gè)站點(diǎn)。相反,他們首先主目錄(如http://mydomain.com/robots.txt)中查找和他們那里找不到它,如果他們只是假定此站點(diǎn)沒有robots.txt文件,因此他們索引他們發(fā)現(xiàn)路上的一切。因此,如果你不穿robots.txt中適當(dāng)?shù)奈恢茫灰@訝搜索引擎索引了您的整個(gè)站點(diǎn)。
概念與結(jié)構(gòu)的robots.txt已發(fā)展了十多年前,如果您有興趣進(jìn)一步了解它,請(qǐng)?jiān)L問http://www.robotstxt.org/或因?yàn)檫@篇文章中,我們會(huì)處理只與一個(gè)robots.txt文件的重要的環(huán)節(jié),您可以轉(zhuǎn)到標(biāo)準(zhǔn)的機(jī)器人排除直。下一步我們會(huì)與結(jié)構(gòu)繼續(xù)robots.txt文件。
Robots.txtFile的結(jié)構(gòu)
一個(gè)robots.txt的結(jié)構(gòu)是相當(dāng)簡單(和幾乎不能靈活)–它是用戶代理和不允許的文件和目錄的一個(gè)無窮列表?;旧希Z法如下所示:
用戶代理:
不允許:
"用戶代理"是搜索引擎的抓取工具和不允許:列出的文件和要從索引中排除的目錄。在"用戶代理:"和"不允許:"條目,您可以包含注釋行–只是在行的開頭放置,#號(hào):
#所有用戶代理不都允許以查看該/temp目錄。
用戶代理:*
不允許:/temp/
Robots.txtFile的陷阱
當(dāng)你開始做復(fù)雜的文件–即您決定允許不同的用戶代理訪問不同的目錄–可以開始問題,如果你沒有支付費(fèi)用的robots.txt文件陷阱,特別重視。常見的錯(cuò)誤包括打字錯(cuò)誤和有沖突的指令。拼寫錯(cuò)誤的用戶-代理后用戶代理和Disallow,,缺少冒號(hào)的目錄包括拼寫錯(cuò)誤等。打字錯(cuò)誤可以很難找到,但在某些情況下驗(yàn)證工具的幫助。
更嚴(yán)重的問題是有邏輯錯(cuò)誤。例如:
用戶代理:*
不允許:/temp/
用戶代理:Googlebot
不允許:/images/
不允許:/temp/
不允許:/cgi-bin/
上面的示例中是一個(gè)允許訪問除在/temp站點(diǎn)上的所有內(nèi)容的所有代理的robots.txt從目錄。達(dá)在這里很好,但更高版本在那里是另一個(gè)記錄,為Googlebot指定限制性更強(qiáng)的條款。Googlebot開始讀取robots.txt,它會(huì)看到所有文件夾除外/temp/并都允許的(包括Googlebot本身)的所有用戶代理。這是足夠的了解,它不會(huì)讀到文件和一切除了/temp/-包括/images/和/cgi-bin,會(huì)索引/,你認(rèn)為你已經(jīng)告訴它不要Googlebot。你看到一個(gè)robots.txt文件結(jié)構(gòu)的簡單但仍嚴(yán)重的錯(cuò)誤可以方便地進(jìn)行。
用于生成和驗(yàn)證Robots.txt文件工具
記住,你可以有一個(gè)robots.txt文件的簡單語法,您可以始終閱讀這一切都是可以的但它是更易于使用驗(yàn)證程序類似這樣:http://tool.motoricerca.info/robots-checker.phtml。這些工具報(bào)告有關(guān)常見的錯(cuò)誤,如缺少斜杠或冒號(hào),檢測不到的如該會(huì)危及你的努力。為例如果您鍵入:
user-agent:*
不允許:/temp/
這是錯(cuò)誤的因?yàn)橛?用戶"和"代理"之間沒有斜杠和語法不正確。

在這種情況下當(dāng)您有一個(gè)復(fù)雜的robots.txt文件–即你給不同的用戶代理的不同指令或您有一長串的目錄和子目錄中排除,編寫文件手動(dòng)可以一個(gè)真正的痛苦。但不用擔(dān)心,——有的工具,將為您生成該文件。什么是更多有允許選擇哪些文件,并點(diǎn)的可視化工具,是要排除的文件夾。即使你不喜歡為robots.txt代買一個(gè)圖形化的工具,但在在線工具為您提供幫助。為例服務(wù)器端機(jī)器人發(fā)電機(jī)提供的用戶代理的下拉列表,您可以列出文件的文本框,您不希望建立索引。坦白的說,它不好幫了除非您想要設(shè)置特定的規(guī)則,為不同的搜索引擎,因?yàn)樵谌魏吻闆r下,您鍵入的目錄列表,但不只是什么。

本文由網(wǎng)站建設(shè)公司創(chuàng)新互聯(lián)發(fā)布,轉(zhuǎn)載請(qǐng)注明文章出處!


當(dāng)前文章:Robots.txt是什么
分享鏈接:http://weahome.cn/article/speihd.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部