網(wǎng)站是一個(gè)企業(yè)對(duì)外的宣傳名片,人們對(duì)于網(wǎng)站的第一印象往往就是對(duì)于企業(yè)的第一評(píng)價(jià)。關(guān)于網(wǎng)站的服務(wù)器租用,不少企業(yè)覺得大同小異,不用糾結(jié)。創(chuàng)新互聯(lián)中心小編想提醒大家,這里面的關(guān)系可大著呢?
今天為什么要說一下網(wǎng)站404問題,最近看case過程中發(fā)現(xiàn)個(gè)很有意思的網(wǎng)站,該網(wǎng)站被灌了大量的垃圾信息,被其發(fā)現(xiàn)后及時(shí)地進(jìn)行了刪除,這一點(diǎn)是值得肯定的。通常情況下,正常網(wǎng)站將自動(dòng)返回404狀態(tài)碼,搜索引擎進(jìn)行更新并刪除,避免對(duì)網(wǎng)站用戶及搜索引擎帶來負(fù)面影響。但問題來了,該網(wǎng)站只刪除了內(nèi)容,沒有任何主體內(nèi)容的頁面被保存了下來,未做404處理。當(dāng)然,存在一類網(wǎng)站只刪除內(nèi)容后返回正常200狀態(tài)碼,提醒一句“該內(nèi)容已刪除”,但其都沒有??梢园l(fā)現(xiàn)目前這個(gè)搜藏中的url仍然正常返回200,http://cang.baidu.com/Lee/snap/3b0a0cc8e7d7899facd36fad.html,造成的后果:搜索引擎將花費(fèi)大量的資源在這種無效頁面上,那么,同等耗損下用在重要頁面上的資源將被大量擠占,可想而知,正常優(yōu)質(zhì)頁面在搜索引擎的部分表現(xiàn)將受到影響。經(jīng)過我們運(yùn)營同學(xué)的多方溝通下至今仍未進(jìn)一步處理。我覺得,21世紀(jì)第二個(gè)十年了,這種問題不應(yīng)該再存在了的。
好吧,承認(rèn)我被打敗了。簡單說一下:
404狀態(tài)碼代表‘Not Found’,spider更新時(shí)會(huì)認(rèn)為該頁面已失效,此時(shí)呢將在索引庫中刪除,短期內(nèi)spider再次發(fā)現(xiàn)該url不再會(huì)抓取。因此,出來了兩類問題:第一,網(wǎng)頁臨時(shí)性打不開;第二,頁面永遠(yuǎn)無法打開。針對(duì)第一類問題,我建議不要立刻返回404,而是使用503。503等同于告訴spider該頁面臨時(shí)訪問不了,過段時(shí)間再來光臨。關(guān)于503,spider會(huì)認(rèn)為該網(wǎng)頁臨時(shí)無法訪問,短期內(nèi)會(huì)再光臨。如果網(wǎng)頁已經(jīng)恢復(fù),即刻正常抓取;如果繼續(xù)返回503,短期內(nèi)還會(huì)再光臨幾次,但如果該頁面長時(shí)間返回503,該url仍會(huì)被認(rèn)作失效鏈接,從索引庫中刪除。針對(duì)第二類問題,永遠(yuǎn)無法打開的頁面,404,不用考慮。各種web2類頁面刪除后同樣需要返回404告知搜索引擎該頁面已失效。
回歸之前那個(gè)網(wǎng)站,刪除內(nèi)容后該頁面沒有任何價(jià)值。最恰當(dāng)?shù)奶幚硎牵?br />1、直接做死鏈處理并返回404;
2、在百度站長平臺(tái)死鏈提交工具中提交死鏈sitemap。
最后呢,提醒一下各位站長朋友,當(dāng)您的網(wǎng)站存在被發(fā)布大量垃圾信息時(shí),請(qǐng):
1、及時(shí)刪除相關(guān)垃圾頁面,并做404處理;
2、制作符合要求的死鏈sitemap;
3、登錄百度站長平臺(tái),進(jìn)入死鏈提交工具提交死鏈sitemap。
首先是服務(wù)器自身的問題。用戶租用的服務(wù)器應(yīng)該是各類組建的配置是十分合理的,租用品牌服務(wù)器是比較靠譜的決定。
此外數(shù)據(jù)中心提供充足的網(wǎng)絡(luò)以及電力保障也是十分重要的軟硬件措施。
創(chuàng)新互聯(lián)建站美國高防御云服務(wù)器,低至699元起。
E3-123016GB帶寬100M CN2直連防御10G DDOS699元
E5-2620*232GB帶寬100M CN2直連防御10G DDOS1499元
E5-262032GB帶寬100M CN2直連防御50G DDOS1750元
詳情可咨詢官網(wǎng)客服:631063699