1、限制IP地址單位時(shí)間的訪問次數(shù)
創(chuàng)新互聯(lián)建站專注于豐城企業(yè)網(wǎng)站建設(shè),成都響應(yīng)式網(wǎng)站建設(shè)公司,電子商務(wù)商城網(wǎng)站建設(shè)。豐城網(wǎng)站建設(shè)公司,為豐城等地區(qū)提供建站服務(wù)。全流程定制網(wǎng)站,專業(yè)設(shè)計(jì),全程項(xiàng)目跟蹤,創(chuàng)新互聯(lián)建站專業(yè)和態(tài)度為您提供的服務(wù)
分析:沒有哪個(gè)常人一秒鐘內(nèi)能訪問相同網(wǎng)站5次,除非是程序訪問,而有這種喜好的,就剩下搜索引擎爬蟲和討厭的采集器了。
弊端:一刀切,這同樣會(huì)阻止搜索引擎對(duì)網(wǎng)站的收錄
適用網(wǎng)站:不太依靠搜索引擎的網(wǎng)站
采集器會(huì)怎么做:減少單位時(shí)間的訪問次數(shù),減低采集效率
2、屏蔽ip
分析:通過后臺(tái)計(jì)數(shù)器,記錄來訪者ip和訪問頻率,人為分析來訪記錄,屏蔽可疑Ip。
弊端:似乎沒什么弊端,就是站長忙了點(diǎn)
適用網(wǎng)站:所有網(wǎng)站,且站長能夠知道哪些是google或者百度的機(jī)器人
采集器會(huì)怎么做:打游擊戰(zhàn)唄!利用ip代理采集一次換一次,不過會(huì)降低采集器的效率和網(wǎng)速(用代理嘛)。
3、利用js加密網(wǎng)頁內(nèi)容
Note:這個(gè)方法我沒接觸過,只是從別處看來
分析:不用分析了,搜索引擎爬蟲和采集器通殺
適用網(wǎng)站:極度討厭搜索引擎和采集器的網(wǎng)站
采集器會(huì)這么做:你那么牛,都豁出去了,他就不來采你了
4、網(wǎng)頁里隱藏網(wǎng)站版權(quán)或者一些隨機(jī)垃圾文字,這些文字風(fēng)格寫在css文件中
分析:雖然不能防止采集,但是會(huì)讓采集后的內(nèi)容充滿了你網(wǎng)站的版權(quán)說明或者一些垃圾文字,因?yàn)橐话悴杉鞑粫?huì)同時(shí)采集你的css文件,那些文字沒了風(fēng)格,就顯示出來了。
適用網(wǎng)站:所有網(wǎng)站
采集器會(huì)怎么做:對(duì)于版權(quán)文字,好辦,替換掉。對(duì)于隨機(jī)的垃圾文字,沒辦法,勤快點(diǎn)了。
5、用戶登錄才能訪問網(wǎng)站內(nèi)容
分析:搜索引擎爬蟲不會(huì)對(duì)每個(gè)這樣類型的網(wǎng)站設(shè)計(jì)登錄程序。聽說采集器可以針對(duì)某個(gè)網(wǎng)站設(shè)計(jì)模擬用戶登錄提交表單行為。
適用網(wǎng)站:極度討厭搜索引擎,且想阻止大部分采集器的網(wǎng)站
采集器會(huì)怎么做:制作擬用戶登錄提交表單行為的模塊
根本的解決方法是:后臺(tái)校驗(yàn)
后臺(tái)接口進(jìn)行用戶權(quán)限驗(yàn)證和請(qǐng)求參數(shù)是否合法的的驗(yàn)證。如果用戶有權(quán)限且修改的內(nèi)容屬于正常修改(修改后的值在允許范圍內(nèi)) 則通過,否則不允許修改,返回錯(cuò)誤提示。
其他的方法都不能從根本上防止抓包后模擬請(qǐng)求的問題。get、post就是一個(gè)http請(qǐng)求,這個(gè)請(qǐng)求是瀏覽器正常點(diǎn)擊發(fā)起的還是通過程序模擬的,在后臺(tái)接口是不能百分之百判斷的。
因?yàn)椴徽撌菫g覽器發(fā)起還是程序發(fā)起,它確實(shí)就是一個(gè)正常的http請(qǐng)求,各種cookie、referer、header都可以是一模一樣的。
沒有抓包軟件抓不到的。只有是抓到能不能給抓包軟件識(shí)別出是不是正常代碼而已。例如HTTPS協(xié)議,或者加如證書?;蛘呒用芰酥笤貵ET,POST。