背景 , 原本不是爬蟲的,因公司業(yè)務(wù)需求需要一些前程無憂的數(shù)據(jù),被迫上崗,簡單的學(xué)了些python。因?yàn)榫W(wǎng)站的特殊性,訪問次數(shù)多了就要封ip,意味著還要找ip。所以在網(wǎng)上隨便找了家代理叫億牛云,然后跟客服溝通了下我這個小白的需求,客服跟我推介了他們家的爬蟲動態(tài)轉(zhuǎn)發(fā)代理,說適合我這樣的小白使用,使用方式比較簡單,我就抱著試試的想法接受了。客服給我發(fā)了一段關(guān)于python怎么使用他們家代理的代碼示例,https://www.16yun.cn/help/ss_demo/#1python。打開看了之后我以為示例就是可以直接使用的,而且客服也說過代碼示例可以直接復(fù)制使用,我就直接復(fù)制然后把目標(biāo)網(wǎng)站改成了我自己的,代碼如下
創(chuàng)新互聯(lián)公司專注于企業(yè)成都營銷網(wǎng)站建設(shè)、網(wǎng)站重做改版、鳳泉網(wǎng)站定制設(shè)計(jì)、自適應(yīng)品牌網(wǎng)站建設(shè)、HTML5、商城網(wǎng)站制作、集團(tuán)公司官網(wǎng)建設(shè)、外貿(mào)營銷網(wǎng)站建設(shè)、高端網(wǎng)站制作、響應(yīng)式網(wǎng)頁設(shè)計(jì)等建站業(yè)務(wù),價格優(yōu)惠性價比高,為鳳泉等各大城市提供網(wǎng)站開發(fā)制作服務(wù)。
#! -*- encoding:utf-8 -*-
import requests
import random
# 要訪問的目標(biāo)頁面
targetUrl = " www. mkt.51job.com"
# 要訪問的目標(biāo)HTTPS頁面
# targetUrl = "https:// www. mkt.51job.com "
# 代理服務(wù)器(產(chǎn)品官網(wǎng) www.16yun.cn)
proxyHost = "t.16yun.cn"
proxyPort = "31111"
# 代理隧道驗(yàn)證信息
proxyUser = "username"
proxyPass = "password"
proxyMeta = "http:// %(user)s : %(pass)s @ %(host)s : %(port)s " % {
"host" : proxyHost,
"port" : proxyPort,
"user" : proxyUser,
"pass" : proxyPass,
}
# 設(shè)置 http和https訪問都是用HTTP代理
proxies = {
"http" : proxyMeta,
"https" : proxyMeta,
}
# 設(shè)置IP切換頭
tunnel = random.randint( 1 , 10000 )
headers = { "Proxy-Tunnel" : str (tunnel)}
resp = requests.get(targetUrl, proxies=proxies, headers=headers)
print resp.status_code
print resp.text
然后就去運(yùn)行,結(jié)果是這樣
然后就去找客服,結(jié)果人家說那只是代碼示例,里面的代理參數(shù)是需要他們提供重新配置才可以使用,頓時就覺得自己真的很小白,然后請客服開通了代理測試了下,結(jié)果運(yùn)行起了,對我這樣的小白來還好使用的方式簡單,不然又要各種查資料了。我想很多人都是這樣吧,剛開始的時候各種小白問題都有可能存在,看來不管是哪個領(lǐng)域,還是要深入的學(xué)習(xí)才好!