1、客戶與服務(wù)器建立連接;
創(chuàng)新互聯(lián)服務(wù)項目包括濰城網(wǎng)站建設(shè)、濰城網(wǎng)站制作、濰城網(wǎng)頁制作以及濰城網(wǎng)絡(luò)營銷策劃等。多年來,我們專注于互聯(lián)網(wǎng)行業(yè),利用自身積累的技術(shù)優(yōu)勢、行業(yè)經(jīng)驗、深度合作伙伴關(guān)系等,向廣大中小型企業(yè)、政府機構(gòu)等提供互聯(lián)網(wǎng)行業(yè)的解決方案,濰城網(wǎng)站推廣取得了明顯的社會效益與經(jīng)濟效益。目前,我們服務(wù)的客戶以成都為中心已經(jīng)輻射到濰城省份的部分城市,未來相信會繼續(xù)擴大服務(wù)區(qū)域并繼續(xù)獲得客戶的支持與信任!
2、客戶向服務(wù)器提出請求;
3、睜宴服務(wù)器接受請求,并根據(jù)請求返回相應(yīng)的文件作為應(yīng)答;
4、客戶與悉州銀服務(wù)器關(guān)閉連接。
HTTP的性質(zhì):
1、HTTP是一種無狀態(tài)協(xié)議,即服務(wù)器不保留與客戶交易時的任何狀態(tài)。這就大大減輕了服務(wù)器記憶負擔(dān),從而保持較快的響應(yīng)速度。
2、HTTP是一種面向?qū)ο蟮膮f(xié)議。允許傳送任意類型的數(shù)據(jù)對象。它通過數(shù)據(jù)類型和長度來標(biāo)識所傳送的數(shù)據(jù)內(nèi)容和大小,并允許對數(shù)據(jù)進行壓縮傳送。
擴展資料
http代理的作用:
1、突破自身IP訪問限制,訪問國外站點。如:教育網(wǎng)、169網(wǎng)等網(wǎng)絡(luò)用戶可以通過代理訪問國外網(wǎng)站。
2、訪問一些單位或團體內(nèi)部資源,如某大學(xué)FTP(前提是該代理地址在該資源的允許訪問范圍之內(nèi)),使用教育網(wǎng)內(nèi)地址段免費代理服務(wù)器,就可以用于對教育 網(wǎng)開放的各類FTP下載上傳,以及各類資料查詢共享等服務(wù)。
3、隱藏真實IP:上網(wǎng)者也可以通過這種方法隱跡明藏自己的IP,免受攻擊。
參考資料來源:百度百科-http
HTTP代理指的是使用代理服務(wù)器使網(wǎng)絡(luò)用戶訪問外部百網(wǎng)站。代理服務(wù)器是介于瀏覽器和Web服務(wù)器之間襪橘的一臺服務(wù)器,是建立在超文本傳輸協(xié)議上的網(wǎng)絡(luò)瀏覽方式,作用是可以防偽部分對協(xié)議進行了限制的局域網(wǎng)。
HTTP主要運用于爬蟲大數(shù)據(jù)的抓取,網(wǎng)絡(luò)爬如果想在較短褲好好的時間內(nèi)抓取大量的數(shù)據(jù),需要配合使用HTTP代理IP,網(wǎng)絡(luò)爬蟲沒有代理IP,可以說是寸步難行了。
大多數(shù)的網(wǎng)站都會設(shè)置一個閾值,當(dāng)某個IP訪問的次數(shù)到達了閾值便會受限制;還有很多網(wǎng)站會設(shè)置一個訪問頻率,當(dāng)單位時間內(nèi)訪問頻率反人類了也會被限制,這個時候只有代理IP才可以突破這個限制。
一是可以通過IP代理可以訪問一些平常不能訪問的網(wǎng)站,我們在上網(wǎng)的時候經(jīng)常會遇到瀏覽器空等的現(xiàn)象,胡鉛這個時候http代理就派上用場了比如高匿名IP海量資源的IPIDEA。
二是提升網(wǎng)絡(luò)瀏覽速度。一些朋友經(jīng)常會遇到網(wǎng)絡(luò)奇慢的問題,此時如果你應(yīng)用了合適的代理服務(wù)器,不但網(wǎng)速獲得提升,且效果還是很明顯的。
WWW的核心——HTTP協(xié)議
眾所周知,Internet的基本協(xié)議是TCP/IP協(xié)議,目前廣泛采用的FTP、Archie Gopher等是建立在TCP/IP協(xié)議之上的應(yīng)用層協(xié)議,不同的協(xié)議對應(yīng)著不同的應(yīng)用。BR WWW服務(wù)器使用的主要協(xié)議是HTTP協(xié)議,即超文體傳輸協(xié)議。由于HTTP協(xié)議支持的服務(wù)不限于WWW,還可以是其它服務(wù),因而HTTP協(xié)議允許用戶在統(tǒng)一的界面下,采用不同的協(xié)議訪問不同的服務(wù),如FTP、Archie、SMTP、NNTP等。另外,HTTP協(xié)議還可用于名字服務(wù)器和分布式對象管理。
2.1 HTTP協(xié)議簡介
HTTP是一個屬于應(yīng)用層的面向?qū)ο蟮膮f(xié)議,由于其簡捷、快速的方式,適用于分布式超媒體信息系統(tǒng)。它攜虧于1990年提出,經(jīng)過幾年的使用與發(fā)展,得到不斷地完善和擴展。目前在WWW中使用的是HTTP/1.0的第六版,HTTP/1.1的規(guī)范化工作正在進行之中,而且HTTP-NG(Next Generation of HTTP)的建議已經(jīng)提出。
HTTP協(xié)議的主要特點可概括如下:
1.支持客戶/服務(wù)器模式。
2.簡單快速:客戶向服務(wù)器請求服務(wù)時,只需傳送請求方法和路徑。請求方法常用的有GET、HEAD、POST。每種方法規(guī)定了客戶與服務(wù)器聯(lián)系的類型不同。
由于HTTP協(xié)議簡單,使得HTTP服務(wù)器的程序規(guī)模小,因而通信速度很快。
3.靈活:HTTP允許傳輸任意類型的數(shù)據(jù)對象。正在傳輸?shù)念愋陀蒀ontent-Type加以標(biāo)記。
4.無連接:無連接的含義是限制每次連接只處理一個請求。服務(wù)亂隱器處理完客戶的請求,并收到客戶的應(yīng)答后,即斷開連接。采用這種方式可以節(jié)省傳輸時間。
5.無狀態(tài):HTTP協(xié)議是無狀態(tài)協(xié)議。無狀態(tài)是指協(xié)議對于事務(wù)處理沒有記憶能力。缺少狀態(tài)意味著如果辯陪神后續(xù)處理需要前面的信息,則它必須重傳,這樣可能導(dǎo)致每次連接傳送的數(shù)據(jù)量增大。另一方面,在服務(wù)器不需要先前信息時它的應(yīng)答就較快。
2.2 HTTP協(xié)議的幾個重要概念
1.連接(Connection):一個傳輸層的實際環(huán)流,它是建立在兩個相互通訊的應(yīng)用程序之間。
2.消息(Message):HTTP通訊的基本單位,包括一個結(jié)構(gòu)化的八元組序列并通過連接傳輸。
3.請求(Request):一個從客戶端到服務(wù)器的請求信息包括應(yīng)用于資源的方法、資源的標(biāo)識符和協(xié)議的版本號
4.響應(yīng)(Response):一個從服務(wù)器返回的信息包括HTTP協(xié)議的版本號、請求的狀態(tài)(例如“成功”或“沒找到”)和文檔的MIME類型。
5.資源(Resource):由URI標(biāo)識的網(wǎng)絡(luò)數(shù)據(jù)對象或服務(wù)。
6.實體(Entity):數(shù)據(jù)資源或來自服務(wù)資源的回映的一種特殊表示方法,它可能被包圍在一個請求或響應(yīng)信息中。一個實體包括實體頭信息和實體的本身內(nèi)容。
7.客戶機(Client):一個為發(fā)送請求目的而建立連接的應(yīng)用程序。
8.用戶代理(User agent):初始化一個請求的客戶機。它們是瀏覽器、編輯器或其它用戶工具。
9.服務(wù)器(Server):一個接受連接并對請求返回信息的應(yīng)用程序。
10.源服務(wù)器(Origin server):是一個給定資源可以在其上駐留或被創(chuàng)建的服務(wù)器。
11.代理(Proxy):一個中間程序,它可以充當(dāng)一個服務(wù)器,也可以充當(dāng)一個客戶機,為其它客戶機建立請求。請求是通過可能的翻譯在內(nèi)部或經(jīng)過傳遞到其它的服務(wù)器中。一個代理在發(fā)送請求信息之前,必須解釋并且如果可能重寫它。
代理經(jīng)常作為通過防火墻的客戶機端的門戶,代理還可以作為一個幫助應(yīng)用來通過協(xié)議處理沒有被用戶代理完成的請求。
12.網(wǎng)關(guān)(Gateway):一個作為其它服務(wù)器中間媒介的服務(wù)器。與代理不同的是,網(wǎng)關(guān)接受請求就好象對被請求的資源來說它就是源服務(wù)器;發(fā)出請求的客戶機并沒有意識到它在同網(wǎng)關(guān)打交道。
網(wǎng)關(guān)經(jīng)常作為通過防火墻的服務(wù)器端的門戶,網(wǎng)關(guān)還可以作為一個協(xié)議翻譯器以便存取那些存儲在非HTTP系統(tǒng)中的資源。
13.通道(Tunnel):是作為兩個連接中繼的中介程序。一旦激活,通道便被認為不屬于HTTP通訊,盡管通道可能是被一個HTTP請求初始化的。當(dāng)被中繼的連接兩端關(guān)閉時,通道便消失。當(dāng)一個門戶(Portal)必須存在或中介(Intermediary)不能解釋中繼的通訊時通道被經(jīng)常使用。
14.緩存(Cache):反應(yīng)信息的局域存儲。
2.3 HTTP協(xié)議的運作方式
HTTP協(xié)議是基于請求/響應(yīng)范式的。一個客戶機與服務(wù)器建立連接后,發(fā)送一個請求給服務(wù)器,請求方式的格式為,統(tǒng)一資源標(biāo)識符、協(xié)議版本號,后邊是MIME信息包括請求修飾符、客戶機信息和可能的內(nèi)容。服務(wù)器接到請求后,給予相應(yīng)的響應(yīng)信息,其格式為一個狀態(tài)行包括信息的協(xié)議版本號、一個成功或錯誤的代碼,后邊是MIME信息包括服務(wù)器信息、實體信息和可能的內(nèi)容。
許多HTTP通訊是由一個用戶代理初始化的并且包括一個申請在源服務(wù)器上資源的請求。最簡單的情況可能是在用戶代理(UA)和源服務(wù)器(O)之間通過一個單獨的連接來完成(見圖2-1)。
圖2-1
當(dāng)一個或多個中介出現(xiàn)在請求/響應(yīng)鏈中時,情況就變得復(fù)雜一些。中介由三種:代理(Proxy)、網(wǎng)關(guān)(Gateway)和通道(Tunnel)。一個代理根據(jù)URI的絕對格式來接受請求,重寫全部或部分消息,通過URI的標(biāo)識把已格式化過的請求發(fā)送到服務(wù)器。網(wǎng)關(guān)是一個接收代理,作為一些其它服務(wù)器的上層,并且如果必須的話,可以把請求翻譯給下層的服務(wù)器協(xié)議。一個通道作為不改變消息的兩個連接之間的中繼點。當(dāng)通訊需要通過一個中介(例如:防火墻等)或者是中介不能識別消息的內(nèi)容時,通道經(jīng)常被使用。 圖2-2
上面的圖2-2表明了在用戶代理(UA)和源服務(wù)器(O)之間有三個中介(A,B和C)。一個通過整個鏈的請求或響應(yīng)消息必須經(jīng)過四個連接段。這個區(qū)別是重要的,因為一些HTTP通訊選擇可能應(yīng)用于最近的連接、沒有通道的鄰居,應(yīng)用于鏈的終點或應(yīng)用于沿鏈的所有連接。盡管圖2-2是線性的,每個參與者都可能從事多重的、并發(fā)的通訊。例如,B可能從許多客戶機接收請求而不通過A,并且/或者不通過C把請求送到A,在同時它還可能處理A的請求。
任何針對不作為通道的匯聚可能為處理請求啟用一個內(nèi)部緩存。緩存的效果是請求/響應(yīng)鏈被縮短,條件是沿鏈的參與者之一具有一個緩存的響應(yīng)作用于那個請求。下圖說明結(jié)果鏈,其條件是針對一個未被UA或A加緩存的請求,B有一個經(jīng)過C來自O(shè)的一個前期響應(yīng)的緩存拷貝。
圖2-3
在Internet上,HTTP通訊通常發(fā)生在TCP/IP連接之上。缺省端口是TCP 80,但其它的端口也是可用的。但這并不預(yù)示著HTTP協(xié)議在Internet或其它網(wǎng)絡(luò)的其它協(xié)議之上才能完成。HTTP只預(yù)示著一個可靠的傳輸。
以上簡要介紹了HTTP協(xié)議的宏觀運作方式,下面介紹一下HTTP協(xié)議的內(nèi)部操作過程。
首先,簡單介紹基于HTTP協(xié)議的客戶/服務(wù)器模式的信息交換過程,如圖2-4所示,它分四個過程,建立連接、發(fā)送請求信息、發(fā)送響應(yīng)信息、關(guān)閉連接。
圖2-4
在WWW中,“客戶”與“服務(wù)器”是一個相對的概念,只存在于一個特定的連接期間,即在某個連接中的客戶在另一個連接中可能作為服務(wù)器。WWW服務(wù)器運行時,一直在TCP80端口(WWW的缺省端口)監(jiān)聽,等待連接的出現(xiàn)。
下面,討論HTTP協(xié)議下客戶/服務(wù)器模式中信息交換的實現(xiàn)。 1.建立連接 連接的建立是通過申請?zhí)捉幼?Socket)實現(xiàn)的。客戶打開一個套接字并把它約束在一個端口上,如果成功,就相當(dāng)于建立了一個虛擬文件。以后就可以在該虛擬文件上寫數(shù)據(jù)并通過網(wǎng)絡(luò)向外傳送。
2.發(fā)送請求
打開一個連接后,客戶機把請求消息送到服務(wù)器的停留端口上,完成提出請求動作。
HTTP/1.0 請求消息的格式為:
請求消息=請求行(通用信息|請求頭|實體頭) CRLF[實體內(nèi)容]
請求 行=方法 請求URL HTTP版本號 CRLF
方 法=GET|HEAD|POST|擴展方法
U R L=協(xié)議名稱+宿主名+目錄與文件名
請求行中的方法描述指定資源中應(yīng)該執(zhí)行的動作,常用的方法有GET、HEAD和POST。不同的請求對象對應(yīng)GET的結(jié)果是不同的,對應(yīng)關(guān)系如下:
對象 GET的結(jié)果
文件 文件的內(nèi)容
程序 該程序的執(zhí)行結(jié)果
數(shù)據(jù)庫查詢 查詢結(jié)果
HEAD——要求服務(wù)器查找某對象的元信息,而不是對象本身。
POST——從客戶機向服務(wù)器傳送數(shù)據(jù),在要求服務(wù)器和CGI做進一步處理時會用到POST方法。POST主要用于發(fā)送HTML文本中FORM的內(nèi)容,讓CGI程序處理。
一個請求的例子為:
GET HTTP/1.0
頭信息又稱為元信息,即信息的信息,利用元信息可以實現(xiàn)有條件的請求或應(yīng)答 。
請求頭——告訴服務(wù)器怎樣解釋本次請求,主要包括用戶可以接受的數(shù)據(jù)類型、壓縮方法和語言等。
實體頭——實體信息類型、長度、壓縮方法、最后一次修改時間、數(shù)據(jù)有效期等。
實體——請求或應(yīng)答對象本身。
3.發(fā)送響應(yīng)
服務(wù)器在處理完客戶的請求之后,要向客戶機發(fā)送響應(yīng)消息。
HTTP/1.0的響應(yīng)消息格式如下:
響應(yīng)消息=狀態(tài)行(通用信息頭|響應(yīng)頭|實體頭) CRLF 〔實體內(nèi)容〕
狀 態(tài) 行=HTTP版本號 狀態(tài)碼 原因敘述
狀態(tài)碼表示響應(yīng)類型
1×× 保留
2×× 表示請求成功地接收
3×× 為完成請求客戶需進一步細化請求
4×× 客戶錯誤
5×× 服務(wù)器錯誤
響應(yīng)頭的信息包括:服務(wù)程序名,通知客戶請求的URL需要認證,請求的資源何時能使用。
4.關(guān)閉連接
客戶和服務(wù)器雙方都可以通過關(guān)閉套接字來結(jié)束TCP/IP對話