本篇內容主要講解“Web安全的URL結構是什么”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“Web安全的URL結構是什么”吧!
目前創(chuàng)新互聯(lián)建站已為上1000家的企業(yè)提供了網站建設、域名、網站空間、綿陽服務器托管、企業(yè)網站設計、豐臺網站維護等服務,公司將堅持客戶導向、應用為本的策略,正道將秉承"和諧、參與、激情"的文化,與客戶和合作伙伴齊心協(xié)力一起成長,共同發(fā)展。
在介紹百分號編碼前,還要了解URL需要對哪些字符進行編碼。
RFC3986文檔規(guī)定,URL中只允許包含英文字母(a~z、A~Z)、數字(0~9)、“-”“_”“.”“~” 4個特殊字符以及所有保留字符。
所謂的保留字符就是劃分URL的,分隔不同組件的字符。
百分號編碼的編碼方式非常簡單,使用百分號(%)加上兩個字符(0123456789ABCDEF),表示為一個字節(jié)的十六進制的形式。URL編碼默認使用的字符集是ASCII碼。例如,井號(#)對應的十六進制是0x23,所以它的URL編碼就為%23。對于非ASCII字符,需要使用ASCII字符集的超集進行編碼得到相應的字節(jié),然后對每個字節(jié)執(zhí)行百分號編碼。
在傳輸前,瀏覽器會對 URL 進行編碼。接收 URL 的服務器主要負責對接收到的 URL進行解析。URL的使用過程當中,由于互聯(lián)網上的每個網頁大多會引用與它同服務器甚至是同級目錄下的文件,就會使用到相對URL的概念。在介紹URL編碼時,展示的是絕對URL,這就相當于電腦中的相對路徑與絕對路徑的區(qū)別。所以在解析的時候,服務器需要區(qū)分相對URL與絕對URL。
按照規(guī)范里的說法,要區(qū)分兩者非常簡單。如果 URL 字符串不是一個有效的協(xié)議名,后面跟的不是冒號(:)或雙斜杠(//),那么它就是一個需要被引用的相對 URL。其實在實際應用中,對于相對 URL 的解析是有規(guī)范的,因為不同瀏覽器的具體實現千差萬別,有效協(xié)議名稱的字符集也各有不同,還有各種替代雙斜杠(//)分隔符的方法,因此,接下來會對相對URL的解析進行一個歸類。
(1)有協(xié)議名稱,但沒有授權信息(http:abc.txt)。這是一個比較有名的漏洞,它的產生是由RFC3986規(guī)范疏忽所致。在規(guī)范中將這些地址描述為無效的絕對地址,但在提供的解析算法中又將這種地址的解析搞錯了。所以這種形式的URL,在執(zhí)行過程中會被理解為相對地址來進行處理。例如,在某些情況下,http:abc.txt會被理解為相對地址,而https:example.com會被解釋為絕對地址。
(2)沒有協(xié)議名,但有授權信息(//example.com)。這種寫法在規(guī)范中給出了較為完整的處理。面對這種URL,瀏覽器會自動補全該URL。
(3)沒有協(xié)議名,沒有授權信息,但有路徑(../robots.txt)。這是一種比較常見的用法,協(xié)議和授權信息都從引用URL里復制過來,然后將這個相對地址進行補全。
(4)沒有協(xié)議名,沒有授權信息,沒有路徑,但有查詢的字符串(?username=abc)。在這種情況下,協(xié)議、授權信息、路徑全都會原封不動地從原引用 URL 復制過來。查詢字符串和字段ID則來自于相對URL。
(5)只有片段 ID(#bunnies)。這種方式也是如此,其他部分全部原封不動地從原引用URL復制,只替換字段ID的部分。
到此,相信大家對“Web安全的URL結構是什么”有了更深的了解,不妨來實際操作一番吧!這里是創(chuàng)新互聯(lián)網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續(xù)學習!