真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

前端開發(fā)中的字符編碼有哪些

這篇文章將為大家詳細(xì)講解有關(guān)前端開發(fā)中的字符編碼有哪些,小編覺得挺實(shí)用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。

創(chuàng)新互聯(lián)服務(wù)項(xiàng)目包括愛民網(wǎng)站建設(shè)、愛民網(wǎng)站制作、愛民網(wǎng)頁制作以及愛民網(wǎng)絡(luò)營銷策劃等。多年來,我們專注于互聯(lián)網(wǎng)行業(yè),利用自身積累的技術(shù)優(yōu)勢、行業(yè)經(jīng)驗(yàn)、深度合作伙伴關(guān)系等,向廣大中小型企業(yè)、政府機(jī)構(gòu)等提供互聯(lián)網(wǎng)行業(yè)的解決方案,愛民網(wǎng)站推廣取得了明顯的社會效益與經(jīng)濟(jì)效益。目前,我們服務(wù)的客戶以成都為中心已經(jīng)輻射到愛民省份的部分城市,未來相信會繼續(xù)擴(kuò)大服務(wù)區(qū)域并繼續(xù)獲得客戶的支持與信任!

前端開發(fā)過程中會接觸各種各樣的編碼,比較常見的主要是UTF-8和HTML實(shí)體編碼,但是web前端的世界卻不止這兩種編碼,而且編碼的選擇也會 造成一定的問題,如前后端開發(fā)過程中不同編碼的兼容、多字節(jié)編碼可能會造成的XSS漏洞等。因此,本文旨在更好的全面了解涉及前端開發(fā)領(lǐng)域的字符編碼,避 免可能出現(xiàn)的交互和開發(fā)中的忽視的漏洞。

前端開發(fā)中的字符編碼有哪些

URL編碼

我曾經(jīng)在URL編碼解碼和base64一文中講述了URL編碼中的三組函數(shù),并對比了這三組函數(shù)與base64編碼的關(guān)系,在此簡要說明一下。
escape/unescape函數(shù)針對寬字符做unicode編碼,并針對碼值做十六進(jìn)制編碼,所以使用escape針對漢字編碼會得到形 如”\uxxxx”的結(jié)果;encodeURI/decodeURI,encodeURIComponent/decodeURIComponent函數(shù) 針對寬字節(jié)編碼卻不同于escape,首先針對寬字節(jié)字符進(jìn)行UTF-8編碼,然后針對編碼后的結(jié)果進(jìn)行“%”替換,得到結(jié)果。以上所述都是針對寬字節(jié)字 符而言,對于編碼靠前的ASCII字符而言,上述三組函數(shù)的安全字符的范圍也有所不同,具體可在上文中了解。

base64編碼

base64編碼在前端通常用于圖片和icon的編碼,它將每3個8位字節(jié)為一組,分成4組6位字節(jié),并且每個字節(jié)的高位補(bǔ)零,形成4個8位的字 節(jié),由此可看出base64編碼是可逆推的。在大多數(shù)瀏覽器中,提供了ASCII字符的base64編碼函數(shù),即window.btoa()。該函數(shù)無法 針對寬字節(jié)進(jìn)行base64編碼,若針對中文編碼,則需現(xiàn)轉(zhuǎn)換位UTF-8編碼,然后進(jìn)行base64編碼。

function unicodeToBase64(s){ return window.btoa(unescape(encodeURIComponent(s))) }

通過encodeURIComponent對寬字節(jié)字符編碼,是“%xx”形式的編碼,與UTF8編碼的區(qū)別僅在于前綴(這是由規(guī)范RFC3986決定的,將非ASC字符進(jìn)行某種形式編碼,并轉(zhuǎn)換為16進(jìn)制,并在字節(jié)前加上“%”)。因此通過unescape(encodeURIComponent(s))可以轉(zhuǎn)化為UTF8字節(jié)。當(dāng)然,也可自己寫一個轉(zhuǎn)換函數(shù),按照一定規(guī)則便行為UTF-8編碼的字節(jié),如下例:

``` unescape(encodeURIComponent("中國")) //結(jié)果:"中å?½" encodeURIComponent("中國") //結(jié)果:"%E4%B8%AD%E5%9B%BD" console.log("\u00E4\u00B8\u00AD\u00E5\u009B\u00BD") // 結(jié)果: "中å?½" ```

通過簡單的replace函數(shù),就可以完成URL編碼到UTF8編碼的轉(zhuǎn)換,進(jìn)而完成寬字節(jié)字符到base64編碼的轉(zhuǎn)換。有了這個函數(shù),我們手動生成一些data URI形式的內(nèi)容,只需制定MIME類型和編碼方式,就可以實(shí)現(xiàn)文本的轉(zhuǎn)換,如以下代碼:

```

abc // 未編碼前:test ```

前端UTF8編碼與后端GBK編碼的兼容

目前前端大都采用UTF8進(jìn)行編碼,不管是html、js抑或是css,而后端則由于歷史原因大都采用GBK或GB2312進(jìn)行解碼,因此前端通過 parameter傳遞的URL編碼的字符串就不可能直接在后臺進(jìn)行解碼,為了更好的兼容性,前端可進(jìn)行兩次URL編碼,即 encodeURIComponent(encodeURIComponent(“中國”)),這樣后端接收到參數(shù)后,先使用GBK或GB2312解碼, 得到了UTF8編碼后再使用UTF8解碼即可。兩次編碼主要是利用“ASC字符使用GBK或GB2312編碼不變”的特點(diǎn)完成,富有技巧。

HTML實(shí)體編碼與進(jìn)制編碼

實(shí)體編碼針對HTML的預(yù)留字符而言,如“<>”等。實(shí)體編碼有兩種形式&實(shí)體名;&entity_number;,由于瀏覽器對&實(shí)體名;的兼容性有差別,因此***采用實(shí)體號的形式編碼。

進(jìn)制編碼,顧名思義將ASC字符對應(yīng)的碼值按照十六進(jìn)制或十進(jìn)制編碼,并轉(zhuǎn)化為&#x;(16進(jìn)制)&#D;(10進(jìn)制)形式。

單單針對實(shí)體編碼而言并沒有什么特殊強(qiáng)調(diào)的點(diǎn),之所以把它單獨(dú)列為一個章節(jié),意在強(qiáng)調(diào)這兩種編碼與js代碼的作用域的關(guān)系。

')">cccc
 cccc
   

代碼中列舉了8個例子,***個在事件處理函數(shù)onclick中輸出HTML片段;第二個則輸出經(jīng)實(shí)體編碼后的HTML片段;第三個則是直接針對做16進(jìn)制編碼;第四個則是針對onerror事件處理函數(shù)做16進(jìn)制編碼;第五個則是在腳本中輸出實(shí)體編碼的字符;第六個針對事件處理函數(shù)做16進(jìn)制編碼;第七個則針對所有的字符做16進(jìn)制編碼;第八個則是在script中直接輸出的unicode編碼。

對比結(jié)果,前兩個例子在點(diǎn)擊后都會彈出alert;第三個例子則在頁面中顯示文本; 第四個例子則會在頁面加載初期彈出alert;第五、七會輸出字符串;第六、八則會在第四個例子中的alert之后也彈出alert?,F(xiàn)在分析這些結(jié)果, 通過***二個例子可知道,HTML標(biāo)簽中(除script標(biāo)簽)的內(nèi)聯(lián)js代碼可以進(jìn)行HTML實(shí)體編碼,這是非常重要的一點(diǎn),我們可以更為明確的進(jìn)行驗(yàn) 證:

cccc

輸出的結(jié)果自然是,這的確論證了我們上文提到的這一點(diǎn);第三個例子說明了HTML解析器在進(jìn)行詞法分析前,首先進(jìn)行解碼,十六進(jìn)制和十進(jìn)制皆可,因此,結(jié)果自然輸出形如的 字符串;第四個例子則緊接著論證了內(nèi)聯(lián)在HTML的并采用十六進(jìn)制編碼的js代碼同樣會被正確解析并執(zhí)行,這說明了進(jìn)制編碼同樣可被HTML解析器解析; 第五、七個例子說明在js中同樣可以使用實(shí)體編碼和進(jìn)制編碼,解析的結(jié)果會渲染在頁面上;第六個例子則論證了上一觀點(diǎn),只針對事件處理函數(shù)做進(jìn)制編碼,執(zhí) 行后頁面彈出alert;第八個例子則是在js中執(zhí)行unicode編碼的字符串,正常alert。

由此可見,js代碼內(nèi)聯(lián)在HTML的非script標(biāo)簽內(nèi),則會遵守HTML編碼規(guī)范:進(jìn)制編碼和實(shí)體編碼;而在js代碼(script標(biāo)簽內(nèi)以及js文件內(nèi))中,則遵從js編碼:1,unicode形式編碼(\uxxxx)2,普通的16進(jìn)制編碼(\xH),這可通過第八個例子得到證明。之所以在本節(jié)提到這么多編碼特點(diǎn),主要提醒大家在預(yù)防XSS時需要注意的幾點(diǎn):

JS編碼

其實(shí)在上節(jié)中已提到了js編碼,即js可執(zhí)行unicode編碼和十六(八)進(jìn)制編碼后的字符串,但是不支持十進(jìn)制編碼的字串。具體操作可通過常用 的幾個函數(shù)來實(shí)現(xiàn),如“eval,write,setTimeout,F(xiàn)unction”執(zhí)行編碼后的字符串;同樣,對于十進(jìn)制編碼的字串,通過結(jié)合 String.fromCharCode和eval同樣可以執(zhí)行。

在此附上筆者實(shí)現(xiàn)的字符轉(zhuǎn)換,更為靈活的實(shí)現(xiàn)各種自定義形式的字串編碼:

var Code = {}; /** * * @param str 待編碼字串 * @param jinzhi 進(jìn)制編碼 * @param prefix 前綴 * @param postfix 后綴 * @param count 總共編碼的位數(shù),默認(rèn)為4 * @returns {string} */ Code.encode = function({str = '',jinzhi = '16',prefix = '\\u',postfix = ';',count = '4'} = {}){     var ret = '';     var addZero,tmp;     for(let i=0;i'})); console.log(Code.decode({str: Code.encode({str: ''})}))

另外,對于js輸出點(diǎn)的過濾其實(shí)并不僅限于上文提到的如eval、setTimeout、Function等幾個,由于JS語法比較靈活相對“漏洞”較多,可使用的“線索”也越豐富,如前段時間在Stackoverflow上發(fā)現(xiàn)的一個問題,即

(0)['constructor']['constructor']('return "abc;"')()

關(guān)于“前端開發(fā)中的字符編碼有哪些”這篇文章就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,使各位可以學(xué)到更多知識,如果覺得文章不錯,請把它分享出去讓更多的人看到。


新聞名稱:前端開發(fā)中的字符編碼有哪些
地址分享:http://weahome.cn/article/peijsg.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部