這篇文章主要講解了“js 正則如何匹配字符串字面量”,文中的講解內(nèi)容簡(jiǎn)單清晰,易于學(xué)習(xí)與理解,下面請(qǐng)大家跟著小編的思路慢慢深入,一起來(lái)研究和學(xué)習(xí)“js 正則如何匹配字符串字面量”吧!
成都創(chuàng)新互聯(lián)公司是一家集網(wǎng)站建設(shè),曲水企業(yè)網(wǎng)站建設(shè),曲水品牌網(wǎng)站建設(shè),網(wǎng)站定制,曲水網(wǎng)站建設(shè)報(bào)價(jià),網(wǎng)絡(luò)營(yíng)銷,網(wǎng)絡(luò)優(yōu)化,曲水網(wǎng)站推廣為一體的創(chuàng)新建站企業(yè),幫助傳統(tǒng)企業(yè)提升企業(yè)形象加強(qiáng)企業(yè)競(jìng)爭(zhēng)力??沙浞譂M足這一群體相比中小企業(yè)更為豐富、高端、多元的互聯(lián)網(wǎng)需求。同時(shí)我們時(shí)刻保持專業(yè)、時(shí)尚、前沿,時(shí)刻以成就客戶成長(zhǎng)自我,堅(jiān)持不斷學(xué)習(xí)、思考、沉淀、凈化自己,讓我們?yōu)楦嗟钠髽I(yè)打造出實(shí)用型網(wǎng)站。JS是JavaScript的簡(jiǎn)稱,它是一種直譯式的腳本語(yǔ)言,其解釋器被稱為JavaScript引擎,是瀏覽器的一部分,主要用于web的開(kāi)發(fā),可以給網(wǎng)站添加各種各樣的動(dòng)態(tài)效果,讓網(wǎng)頁(yè)更加美觀。
昨天在《js 正則學(xué)習(xí)小記之匹配字符串字面量》談到 /"(?:\\.|[^"])*"/ 是個(gè)不錯(cuò)的表達(dá)式,因?yàn)榭梢詽M足我們的要求,所以這個(gè)表達(dá)式可用,但不一定是好的。
從性能上來(lái)說(shuō),他非常糟糕,為什么這么說(shuō)呢,因?yàn)?傳統(tǒng)型NFA引擎 遇到分支是從左往右匹配的,
所以它會(huì)用 \\. 去匹配每一個(gè)字符,發(fā)現(xiàn)不對(duì)后才用 [^"] 去匹配。
比如這樣一個(gè)字符串: "123456\'78\"90"
共 16 個(gè)字符,除了第一個(gè) " 直接匹配成功,還剩余 15 個(gè),只有 2 個(gè)轉(zhuǎn)義(4 個(gè)字符),所以 \\. 會(huì)失敗 10 次,只有 2 次成功。
這 10 次匹配失敗,需要回溯后用 [^"] 才能匹配成功,當(dāng)然最后一個(gè) " 會(huì)直接匹配成功。
很明顯,正常的字符串不可能全是轉(zhuǎn)義,正常的字符串才是主流,當(dāng)然不排除有人故意全轉(zhuǎn)義的情況。
所以這個(gè)正則需要10次回溯后才能匹配完成,如果字符串增長(zhǎng)到 1K 1M 腫么破呢?
所以我們要修改下這個(gè)正則,前后換下位置么?
難道是 /"(?:[^"]|\\.)*"/ ? 呵呵,好像不太對(duì),這樣的話轉(zhuǎn)義就不能被匹配了。
所以還要修改下 /"(?:[^"\\]|\\.)*"/ 這樣就OK了,遇到 \ 轉(zhuǎn)義就會(huì)用 \\. 去嘗試匹配。
可是還是有問(wèn)題,因?yàn)槲覀冊(cè)?[^"\\] 過(guò)濾掉了 \n 所以沒(méi)法匹配多行字符的情況。
js 中 字符串用 \ 折行是允許的,但是修改后的 正則 沒(méi)法匹配這樣的字符串了,所以我們還得繼續(xù)修復(fù)。
因?yàn)?. 沒(méi)法匹配換行,所以我們要用其他方式表達(dá)。
. 是用于匹配除換行符之外的所有字符,難道我們要 [.\n] 來(lái)表示么?
這樣是不對(duì)的,因?yàn)?[] 字符集中的 . 不再表示除換行符之外的所有字符,而是字符 . 也就是他本身一個(gè)字符而已。
那怎么辦呢?
其實(shí)換個(gè)思路,
\d 表示 0-9
\D 表示 [^0-9]
那么 [\d\D] 就表示所有了,不是么。(新人朋友不知道能不能消化這個(gè)知識(shí)點(diǎn)。)
同理 [\s\S] [\w\W] 同樣可以。
所以 /"(?:[^"\\]|\\[\d\D])*"/ 這樣就滿足我們的要求了。
效果不錯(cuò)。
回頭過(guò)來(lái)分分析下他現(xiàn)在的性能吧。
還是這個(gè)字符串: "123456\'78\"90" , 正則 /"(?:[^"\\]|\\[\d\D])*"/
共 16 個(gè)字符,除了第一個(gè) " 直接匹配成功,還剩余 15 個(gè),有 2 個(gè)轉(zhuǎn)義(4 個(gè)字符),[^"\\] 能匹配成功 10 個(gè)字符,只有 2 次失敗。
為什么不是 4 次失敗呢,明明有4個(gè)字符啊。\\ 雖然是2個(gè)字符,但是讀到第一個(gè) \ 就匹配失敗,然后用 \\[\d\D] 匹配成功,
占用掉了兩個(gè)字符 \\ 下次用下一個(gè)o開(kāi)始匹配,所以只有2次回溯。
只有 2 次需要回溯,然后用 \\[\d\D] 匹配成功。當(dāng)然最后一個(gè) " 還是會(huì)直接匹配成功。
所以從 10 次回溯,減少到了 2 次,雖然正則比昨天臃腫了很多,但至少性能提升了不止一個(gè)等級(jí)。
感謝各位的閱讀,以上就是“js 正則如何匹配字符串字面量”的內(nèi)容了,經(jīng)過(guò)本文的學(xué)習(xí)后,相信大家對(duì)js 正則如何匹配字符串字面量這一問(wèn)題有了更深刻的體會(huì),具體使用情況還需要大家實(shí)踐驗(yàn)證。這里是創(chuàng)新互聯(lián)網(wǎng)站建設(shè)公司,,小編將為大家推送更多相關(guān)知識(shí)點(diǎn)的文章,歡迎關(guān)注!