這篇文章將為大家詳細(xì)講解有關(guān)Javascript中什么是正則表達式,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。
創(chuàng)新互聯(lián)網(wǎng)站建設(shè)提供從項目策劃、軟件開發(fā),軟件安全維護、網(wǎng)站優(yōu)化(SEO)、網(wǎng)站分析、效果評估等整套的建站服務(wù),主營業(yè)務(wù)為做網(wǎng)站、成都網(wǎng)站制作,成都app軟件開發(fā)以傳統(tǒng)方式定制建設(shè)網(wǎng)站,并提供域名空間備案等一條龍服務(wù),秉承以專業(yè)、用心的態(tài)度為用戶提供真誠的服務(wù)。創(chuàng)新互聯(lián)深信只要達到每一位用戶的要求,就會得到認(rèn)可,從而選擇與我們長期合作。這樣,我們也可以走得更遠(yuǎn)!
undefined
什么是正則表達式?
正則表達式(Regular Expression 或 Regex),是用于定義某種特定搜索模式的字符組合。正則表達式可用于匹配、查找和替換文本中的字符,進行輸入數(shù)據(jù)的驗證,查找英文單詞的拼寫錯誤等。
調(diào)試工具
下面列出了幾款優(yōu)秀的在線調(diào)試工具,如果你想創(chuàng)建或者調(diào)試正則表達式可能會需要。個人比較偏好Regex101,regex101 支持在正則表達式的不同 flavor 之間切換、解釋你的正則表達式、顯示匹配信息、提供常用語法參考等功能,非常強大。
Regex101
Regexr
Regexpal
開始
在 Javascript 中,一個正則表達式以 /
開頭和結(jié)尾,所以簡單至 /hello regexp/
就是一個正則表達式。
Flags(標(biāo)志符或修飾符)
Flags 寫在結(jié)束的/
之后,可以影響整個正則表達式的匹配行為。常見的 flags 有:
g
:全局匹配(global);正則表達式默認(rèn)只會返回第一個匹配結(jié)果,使用標(biāo)志符g
則可以返回所有匹配i
:忽略大小寫(case-insensitive);在匹配時忽略英文字母的大小寫m
:多行匹配(multiline);將開始和結(jié)束字符(^和$)視為在多行上工作,即分別匹配每一行(由 \n
或 \r
分割)的開始和結(jié)束,而不只是只匹配整個輸入字符串的最開始和最末尾處
Flags 可以組合使用,如:
Character Sets(字符集合)
用于匹配字符集合中的任意一個字符,常見的字符集有:
[xyz]
:匹配 "x"
或"y"``"z"
[^xyz]
:補集,匹配除 "x" "y" "z"
的其他字符[a-z]
:匹配從 "a"
到 "z"
的任意字符[^a-n]
:補集,匹配除 "a"
到 "n"
的其他字符[A-Z]
:匹配從 "A"
到 "Z"
的任意字符[0-9]
:匹配從 "0"
到 "9"
的任意數(shù)字
比如匹配所有的字母和數(shù)字可以寫成:/[a-zA-Z0-9]/
或者 /[a-z0-9]/i
。
Quantifiers (量詞)
在實際使用中,我們常常需要匹配同一類型的字符多次,比如匹配 11 位的手機號,我們不可能將 [0-9]
寫 11 遍,此時我們可以使用 Quantifiers 來實現(xiàn)重復(fù)匹配。
{n}
:匹配 n
次{n,m}
:匹配 n-m
次{n,}
:匹配 >=n
次?
:匹配 0 || 1
次*
:匹配 >=0
次,等價于 {0,}
+
:匹配 >=1
次,等價于 {1,}
Metacharacters(元字符)
在正則表達式中有一些具有特殊含義的字母,被稱為元字符,簡言之,元字符就是描述字符的字符,它用于對字符表達式的內(nèi)容、轉(zhuǎn)換及各種操作信息進行描述。
常見的元字符有:
\d
:匹配任意數(shù)字,等價于 [0-9]
\D
:匹配任意非數(shù)字字符;\d
的補集\w
:匹配任意基本拉丁字母表中的字母和數(shù)字,以及下劃線;等價于 [A-Za-z0-9_]
\W
:匹配任意非基本拉丁字母表中的字母和數(shù)字,以及下劃線;\w
的補集\s
:匹配一個空白符,包括空格、制表符、換頁符、換行符和其他 Unicode 空格\S
:匹配一個非空白符;\s
的補集\b
:匹配一個零寬單詞邊界,如一個字母與一個空格之間;例如,/\bno/
匹配 "at noon"
中的 "no"
,/ly\b/
匹配 "possibly yesterday."
中的 "ly"
\B
:匹配一個零寬非單詞邊界,如兩個字母之間或兩個空格之間;例如,/\Bon/
匹配 "at noon"
中的 "on"
,/ye\B/
匹配 "possibly yesterday."
中的 "ye"
\t
:匹配一個水平制表符(tab)\n
:匹配一個換行符(newline)\r
:匹配一個回車符(carriage return)
Special Characters (特殊字符)
正則中存在一些特殊字符,它們不會按照字面意思進行匹配,而有特殊的意義,比如前文講過用于量詞的?
、*
、+
。其他常見的特殊字符有:
\
:轉(zhuǎn)義字符,可以將普通字符轉(zhuǎn)成特殊字符。比如 \w
;也可以將特殊字符轉(zhuǎn)成字面意思,比如 \+
匹配 "+"
.
:匹配任意單個字符,但是換行符除外:\n
, \r
, \u2028
或 \u2029
;在字符集中([.]
),無特殊含義,即表示 '.'
的字面意思|
:替換字符(alternate character),匹配 |
前或后的表達式。比如需要同時匹配 "bear"
和 "pear"
,可以使用 /(b|p)ear/
或者 /bear|pear/
;但是不能用 /b|pear/
,該表達式只能匹配 "b"
和 "pear"
^
:匹配輸入的開始。比如,/^A/
不匹配 "an Apple"
中的 "A"
,但匹配 "An apple"
中的 "A"
$
:匹配輸入的結(jié)尾。比如,/t$/
不匹配 "eater"
中的 "t"
,但匹配 "eat"
中的 "t"
。^
和 $
在表單驗證時常需要使用,因為需要驗證從開始到結(jié)尾的一個完整輸入,而不是匹配輸入中的某一段
Groups(分組)(xyz)
:捕獲分組(Capturing Group),匹配并捕獲匹配項;例如,/(foo)/
匹配且捕獲 "foo bar."
中的 "foo"
。被匹配的子字符串可以在結(jié)果數(shù)組的元素 [1], ..., [n] 中找到,或在被定義的 RegExp 對象的屬性 $1, ..., $9 中找到(?:xyz)
:非捕獲分組(Non-capturing Group),匹配但不會捕獲匹配項;匹配項不能再次被訪問到\n
:n
是一個正整數(shù),表示反向引用(back reference),指向正則表達式中第 n 個括號(從左開始數(shù))中匹配的子字符串;例如,/apple(,)\sorange\1/
匹配 "apple, orange, cherry, peach."
中的 "apple,orange,"
Assertion(斷言)x(?=y)
:僅匹配被y
跟隨的x
;例如,/bruce(?=wayne)/
,如果"bruce"
后面跟著wayne
,則匹配之。/bruce(?=wayne|banner)/
,如果"bruce"
后面跟著"wayne"
或者banner
,則匹配之。但是,"wayne"
和 "banner"
都不會在匹配結(jié)果中出現(xiàn)x(?!y)
:僅匹配不被y
跟隨的x
;例如,/\d+(?!\.)/
只會匹配不被 "."
跟隨的數(shù)字。
/\d+(?!\.)/.exec('3.141')` 匹配 `"141"`,而不是 `"3.141"
最后,推薦大家使用Fundebug,一款很好用的 BUG 監(jiān)控工具~
應(yīng)用
上面羅列出了這么多正則表達式的語法和規(guī)則,可以在一定程度上幫助我們分析和理解一段正則表達式的作用,但是如何將這些規(guī)則組合并創(chuàng)造出有特定作用的表達式還需要我們自己多加練習(xí),下面舉幾個例子來說明運用這些規(guī)則。
1. 匹配手機號碼
我們先從比較簡單的匹配手機號碼開始。目前國內(nèi)的手機號碼是1(3/4/5/7/8)
開頭的 11 位數(shù)字,因此手機號碼的正則可以分解為以下幾部分:
以 1
開頭:/^1/
第 2 位為3、4、5、7、8
中的一個:/[34578]/
或 /(3|4|5|7|8)/
剩余 3-11 位均為數(shù)字,并以數(shù)字結(jié)尾:/\d{9}$/
組合起來即為 /^1[34578]\d{9}$/
或 /^1(3|4|5|7|8)\d{9}$/
,因為使用捕獲括號存在性能損失,所以推薦使用第一種寫法。
2. 匹配電子郵件
標(biāo)準(zhǔn)的電子郵件組成為
,
每部分的格式標(biāo)準(zhǔn)為(進行了相應(yīng)的簡化,主要為展示如何書寫正則):
yourname:任意英文字母(a-z/A-Z)、數(shù)字(0-9)、下劃線(_)、英文句點(.)、連字符(-),長度大于 0domain:任意英文字母(a-z/A-Z)、數(shù)字(0-9)、連字符(-),長度大于 0extension:任意英文字母(a-z/A-Z),長度 2-8optional-extension:"."
開頭,后面跟任意英文字母(a-z/A-Z),長度 2-8,可選
每部分的正則表達式為:
yourname:/[a-z\d._-]+/
domain:/[a-z\d-]+/
extension: /[a-z]{2,8}/
optional-extension:/(\.[a-z]{2,8})?/
組合起來形成最后的正則表達式:/^([a-z\d._-]+)@([a-z\d-]+)\.([a-z]{2,8})(\.[a-z]{2,8})?$/
;為了增加可讀性可以將每部分用"()"
包起來,并不要忘記起始和結(jié)束符 ^$
。
關(guān)于“Javascript中什么是正則表達式”這篇文章就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,使各位可以學(xué)到更多知識,如果覺得文章不錯,請把它分享出去讓更多的人看到。