這篇文章主要為大家展示了“JavaScript正則表達式怎么用”,內(nèi)容簡而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領大家一起研究并學習一下“JavaScript正則表達式怎么用”這篇文章吧。
網(wǎng)站建設公司,為您提供網(wǎng)站建設,網(wǎng)站制作,網(wǎng)頁設計及定制網(wǎng)站建設服務,專注于企業(yè)網(wǎng)站制作,高端網(wǎng)頁制作,對成都戶外休閑椅等多個行業(yè)擁有豐富的網(wǎng)站建設經(jīng)驗的網(wǎng)站建設公司。專業(yè)網(wǎng)站設計,網(wǎng)站優(yōu)化推廣哪家好,專業(yè)成都網(wǎng)站營銷優(yōu)化,H5建站,響應式網(wǎng)站。
正則表達式(Regular Expression,簡稱regexp)
是一種描述字符串結構的語法規(guī)則。
是一個特定的格式化模式,用于驗證各種字符串是否匹配這個特征,進而實現(xiàn)高級的文本查找、替換、截取內(nèi)容等操作。
應用:在項目開發(fā)中,手機號碼指定位數(shù)的隱藏、數(shù)據(jù)采集、敏感詞的過濾以及表單的驗證等功能,都可以利用正則表達式來實現(xiàn)。
適用領域:在操作系統(tǒng)(Unix、Linux等)、編程語言(C、C++、Java、PHP、Python、JavaScript等)。
舉例:以文本查找為例,若在大量的文本中找出符合某個特征的字符串(如手機號碼),就將這個特征按照正則表達式的語法寫出來,形成一個計算機程序識別的模式(Pattern),然后計算機程序就會根據(jù)這個模式到文本中進行匹配,找出符合規(guī)則的字符串。
正則表達式的發(fā)展史
正則表達式的表現(xiàn)形式
一種是POSIX規(guī)范兼容的正則表達式,用于確保操作系統(tǒng)之間的可移植性。
一種是當Perl(一種功能豐富的編程語言)發(fā)展起來后,衍生出來了Perl正則表達式,JavaScript中的正則語法就是基于Perl的。
在開發(fā)中,經(jīng)常需要根據(jù)正則匹配模式完成對指定字符串的搜索和匹配。
exec()方法用于在目標字符串中搜索匹配,一次僅返回一個匹配結果。
例如,在指定字符串str中搜索abc。
“/abc/i”中的“/”是正則表達式的定界符,“abc”表示正則表達式的模式文本,“i”是模式修飾標識符,表示在str中忽略大小寫。
exec()方法的參數(shù)是待匹配的字符串str,匹配成功時,該方法的返回值是一個數(shù)組,否則返回null。
從exec()的返回結果中可以看出,該數(shù)組保存的第1個元素(AbC)表示匹配到的字符串;第2個元素index表示匹配到的字符位于目標字符串中的索引值(從0開始計算);第3個參數(shù)input表示目標字符串(AbC123abc456)。
String對象中的match()方法除了可在字符串內(nèi)檢索指定的值外,還可以在目標字符串中根據(jù)正則匹配出所有符合要求的內(nèi)容,匹配成功后將其保存到數(shù)組中,匹配失敗則返回false。
定位符“^”,可用于匹配字符串開始的位置。
定位符“$”,可用于匹配字符串結尾的位置。
g表示全局匹配,用于在找到第一個匹配之后仍然繼續(xù)查找。
在JavaScript應用中,使用正則表達式之前首先需要創(chuàng)建正則對象。除了前面講解過的字面量方式創(chuàng)建外,還可以通過RegExp對象的構造函數(shù)的方式創(chuàng)建。
pattern是由元字符和文本字符組成的正則表達式模式文本。
元字符是具有特殊含義的字符,如“^”、“.”或“*”等。
文本字符就是普通的文本,如字母和數(shù)字等。
flags表示模式修飾標識符,用于進一步對正則表達式進行設置。
模式修飾符,還可以根據(jù)實際需求多個組合在一起使用。
例如,既要忽視大小寫又要進行全局匹配,則可以直接使用gi,并且在編寫多個模式修飾符時沒有順序要求。
因此,模式修飾符的合理使用,可使正則表達式變得更加簡潔、直觀。
為了讓讀者更好的理解正則對象的獲取,以匹配特殊字符“^”、“$”、“*”、“.”和“\”為例進行對比講解。
選擇符“|”表示“或”,查找條件只要其中一個條件滿足即可成立。
JavaScript中字符串存在轉義問題,因此代碼中str里的“\”表示反斜線“\”。
在正則中匹配特殊字符時,也需要反斜線(\)對特殊字符進行轉義。例如,“\\”經(jīng)過字符串轉義后變成“\”,然后正則表達式再用“\”去匹配“\”。
注意
構造函數(shù)方式與字面量方式創(chuàng)建的正則對象,雖然在功能上完全一致,但它們在語法實現(xiàn)上有一定的區(qū)別,前者的pattern在使用時需要對反斜杠(\)進行轉義。而后者的pattern在編寫時,要放在定界符“/”內(nèi),flags標記則放在結尾定界符之外
好處:有效的使用字符類別可以使正則表達式更加簡潔,便于閱讀。
舉例1:大寫字母、小寫字母和數(shù)字可以使用“\w”直接表示。
案例2:若要匹配0到9之間的數(shù)字可以使用“\d”表示。
下面為了方便讀者理解字符類別的使用,以“.”和“\s”為例進行演示.
正則對象reg用于匹配空白符后的任意兩個字符(除換行外)。
因此在控制臺查看到的結果中,id前有一個空格。
字符集合的表示方式:“[]”可以實現(xiàn)一個字符集合。
字符范圍:與連字符“-”一起使用時,表示匹配指定范圍內(nèi)的字符。
反義字符:元字符“^”與“[]”一起使用時,稱為反義字符。
不在某范圍內(nèi): “^”與“[]”一起使用,表示匹配不在指定字符范圍內(nèi)的字符。
以字符串 ‘get好TB6’.match(/pattern/g) 為例演示其常見的用法。
注意
字符“-”在通常情況下只表示一個普通字符,只有在表示字符范圍時才
作為元字符來使用?!?”連字符表示的范圍遵循字符編碼的順序,如“a-Z”、“z-a”、“a-9”都是不合法的范圍。
【案例】限定輸入內(nèi)容
代碼實現(xiàn)思路:
編寫HTML,設置一個年(份)和月(份)的文本框,以及一個查詢按鈕。
獲取操作的元素對象,對表單的提交進行驗證。
驗證年份, 正則:/^\d{4}/ 。 驗 證 月 份 , 正 則 : / ( ( 0 ? [ 1 ? 9 ] ) ∣ ( 1 [ 012 ] ) ) /。
文本框獲取焦點,去除提示框的顏色。文本框失去焦點,去除輸入內(nèi)容的兩端的空白,并進行驗證。
代碼實現(xiàn)
限定輸入內(nèi)容
test()方法:檢測正則表達式與指定的字符串是否匹配。
匹配成功時,test()方法的返回值為true,否則返回false。
檢測正則對象的模式修飾符
RegExp類中還有一些屬性,用于檢測當前正則對象使用的模式修飾符,以及指定下一次匹配的起始索引等。
下面為了讀者更好的理解這些屬性的使用,以實現(xiàn)空格的匹配為例進行演示。
search()方法:可以返回指定模式的子串在字符串首次出現(xiàn)的位置,相對于indexOf()方法來說功能更強大。
search()方法的參數(shù)是一個正則對象,如果傳入一個非正則表達式對象,則會使用“new RegExp(傳入的參數(shù))”隱式地將其轉換為正則表達式對象。
search()方法匹配失敗后的返回值為-1。
split()方法:用于根據(jù)指定的分隔符將一個字符串分割成字符串數(shù)組,其分割后的字符串數(shù)組中不包括分隔符。
當分隔符不只一個時,需要定義正則對象才能夠完成字符串的分割操作。
按照字符串中的“@”和“.”兩種分隔符進行分割。
split()方法的參數(shù)為正則表達式模式設置的分隔符,返回值是以數(shù)組形式保存的分割后的結果。
注意
當字符串為空時,split()方法返回的是一個包含一個空字符串的數(shù)組“[“”]”,如果字符串和分隔符都是空字符串,則返回一個空數(shù)組“[]”。
在使用正則匹配方式分割字符串時,還可以指定字符串分割的次數(shù)。
當指定字符串分割次數(shù)后,若指定的次數(shù)小于實際字符串中符合規(guī)則分割的次數(shù),則最后的返回結果中會忽略其他的分割結果。
動手實踐
密碼強度驗證
密碼強度驗證條件:
① 長度<6位,無密碼強度。
②長度>6位,而且包含數(shù)字、字母或其他字符中的一種,密碼強度為“低”。
③長度>6位,而且包含數(shù)字、字母或其他字符中的二種,密碼強度為“中”。
④長度>6位,而且包含數(shù)字、字母或其他字符中的三種及以上,密碼強度為“高”。
提出問題:匹配一個連續(xù)出現(xiàn)的字符,如 6個連續(xù)出現(xiàn)的數(shù)字“458925”。
解決方案1:正則對象/\d\d\d\d\d\d/gi。
存在的問題:重復出現(xiàn)的“\d”既不便于閱讀,書寫又繁瑣。
解決方案2:使用限定符(?、+、*、{ })完成某個字符連續(xù)出現(xiàn)的匹配。正則對象/\d{6}/gi。
當點字符(.)和限定符連用時,可以實現(xiàn)匹配指定數(shù)量范圍的任意字符。
舉例:“^hello.*world$”。
說明:可匹配從hello開始到world結束,中間包含零個或多個任意字符的字符串。
正則在實現(xiàn)指定數(shù)量范圍的任意字符匹配時,支持貪婪匹配和惰性匹配兩種方式。
所謂貪婪表示匹配盡可能多的字符,而惰性表示匹配盡可能少的字符。在默認情況下,是貪婪匹配。
若想要實現(xiàn)惰性匹配,需在上一個限定符的后面加上“?”符號。
在正則表達式中,被括號字符“()”括起來的內(nèi)容,稱之為“子表達式”。
小括號實現(xiàn)了匹配catch和cater,而如果不使用小括號,則變成了catch和er
未分組時,表示匹配2個c字符;而分組后,表示匹配2個“bc”字符串。
捕獲:將子表達式匹配到的內(nèi)容存儲到系統(tǒng)的緩存區(qū)的過程。
非捕獲:不將子表達式的匹配內(nèi)容存放到系統(tǒng)的緩存中,使用(?:x)實現(xiàn)。
String對象的replace()方法,可直接利用$n(n是大于0的正整數(shù))獲取捕獲內(nèi)容,完成對子表達式捕獲的內(nèi)容進行替換的操作。
第1個參數(shù)為正則表達式,用于與str字符串進行匹配,將符合規(guī)則的內(nèi)容利用第2個參數(shù)設置的內(nèi)容進行替換。
$2表示reg正則表達式中第2個子表達式被捕獲的內(nèi)容“Capture”。
$1表示第1個子表達式被捕獲的內(nèi)容“Regular”。
返回值是替換后的新字符串,因此,并不會修改原字符串的內(nèi)容。
可以使用”(?:x)”的方式實現(xiàn)非捕獲匹配
在編寫正則表達式時,若要在正則表達式中,獲取存放在緩存區(qū)內(nèi)的子表達式的捕獲內(nèi)容,則可以使用“\n”(n是大于0的正整數(shù))的方式引用,這個過程就是“反向引用”。
“\1”表示第1個子表達式的捕獲內(nèi)容。
“\2”表示第2個子表達式的捕獲內(nèi)容,以此類推。
“\d”用于匹配0~9之間的任意一個數(shù)字。
為其添加圓括號“()”后,即可通過反向引用獲取捕獲的內(nèi)容。
因此,最后的匹配結果為333和666。
零寬斷言:指的是一種零寬度的子表達式匹配,用于查找子表達式匹配的內(nèi)容之前或之后是否含有特定的字符集。
分類:分為正向預查和反向預查,但是在JavaScript中僅支持正向預查,即匹配含有或不含有捕獲內(nèi)容之前的數(shù)據(jù),匹配的結果中不含捕獲的內(nèi)容。
正則表達式中的運算符有很多。在實際應用時,各種運算符會遵循優(yōu)先級順序進行匹配。正則表達式中常用運算符優(yōu)先級,由高到低的順序如下表。
【案例】內(nèi)容查找與替換
代碼實現(xiàn)思路:
編寫HTML,定義兩個文本域,一個用于用戶輸入,另一個用于顯示按照要求替換后的過濾內(nèi)容。
用戶輸入只要含有bad和任意中文字符,就利用*替換。
查找并替換的內(nèi)容規(guī)則:/(bad)|[\u4e00-\u9fa5]/gi。
代碼實現(xiàn)
內(nèi)容查找與替換 過濾前內(nèi)容:
過濾后內(nèi)容:
以上是“JavaScript正則表達式怎么用”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對大家有所幫助,如果還想學習更多知識,歡迎關注創(chuàng)新互聯(lián)行業(yè)資訊頻道!