這篇文章主要講解了“PHP正則表達(dá)式過(guò)濾html標(biāo)簽屬性的方法”,文中的講解內(nèi)容簡(jiǎn)單清晰,易于學(xué)習(xí)與理解,下面請(qǐng)大家跟著小編的思路慢慢深入,一起來(lái)研究和學(xué)習(xí)“PHP正則表達(dá)式過(guò)濾html標(biāo)簽屬性的方法”吧!
站在用戶的角度思考問(wèn)題,與客戶深入溝通,找到株洲網(wǎng)站設(shè)計(jì)與株洲網(wǎng)站推廣的解決方案,憑借多年的經(jīng)驗(yàn),讓設(shè)計(jì)與互聯(lián)網(wǎng)技術(shù)結(jié)合,創(chuàng)造個(gè)性化、用戶體驗(yàn)好的作品,建站類型包括:成都網(wǎng)站設(shè)計(jì)、成都網(wǎng)站制作、企業(yè)官網(wǎng)、英文網(wǎng)站、手機(jī)端網(wǎng)站、網(wǎng)站推廣、空間域名、雅安服務(wù)器托管、企業(yè)郵箱。業(yè)務(wù)覆蓋株洲地區(qū)。過(guò)濾html標(biāo)簽在php中可以有內(nèi)置的函數(shù)了,但它過(guò)濾的太干凈了,我們就整理了一下些利用正則來(lái)過(guò)濾指定html標(biāo)簽的例子,具體如下所示。
采集的時(shí)候有時(shí)候需要過(guò)濾掉多余的標(biāo)簽屬性,比如 img標(biāo)簽過(guò)濾掉除了src屬性之外的所有屬性例如刪除titile alt等屬性以及一些腳的onclick屬性等。
例如
過(guò)濾除了src之外的所有屬性:
復(fù)制代碼 代碼如下:
$str= preg_replace('/\s(?!src)[a-zA-Z]+=[\'\"]{1}[^\'\"]+[\'\"]{1}/iu',' $str);
上面的實(shí)例代碼是過(guò)濾掉除了src屬性外的所有標(biāo)簽屬性.
過(guò)濾設(shè)置過(guò)濾除了alt和src之外的所有屬性
代碼如下:
復(fù)制代碼 代碼如下:
$str = preg_replace('/\s(?!(src|alt))[a-zA-Z]+=[^\s]*/iu',' ', $str);
過(guò)濾所有html標(biāo)簽的屬性的正則表達(dá)式:
復(fù)制代碼 代碼如下:
$str = preg_replace("/<([a-z]+)[^>]*>/i","",$str );
只過(guò)濾alt屬性的正則表達(dá)式:
復(fù)制代碼 代碼如下:
(\s)alt=[^\s]*
過(guò)濾所有html標(biāo)簽的屬性的正則表達(dá)式:
復(fù)制代碼 代碼如下:
$search = array ("''si", // 去掉 javascript
"'<[\/\!]*?[^<>]*?>'si", // 去掉 HTML 標(biāo)記
"'([\r\n])[\s]+'", // 去掉空白字符
"'&(quot|#34);'i", // 替換 HTML 實(shí)體
"'&(amp|#38);'i",
"'&(lt|#60);'i",
"'&(gt|#62);'i",
"'&(nbsp|#160);'i"
); // 作為 PHP 代碼運(yùn)行
$replace = array ("","","\\1","\"","&","<",">"," ");
$html = preg_replace($search, $replace, $html);
感謝各位的閱讀,以上就是“PHP正則表達(dá)式過(guò)濾html標(biāo)簽屬性的方法”的內(nèi)容了,經(jīng)過(guò)本文的學(xué)習(xí)后,相信大家對(duì)PHP正則表達(dá)式過(guò)濾html標(biāo)簽屬性的方法這一問(wèn)題有了更深刻的體會(huì),具體使用情況還需要大家實(shí)踐驗(yàn)證。這里是創(chuàng)新互聯(lián)網(wǎng)站建設(shè)公司,,小編將為大家推送更多相關(guān)知識(shí)點(diǎn)的文章,歡迎關(guān)注!