小編給大家分享一下如何解決Python采集網(wǎng)頁時正則表達式匹配換行符的問題,希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!
如下所示:
p1 = r'(?<=)(.*?)(?=)' #這樣采集html時出錯,采集不到數(shù)據(jù),正則中 . 是不能匹配換行符,改成如下: p1 = r'(?<=)([\s\S]*?)(?=)' # 這是我們寫的正則表達式規(guī)則,你現(xiàn)在可以不理解啥意思[\s\S]
\s
匹配任何空白字符,包括空格、制表符、換頁符等等。等價于[ \f\n\r\t\v]。
\S
匹配任何非空白字符。等價于[^ \f\n\r\t\v]。
看完了這篇文章,相信你對“如何解決Python采集網(wǎng)頁時正則表達式匹配換行符的問題”有了一定的了解,如果想了解更多相關(guān)知識,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝各位的閱讀!
分享題目:如何解決Python采集網(wǎng)頁時正則表達式匹配換行符的問題-創(chuàng)新互聯(lián)
文章出自:http://weahome.cn/article/jejcp.html其他資訊