這篇“C#基于正則表達(dá)式抓取a標(biāo)簽鏈接和innerhtml的示例分析”除了程序員外大部分人都不太理解,今天小編為了讓大家更加理解“C#基于正則表達(dá)式抓取a標(biāo)簽鏈接和innerhtml的示例分析”,給大家總結(jié)了以下內(nèi)容,具有一定借鑒價(jià)值,內(nèi)容詳細(xì)步驟清晰,細(xì)節(jié)處理妥當(dāng),希望大家通過(guò)這篇文章有所收獲,下面讓我們一起來(lái)看看具體內(nèi)容吧。
站在用戶的角度思考問(wèn)題,與客戶深入溝通,找到雙流網(wǎng)站設(shè)計(jì)與雙流網(wǎng)站推廣的解決方案,憑借多年的經(jīng)驗(yàn),讓設(shè)計(jì)與互聯(lián)網(wǎng)技術(shù)結(jié)合,創(chuàng)造個(gè)性化、用戶體驗(yàn)好的作品,建站類型包括:成都做網(wǎng)站、成都網(wǎng)站制作、成都外貿(mào)網(wǎng)站建設(shè)、企業(yè)官網(wǎng)、英文網(wǎng)站、手機(jī)端網(wǎng)站、網(wǎng)站推廣、域名注冊(cè)、網(wǎng)絡(luò)空間、企業(yè)郵箱。業(yè)務(wù)覆蓋雙流地區(qū)。html是什么html的全稱為超文本標(biāo)記語(yǔ)言,它是一種標(biāo)記語(yǔ)言,包含了一系列標(biāo)簽.通過(guò)這些標(biāo)簽可以將網(wǎng)絡(luò)上的文檔格式統(tǒng)一,使分散的Internet資源連接為一個(gè)邏輯整體,html文本是由html命令組成的描述性文本,html命令可以說(shuō)明文字,圖形、動(dòng)畫、聲音、表格、鏈接等,主要和css+js配合使用并構(gòu)建優(yōu)雅的前端網(wǎng)頁(yè)。
C#基于正則表達(dá)式抓取a標(biāo)簽鏈接和innerhtml的方法,具體如下:
//讀取網(wǎng)頁(yè)html string text = File.ReadAllText(Environment.CurrentDirectory + "http://test.txt", Encoding.GetEncoding("gb2312")); string prttern = "([^\"])*)\"|'([^'])*'|\\w+=\"(([^\"])*)\"|'([^'])*'))+>(?(.*?)) "; var maths = Regex.Matches(text, prttern); //抓取出來(lái)寫入的文件 using (FileStream w = new FileStream(Environment.CurrentDirectory + "http://wirter.txt", FileMode.Create)) { for (int i = 0; i < maths.Count; i++) { byte[] bs = Encoding.UTF8.GetBytes(string.Format("鏈接地址:{0}, innerhtml:{1}", maths[i].Groups["url"].Value, maths[i].Groups["text"].Value) + "\r\n"); w.Write(bs, 0, bs.Length); Console.WriteLine(); } } Console.ReadKey();
圖解正則
朋友需要截取img標(biāo)簽的src 和data-url 跟上面差不多。。順便附上
string text =File.ReadAllText(Environment.CurrentDirectory + "http://test.txt", Encoding.GetEncoding("gb2312")); string prttern = "[^\"]*?)\"|data-url=\"(?[^\"]*?)\"|[-\\w]+=\"[^\"]*?\"))*\\s*/>"; var maths = Regex.Matches(text, prttern); //抓取出來(lái)寫入的文件 using (FileStream w = new FileStream(Environment.CurrentDirectory + "http://wirter.txt", FileMode.Create)) { for (int i = 0; i < maths.Count; i++) { byte[] bs = Encoding.UTF8.GetBytes(string.Format("圖片src:{0}, 圖片data-url:{1}", maths[i].Groups["src"].Value, maths[i].Groups["dataurl"].Value) + "\r\n"); w.Write(bs, 0, bs.Length); Console.WriteLine(); } }
感謝你的閱讀,希望你對(duì)“C#基于正則表達(dá)式抓取a標(biāo)簽鏈接和innerhtml的示例分析”這一關(guān)鍵問(wèn)題有了一定的理解,具體使用情況還需要大家自己動(dòng)手實(shí)驗(yàn)使用過(guò)才能領(lǐng)會(huì),快去試試吧,如果想閱讀更多相關(guān)知識(shí)點(diǎn)的文章,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道!