本文介紹net處理html頁面元素的工具類(HtmlAgilityPack.dll)的使用,用途比較多的應(yīng)該是例如采集類的功能,采集到的html字符串要怎樣處理是一個頭痛的問題,如果是截取就太麻煩了而且容易出錯。所有就用到本文的第三方dll來處理了。
創(chuàng)新互聯(lián)主營劍川網(wǎng)站建設(shè)的網(wǎng)絡(luò)公司,主營網(wǎng)站建設(shè)方案,重慶App定制開發(fā),劍川h5小程序設(shè)計搭建,劍川網(wǎng)站營銷推廣歡迎劍川等地區(qū)企業(yè)咨詢
下載地址:http://htmlagilitypack.codeplex.com/
點擊“download”按鈕直接下載。
1.添加HtmlAgilityPack.dll引用(引用類using HtmlAgilityPack;)。
2.簡單根據(jù)html中input的id獲取value代碼如下:
- // 模擬用戶請求
- WebClient webClient = new WebClient();
- webClient.Encoding = System.Text.Encoding.UTF8;
- string htmlContext = webClient.DownloadString("http://stone_w.cnblogs.com/");
- webClient.Credentials = CredentialCache.DefaultCredentials; // 添加授權(quán)證書
- webClient.Headers.Add("User-Agent", "Microsoft Internet Explorer");
- webClient.Headers.Add("Host", "www.cnblogs.com");
- // 獲取html元素(htmlContext為html頁面字符串)
- HtmlDocument htmlDoc = new HtmlDocument();
- htmlDoc.LoadHtml(htmlContext); // 加載html頁面
- HtmlNode navNode = htmlDoc.GetElementbyId("id名稱");
- Response.Write(navNode.Attributes["value"].Value);
HtmlAgilityPack可以根據(jù)id查詢value,還可以獲取單個元素節(jié)點,都是HtmlDocument類的內(nèi)置方法。用它來處理Html還是很方便的
下載地址:http://htmlagilitypack.codeplex.com/
點擊“download”按鈕直接下載。