java 讀取網(wǎng)頁(yè)內(nèi)容的實(shí)例詳解
創(chuàng)新互聯(lián)堅(jiān)持“要么做到,要么別承諾”的工作理念,服務(wù)領(lǐng)域包括:網(wǎng)站建設(shè)、網(wǎng)站制作、企業(yè)官網(wǎng)、英文網(wǎng)站、手機(jī)端網(wǎng)站、網(wǎng)站推廣等服務(wù),滿足客戶于互聯(lián)網(wǎng)時(shí)代的青白江網(wǎng)站設(shè)計(jì)、移動(dòng)媒體設(shè)計(jì)的需求,幫助企業(yè)找到有效的互聯(lián)網(wǎng)解決方案。努力成為您成熟可靠的網(wǎng)絡(luò)建設(shè)合作伙伴!
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.net.*; public class loadurl { public static void main(String args[]) { String a = null; try { String url = "(這里替換成任意網(wǎng)頁(yè)的網(wǎng)址)"; BufferedReader in = new BufferedReader(new InputStreamReader( new URL(url).openConnection().getInputStream(), "GB2312"));//GB2312可以根據(jù)需要替換成要讀取網(wǎng)頁(yè)的編碼 while ((a = in.readLine()) != null) { System.out.println(a); } } catch (MalformedURLException e) { } catch (IOException e) { } } }
以上的代碼程序是把一個(gè)網(wǎng)頁(yè)的源代碼,包括HTML與XML讀取到JAVA的一個(gè)字符串String a中。
Java中字符串String類型的空間很大,基本能夠容納一個(gè)網(wǎng)頁(yè)源代碼的內(nèi)容。
從網(wǎng)頁(yè)讀取內(nèi)容同樣是對(duì)于輸入流的操作。
不同于標(biāo)準(zhǔn)的輸入源,在:
BufferedReader in = new BufferedReader(new InputStreamReader(...))
InputStreamReader中輸入System.in就可以。
此處的輸入源應(yīng)該為:
(new URL(url).openConnection().getInputStream(), "GB2312")
之后的操作與處理與載入標(biāo)準(zhǔn)輸入源完全相同。
BufferedReader在JAVA中要求必須捕獲IOException異常,而使用URL源除了必須引入java.net.*包之外,還必須捕獲MalformedURLException異常。
如有疑問請(qǐng)留言或者到本站社區(qū)交流討論,感謝閱讀,希望能幫助到大家,謝謝大家對(duì)本站的支持!