用百度搜索一下,就用“JAVA源代碼“做為搜索條件。一般能找到很多網(wǎng)站。
創(chuàng)新互聯(lián)公司是一家專注于成都網(wǎng)站建設(shè)、成都網(wǎng)站設(shè)計(jì)與策劃設(shè)計(jì),新野網(wǎng)站建設(shè)哪家好?創(chuàng)新互聯(lián)公司做網(wǎng)站,專注于網(wǎng)站建設(shè)10年,網(wǎng)設(shè)計(jì)領(lǐng)域的專業(yè)建站公司;建站業(yè)務(wù)涵蓋:新野等地區(qū)。新野做網(wǎng)站價(jià)格咨詢:18982081108
要學(xué)JAVA最好還是找本書看一看。JAVA能做的東西很多,你要決定你的主攻方向然后就去找相應(yīng)的資料。
你要學(xué)哪方面:
JAVA應(yīng)用程序開發(fā),
JAVA網(wǎng)絡(luò)開發(fā):JSP,APPLET。
JAVA手持設(shè)備軟件開發(fā),像手機(jī)軟件等。
如果對(duì)程序還不是很懂,最好找本JAVA入門級(jí)的書看看,然后再?zèng)Q定。
Jsoup從Html文件中提取正文內(nèi)容
示例代碼:
File input = new File("/tmp/input.html");
Document doc = Jsoup.parse(input, "UTF-8", "/example.com/");
Element content = doc.getElementById("content");
Elements links = content.getElementsByTag("a");
for (Element link : links) {
String linkHref = link.attr("href");
String linkText = link.text();
}
jsoup是一款Java的HTML解析器,可直接解析某個(gè)URL地址、HTML文本內(nèi)容。它提供了一套非常省力的API,可通過DOM,CSS以及類似于JQuery的操作方法來取出和操作數(shù)據(jù)。
jsoup的主要功能如下:
1. 從一個(gè)URL,文件或字符串中解析HTML;
2.使用DOM或CSS選擇器來查找、取出數(shù)據(jù);
3. 可操作HTML元素、屬性、文本;
public string GetHttpData(string Url)
{
string sException=null;
string sRslt=null;
WebResponse oWebRps=null;
WebRequest oWebRqst=WebRequest.Create(Url);
oWebRqst.Timeout=50000;
try
{
oWebRps=oWebRqst.GetResponse();
}
catch(WebException e)
{
sException=e.Message.ToString();
EYResponse.Write(sException);
}
catch(Exception e)
{
sException=e.ToString();
EYResponse.Write(sException);
}
finally
{
if(oWebRps!=null)
{
StreamReader oStreamRd=new StreamReader(oWebRps.GetResponseStream(),Encoding.GetEncoding("GB2312"));
sRslt=oStreamRd.ReadToEnd();
oStreamRd.Close();
oWebRps.Close();
}
}
return sRslt;
}
就是重構(gòu)-抽取方法,簡(jiǎn)單來說就是把部分相關(guān)代碼抽取出來成為一個(gè)方法,原來代碼的位置改由調(diào)用該方法來代替。
如果你使用如Eclipse這種IDE,你可以通過選擇要抽取的代碼,鼠標(biāo)右鍵選擇重構(gòu)-抽取方法,按照步驟給方法命名,確認(rèn),IDE就會(huì)幫你自動(dòng)地把代碼抽取出來形成一個(gè)私有的方法,原來的位置就會(huì)被調(diào)用這個(gè)方法的代碼代替。
雖然操作步驟很簡(jiǎn)單,也就是把代碼換個(gè)位置寫,但實(shí)際隱含著程序設(shè)計(jì)的合理性和細(xì)粒度的考慮:
很明顯你的代碼里有超長(zhǎng)的方法,一般方法會(huì)控制在10行以內(nèi),超過10行就可以認(rèn)為有代碼是可以提取出來成為公用方法的。超長(zhǎng)的方法常常意味著高耦合、低內(nèi)聚,重用性差和該類的職責(zé)太多。舉個(gè)例子:
你的Servlet方法可能干了很多響應(yīng)用戶的操作,但有可能Servlet的另一個(gè)方法需要做其中一部分相同的操作,或者另外一個(gè)Servlet(一個(gè)Web應(yīng)用有多個(gè)Servlet很正常)也需要同樣的操作,更甚是一個(gè)本地的控制臺(tái)應(yīng)用程序(Servlet是屬于會(huì)話層的,桌面應(yīng)用程序一般不需要會(huì)話層)也需要做同樣操作。這時(shí)候你會(huì)發(fā)現(xiàn)寫在你的Servlet的代碼只能拷貝到另一個(gè)程序中,或者壓根就得重寫,效率很低而且這樣你的代碼里會(huì)有很多重復(fù)代碼...以后改一下就得改3個(gè)地方,不可維護(hù)的代碼就是這樣來的。同時(shí)你的超長(zhǎng)方法也是難以理解的。
如何把握好程序的合理性需要很多的經(jīng)驗(yàn)和設(shè)計(jì)技巧,這里就不提及了。有興趣可以向著面向?qū)ο蟪绦蛟O(shè)計(jì)這個(gè)方向鉆研。