Arthas是一個(gè)類(lèi)似于Btrace的JVM在線調(diào)試分析工具,具體可參考我之前寫(xiě)的一篇博客:利用JVM在線調(diào)試工具排查線上問(wèn)題。本文分享筆者剛遇到的一個(gè)問(wèn)題,雖然不復(fù)雜,但是很典型。
公司主營(yíng)業(yè)務(wù):成都網(wǎng)站設(shè)計(jì)、網(wǎng)站建設(shè)、移動(dòng)網(wǎng)站開(kāi)發(fā)等業(yè)務(wù)。幫助企業(yè)客戶真正實(shí)現(xiàn)互聯(lián)網(wǎng)宣傳,提高企業(yè)的競(jìng)爭(zhēng)能力。成都創(chuàng)新互聯(lián)是一支青春激揚(yáng)、勤奮敬業(yè)、活力青春激揚(yáng)、勤奮敬業(yè)、活力澎湃、和諧高效的團(tuán)隊(duì)。公司秉承以“開(kāi)放、自由、嚴(yán)謹(jǐn)、自律”為核心的企業(yè)文化,感謝他們對(duì)我們的高要求,感謝他們從不同領(lǐng)域給我們帶來(lái)的挑戰(zhàn),讓我們激情的團(tuán)隊(duì)有機(jī)會(huì)用頭腦與智慧不斷的給客戶帶來(lái)驚喜。成都創(chuàng)新互聯(lián)推出屯溪免費(fèi)做網(wǎng)站回饋大家。
昨天上線遇到一個(gè)問(wèn)題,交易后給大數(shù)據(jù)平臺(tái)異步送數(shù),但是他們說(shuō)沒(méi)收到數(shù)據(jù),因?yàn)槲覀儧](méi)有打日志,所以沒(méi)有直接的證據(jù)證明是他們的問(wèn)題而不是我們的問(wèn)題。
送數(shù)的原理大致如下,就是交易主線程把數(shù)據(jù)放到隊(duì)列里,然后異步線程從隊(duì)列里把數(shù)據(jù)取出來(lái),發(fā)送到后臺(tái)。
隊(duì)列:
BlockingQueue queue = new BlockingQueue();
同步線程:
void sendMsg(Message msg) {
queue.offer(msg);
}
異步線程:
void consume() {
Message msg = queue.take();
while(msg != null) {
HttpClient.post(msg);
msg = queue.take();
}
}
具體送數(shù)的代碼如下( 加了行數(shù)):
38 public void consume(Map msg) {
39 HttpClient httpClient = new HttpClient(cm);
40 PostMethod method = new PostMethod(uri);
41 method.addRequestHeader("context-type", "application/x-www-form-urlencoded");
42 JSONObject json = new JSONObject(msg);
43 NameValuePair[] params = new NameValuePair[2];
44 params[0] = new NameValuePair("topic", topic);
45 params[1] = new NameValuePair("value", json.toJSONString());
46 //System.out.println(msg.toString());
47 logger.info("BigDataHttp Send Json:" + json.toJSONString());
48 method.addParameters(params);
49 try {
50
51 httpClient.executeMethod(method);
52 if(method.getStatusCode() == 200) {
53 logger.info("BigDataHttp response(Success):"+ method.getResponseBodyAsString());
54 } else {
55 logger.info("BigDataHttp Response(error):" + method.getResponseBodyAsString());
56 }
57 } catch(Exception e) {
58 logger.error(e.getMessage(), e);
59 } finally {
60 method.releaseConnection();
61 }
62 }
在日志里沒(méi)有發(fā)現(xiàn)try里的異常,而比較遺憾的是,我們的日志雖然開(kāi)了info級(jí)別,但是因?yàn)槿罩玖刻?,所以只開(kāi)了交易上送和下發(fā)報(bào)文的日志,其他的日志都關(guān)了。
現(xiàn)在日志級(jí)別沒(méi)法調(diào),有沒(méi)有辦法能確定,請(qǐng)求返回了200,還是其他值呢?
可以用在線調(diào)試工具Arthas,我們使用Arthas的trace功能,查看這個(gè)類(lèi)執(zhí)行的詳細(xì)步驟。
首先連接上這個(gè)JVM進(jìn)程,pid為進(jìn)程號(hào)。
java -jar arthas-boot.jar pid
然后執(zhí)行命令
trace xxx.util.bigDataUtil.BigDataHttpConsumer consume
這條命令的左右就是,追蹤xxx.util.bigDataUtil.BigDataHttpConsumer類(lèi)里consume方法的執(zhí)行過(guò)程。
執(zhí)行的結(jié)果如下,每一行最后的是代碼行數(shù),我們可以看一下,跟上面代碼是一一對(duì)應(yīng)的。
從代碼中可以看到,如果返回碼是200,那么它會(huì)執(zhí)行第52行,如果返回碼不是200,會(huì)執(zhí)行55行,因此,我們通過(guò)trace功能確定執(zhí)行了哪條語(yǔ)句,就可以知道到底返回沒(méi)返回200,從結(jié)果來(lái)看,確定返回的不是200。
這樣我們就有了確定的證據(jù)證明發(fā)給后臺(tái)時(shí)返回非200,后臺(tái)同事檢查了自己的配置發(fā)現(xiàn)配置有誤,是他們自己的問(wèn)題。