今天就跟大家聊聊有關java字符出現(xiàn)亂碼的原因和解決方法,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結了以下內(nèi)容,希望大家根據(jù)這篇文章可以有所收獲。
創(chuàng)新互聯(lián)公司主營柳城網(wǎng)站建設的網(wǎng)絡公司,主營網(wǎng)站建設方案,app軟件定制開發(fā),柳城h5微信小程序定制開發(fā)搭建,柳城網(wǎng)站營銷推廣歡迎柳城等地區(qū)企業(yè)咨詢原因:
編解碼不一致導致字符亂碼。
首先,我們可以通過調(diào)用java.nio.charset.Charset.defaultCharset()
獲得系統(tǒng)的默認字符集,中文Windows系統(tǒng)都是GBK,所以JVM默認都是以GBK字符集來進行編解碼。
亂碼產(chǎn)生大的可能性在于編解碼不一致。
// 代碼片段1: byte[] read = "你好abc".getBytes(); String result = new String(read); System.out.println(result);
上訴這段代碼一共有3步:
1、編碼。這里為了看起來更簡潔就這樣寫,事實上和你從文件/網(wǎng)絡等其他媒介讀取是一樣的,原本輸入流是什么類型編碼,讀取后也是什么類型編碼。這里沒有指定編碼方式,所以默認為GBK。
2、解碼。我們最終的操作都是字符串對象,可以通過指定字符串的對字節(jié)數(shù)組的解碼方式,最終獲得一個字符串對象。這里沒有指定解碼方式,所以默認為GBK。
3、輸出、使用字符串。事實上這里還有一次編解碼過程,就是輸出流編碼為GBK,控制臺解碼為GBK,最終顯示。因為輸出、使用字符串時都是以系統(tǒng)默認字符集進行,不存在編解碼不一致的可能,所以這里不會是亂碼根源。
假設我們將輸入流的編碼改一下:
// 代碼片段2: byte[] read = "你好abc".getBytes("utf-8"); String result = new String(read); System.out.println(result);
再來分析一下3步:
1、編碼,utf-8;
2、解碼,gbk。
編解碼不一致,這里便產(chǎn)生了亂碼。
至于如何修復,相信已經(jīng)很清楚了。
修復方法如下:
// 代碼片段3: byte[] read = "你好abc".getBytes("utf-8"); String result = new String(read,"utf-8"); System.out.println(result);
將解碼方式改為與編碼對應就可以了。
小結:
1、我們一般比較難控制輸入流是什么編碼,所以注意解碼時與輸入流的編碼類型一致即可。我們一般在調(diào)用輸入流的相關方法看到有charset參數(shù),就是指解碼方式。
2、輸出流同樣可以操作其編碼方式,如果后續(xù)會以輸入流操作這個輸出的結果,比如說文件,只要都以默認的方式進行,便不會產(chǎn)生亂碼。我們一般在調(diào)用輸出流的相關方法看到有charset參數(shù),就是指編碼方式。
看完上述內(nèi)容,你們對java字符出現(xiàn)亂碼的原因和解決方法有進一步的了解嗎?如果還想了解更多相關內(nèi)容,歡迎關注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝各位的閱讀。