今天就跟大家聊聊有關(guān)java字符出現(xiàn)亂碼的原因和解決方法,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結(jié)了以下內(nèi)容,希望大家根據(jù)這篇文章可以有所收獲。
創(chuàng)新互聯(lián)建站基于成都重慶香港及美國等地區(qū)分布式IDC機房數(shù)據(jù)中心構(gòu)建的電信大帶寬,聯(lián)通大帶寬,移動大帶寬,多線BGP大帶寬租用,是為眾多客戶提供專業(yè)德陽機房托管報價,主機托管價格性價比高,為金融證券行業(yè)服務(wù)器托管,ai人工智能服務(wù)器托管提供bgp線路100M獨享,G口帶寬及機柜租用的專業(yè)成都idc公司。
原因:
編解碼不一致導(dǎo)致字符亂碼。
首先,我們可以通過調(diào)用java.nio.charset.Charset.defaultCharset()
獲得系統(tǒng)的默認(rèn)字符集,中文Windows系統(tǒng)都是GBK,所以JVM默認(rèn)都是以GBK字符集來進行編解碼。
亂碼產(chǎn)生最大的可能性在于編解碼不一致。
// 代碼片段1: byte[] read = "你好abc".getBytes(); String result = new String(read); System.out.println(result);
上訴這段代碼一共有3步:
1、編碼。這里為了看起來更簡潔就這樣寫,事實上和你從文件/網(wǎng)絡(luò)等其他媒介讀取是一樣的,原本輸入流是什么類型編碼,讀取后也是什么類型編碼。這里沒有指定編碼方式,所以默認(rèn)為GBK。
2、解碼。我們最終的操作都是字符串對象,可以通過指定字符串的對字節(jié)數(shù)組的解碼方式,最終獲得一個字符串對象。這里沒有指定解碼方式,所以默認(rèn)為GBK。
3、輸出、使用字符串。事實上這里還有一次編解碼過程,就是輸出流編碼為GBK,控制臺解碼為GBK,最終顯示。因為輸出、使用字符串時都是以系統(tǒng)默認(rèn)字符集進行,不存在編解碼不一致的可能,所以這里不會是亂碼根源。
假設(shè)我們將輸入流的編碼改一下:
// 代碼片段2: byte[] read = "你好abc".getBytes("utf-8"); String result = new String(read); System.out.println(result);
再來分析一下3步:
1、編碼,utf-8;
2、解碼,gbk。
編解碼不一致,這里便產(chǎn)生了亂碼。
至于如何修復(fù),相信已經(jīng)很清楚了。
修復(fù)方法如下:
// 代碼片段3: byte[] read = "你好abc".getBytes("utf-8"); String result = new String(read,"utf-8"); System.out.println(result);
將解碼方式改為與編碼對應(yīng)就可以了。
小結(jié):
1、我們一般比較難控制輸入流是什么編碼,所以注意解碼時與輸入流的編碼類型一致即可。我們一般在調(diào)用輸入流的相關(guān)方法看到有charset參數(shù),就是指解碼方式。
2、輸出流同樣可以操作其編碼方式,如果后續(xù)會以輸入流操作這個輸出的結(jié)果,比如說文件,只要都以默認(rèn)的方式進行,便不會產(chǎn)生亂碼。我們一般在調(diào)用輸出流的相關(guān)方法看到有charset參數(shù),就是指編碼方式。
看完上述內(nèi)容,你們對java字符出現(xiàn)亂碼的原因和解決方法有進一步的了解嗎?如果還想了解更多相關(guān)內(nèi)容,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝各位的閱讀。