1、問題
我們提供的服務有:成都做網(wǎng)站、成都網(wǎng)站設計、微信公眾號開發(fā)、網(wǎng)站優(yōu)化、網(wǎng)站認證、肥東ssl等。為近1000家企事業(yè)單位解決了網(wǎng)站和推廣的問題。提供周到的售前咨詢和貼心的售后服務,是有科學管理、有技術(shù)的肥東網(wǎng)站制作公司
將查詢的數(shù)據(jù)以xls文件導出時(UTF-8編碼),數(shù)據(jù)正常;但以CSV文件導出時,文件中的中文亂碼,同樣是UTF-8編碼,改成GBK編碼導出時,中文顯示正常。
本以為問題解決,后面導出含拉丁字符(如à?êàì)的數(shù)據(jù)時,以xls文件導出數(shù)據(jù)正常顯示,以CSV文件導出時,文件中的拉丁字符顯示為“?”號。
試著改成其他編碼方式都無效,后面網(wǎng)上搜到了一篇解決該問題的方法。
2、解決方法
以CSV方式導出的文件中默認不含BOM信息,通過給將要輸出的內(nèi)容設置BOM標識(以 EF BB BF 開頭的字節(jié)流)即可解決該問題。具體方法如下:
... OutputStreamWriter outputStreamWriter = new OutputStreamWriter(response.getOutputStream(), "UTF-8"); // 要輸出的內(nèi)容 result = (String)contentMap.get(RESPONSE_RESULT); response.setHeader("Content-Disposition", "attachment;filename=test.csv"); outputStreamWriter.write(new String(new byte[]{(byte) 0xEF, (byte) 0xBB, (byte) 0xBF})); outputStreamWriter.write(result); outputStreamWriter.flush();
如果是以OutputStream流實現(xiàn)的 ,參數(shù)可以按如下修改:
out = response.getOutputStream(); //加上UTF-8文件的標識字符 out.write(new byte []{(byte) 0xEF, (byte) 0xBB, (byte) 0xBF});
注:
BOM: Byte Order Mark,字節(jié)順序標記(以下摘自百度百科)
在UCS 編碼中有一個叫做 “Zero Width No-Break Space” ,中文譯名作“零寬無間斷間隔”的字符,它的編碼是 FEFF。而 FFFE 在 UCS 中是不存在的字符,所以不應該出現(xiàn)在實際傳輸中。
UCS 規(guī)范建議我們在傳輸字節(jié)流前,先傳輸字符 “Zero Width No-Break Space”。這樣如果接收者收到 FEFF,就表明這個字節(jié)流是 Big-Endian 的;如果收到FFFE,就表明這個字節(jié)流是 Little- Endian 的。因此字符 “Zero Width No-Break Space(零寬無間斷間隔)” 又被稱作 BOM。
UTF-8 不需要 BOM 來表明字節(jié)順序,但可以用 BOM 來表明編碼方式。字符 “Zero Width No-Break Space” 的 UTF-8 編碼是 EF BB BF。所以如果接收者收到以 EF BB BF 開頭的字節(jié)流,就知道這是 UTF-8編碼了。Windows 就是使用 BOM 來標記文本文件的編碼方式的。
以上就是java導出csv亂碼解決方法介紹的詳細內(nèi)容,更多請關注創(chuàng)新互聯(lián)其它相關文章!