這篇文章主要為大家展示了“Java避免UTF-8的csv文件打開中文出現(xiàn)亂碼怎么辦”,內容簡而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領大家一起研究并學習一下“Java避免UTF-8的csv文件打開中文出現(xiàn)亂碼怎么辦”這篇文章吧。
站在用戶的角度思考問題,與客戶深入溝通,找到大安市網站設計與大安市網站推廣的解決方案,憑借多年的經驗,讓設計與互聯(lián)網技術結合,創(chuàng)造個性化、用戶體驗好的作品,建站類型包括:成都網站設計、網站制作、企業(yè)官網、英文網站、手機端網站、網站推廣、域名申請、虛擬空間、企業(yè)郵箱。業(yè)務覆蓋大安市地區(qū)。
具體如下:
最近又遇到了需要提供csv下載功能的需求,不同的時需要用java來實現(xiàn),心想簡單,就把以前php的版本重寫了一遍,然后生成一份csv,用excel2007打開一看,里面的中文都是亂碼,一下就懵了,以前好好的功能怎么突然不行了??以前也一直用2007的啊!于是開始了漫長的google之旅。
看來看去,說的都是輸出utf-8格式的csv需要在文件頭先輸出BOM(BOM不懂的可以google了),即0xEF 0xBB 0xBF三個字節(jié),這樣更摸不著頭腦了,明明是對的,偏偏不成功,直到發(fā)現(xiàn)一個帖子:http://stackoverflow.com/a/9337150/1794493 ,里面提到2007需要裝sp3才能識別BOM,shit!原來是這回事!里面同時又提到,用utf-16le編碼輸出貌似更通用,經測試確實如此,但是utf-16le的BOM是0xFF 0xFE,帖子里面說錯了!下面是一個簡單的測試結果:
excel版本 | 附加包 | 編碼 | 測試結果 |
---|---|---|---|
2007 | sp3 | utf-8 | yes |
2007 | 無 | utf-8 | no |
2007 | sp3 | utf-16le | yes |
2007 | 無 | utf-16le | yes |
2011 | 無 | utf-8 | no |
2011 | 無 | utf-16le | yes |
因為條件有限,只測試了這幾個版本,可見utf-16le是更通用的編碼格式。下面附上java代碼,main方法中采用utf-16le編碼,最后調用了utf8編碼的方法,最后會輸出兩種編碼格式的csv文件:
import java.io.*; /** * Created by zhaozhi on 15-5-29. */ public class TestCSV { public static String join(String[] strArr, String delim) { StringBuilder sb = new StringBuilder(); for(String s : strArr) { sb.append(s); sb.append(delim); } String ret; if (strArr.length > 1) { ret = sb.substring(0, sb.length()-1); } else { ret = sb.toString(); } return ret; } public static void main (String[] args) throws Exception { String[] heads = {"日期", "產品", "訂單數(shù)"}; String[][] rows = { {"20150228", "安卓", "23"}, {"20150301", "web", "34"} }; byte[] bom = {(byte)0xFF, (byte)0xFE}; String fname = "d:\\utf-16le.csv"; BufferedOutputStream bo = new BufferedOutputStream(new FileOutputStream(fname)); bo.write(bom); bo.write(join(heads, "\t").getBytes("utf-16le")); bo.write("\n".getBytes("utf-16le")); for (String[] row : rows) { bo.write(join(row, "\t").getBytes("utf-16le")); bo.write("\n".getBytes("utf-16le")); } bo.close(); UTF8(); } public static void UTF8() throws IOException { String line = "中文,標題,23"; OutputStream os = new FileOutputStream("d:/utf-8.csv"); os.write(239); // 0xEF os.write(187); // 0xBB os.write(191); // 0xBF PrintWriter w = new PrintWriter(new OutputStreamWriter(os, "UTF-8")); w.print(line); w.flush(); w.close(); } }
以上是“Java避免UTF-8的csv文件打開中文出現(xiàn)亂碼怎么辦”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注創(chuàng)新互聯(lián)行業(yè)資訊頻道!