對(duì)于支持 UNICODE的應(yīng)用程序,Windows 會(huì)默認(rèn)使用 Unicode編碼。對(duì)于不支持Unicode的應(yīng)用程序Windows 會(huì)采用 ANSI編碼 (也就是各個(gè)國(guó)家自己制定的標(biāo)準(zhǔn)編碼方式,如對(duì)于西歐文字有ISO/IEC 8859編碼,對(duì)于簡(jiǎn)體中文有GB 18030編碼,對(duì)于繁體中文有BIG-5等),Windows 對(duì)于不支持Unicode的程序默認(rèn)只能使用一種ANSI編碼(實(shí)際上Windows所做的是通過(guò)所選擇的默認(rèn)代碼頁(yè)(Code Page), 將 ANSI編碼翻譯成Unicode)。英文版的系統(tǒng)應(yīng)該是默認(rèn)使用的是ISO/IEC 8859編碼,所以當(dāng)運(yùn)行采用GB 18030編碼的中文軟件時(shí)會(huì)出現(xiàn)亂碼。
創(chuàng)新互聯(lián)自2013年起,是專(zhuān)業(yè)互聯(lián)網(wǎng)技術(shù)服務(wù)公司,擁有項(xiàng)目網(wǎng)站設(shè)計(jì)制作、成都做網(wǎng)站網(wǎng)站策劃,項(xiàng)目實(shí)施與項(xiàng)目整合能力。我們以讓每一個(gè)夢(mèng)想脫穎而出為使命,1280元長(zhǎng)清做網(wǎng)站,已為上家服務(wù),為長(zhǎng)清各地企業(yè)和個(gè)人服務(wù),聯(lián)系電話:18980820575
想要更改默認(rèn)使用的編碼方式,可嘗試以下步驟,
打開(kāi) 控制面板(Control Panel)
打開(kāi) 時(shí)鐘、語(yǔ)言和區(qū)域 (Clock, Language and Region)
點(diǎn)擊 區(qū)域 (Region)
選擇 格式(Format) 選項(xiàng)卡,并將格式 改為 Chinese (Simplified, China) (這個(gè)其實(shí)可以不改,看你的喜好,更改此處會(huì)更改時(shí)間顯示方式如 把日期 改為 YYYY/MM/DD 等,有些程序會(huì)通過(guò)此項(xiàng)來(lái)選擇所顯示的語(yǔ)言。重點(diǎn)的從第五步開(kāi)始)
然后 點(diǎn)擊打開(kāi) 管理(Administrative) 選項(xiàng)卡
點(diǎn)擊 更改系統(tǒng)區(qū)域設(shè)置 (Change system locale...) 按鈕 (若出現(xiàn)用戶賬戶控制對(duì)話框,請(qǐng)選擇“允許”或“是”或者“確定”)
將區(qū)域設(shè)定 改為 Chinese (Simplified, China) 然后 點(diǎn)擊確定,并重新啟動(dòng)計(jì)算機(jī)。
另外對(duì)于你說(shuō)的txt文件。Windows 自帶的記事本(Notepad.exe)會(huì)默認(rèn)采用 ANSI 編碼來(lái)處理文本文件,這也是由于大部分的文本文件都是用的各國(guó)自己的編碼標(biāo)準(zhǔn)寫(xiě)成的。這個(gè)ANSI 編碼的具體編碼方式,也會(huì)因上面所講述的設(shè)置變化而有所改變。若想要擺脫不同的 ANSI 編碼所產(chǎn)生的困擾(如在中文的系統(tǒng)上寫(xiě)的TXT文檔要在日文的系統(tǒng)上打開(kāi)經(jīng)常會(huì)出現(xiàn)亂碼),可以在保存文本文件時(shí) 選擇采用 UTF-8 (單字節(jié)8位的Unicode編碼)。
另外,通過(guò) Web瀏覽器(如 Internet Explorer)打開(kāi)文本文檔時(shí),可以給你機(jī)會(huì)(如在頁(yè)面上單擊鼠標(biāo)右鍵)選擇你認(rèn)為應(yīng)該選擇的編碼方式。如下圖,
依次單擊開(kāi)始——所有程序——附件——命令提示符,打開(kāi)命令提示符,輸入chcp,按回車(chē)鍵執(zhí)行,會(huì)查詢當(dāng)前系統(tǒng)的活動(dòng)代碼頁(yè),它指明了當(dāng)前系統(tǒng)使用的編碼,如下圖所示:
936 代表GBK 擴(kuò)展的EUC-CN 編碼( GB 2312-80編碼,包含 6763 個(gè)漢字)到Unicode (GB13000.1-93)中定義的20902個(gè)漢字,即中國(guó)大陸使用的是簡(jiǎn)體中文zh_CN.。其它常見(jiàn)的還有:
932 :Shift-JIS包含日本語(yǔ) charset JIS X 0201 (每個(gè)字符一個(gè)字節(jié)) 和 JIS X 0208 (每個(gè)字符兩個(gè)字節(jié)),所以 JIS X 0201平假名包含一個(gè)字節(jié)半寬的字符,其剩馀的60個(gè)字節(jié)被用做7076個(gè)漢字以及648個(gè)其他全寬字符的首字節(jié).同EUC-JP編碼區(qū)別的是, Shift-JIS沒(méi)有包含JIS X 202中定義的5802個(gè)漢字.
949 :UnifiedHangul (UHC) 是韓文 EUC-KR 編碼(KS C 5601-1992 編碼,包括2350 韓文音節(jié)和 4888 個(gè)漢字a)的超集,包含 8822個(gè)附加的韓文音節(jié)( 在C1中 )
950:是代替EUC-TW (CNS 11643-1992)的 Big5 編碼(13072 繁體 zh_TW 中文字) 繁體中文,這些定義都在Ken Lunde的 CJK.INF中或者 Unicode 編碼表中找到.
有一個(gè)接口是通過(guò)url比如:中文參數(shù),而后面的中文參數(shù)會(huì)被用系統(tǒng)的默認(rèn)字符集編碼,然后傳到tomcat
omcat目錄conf目錄下的server.xml打開(kāi),找到Connector標(biāo)簽,在最后添加URIEncoding="utf-8",效果如下:
Connector
port="8080"maxThreads="150"minSpareThreads="25"maxSpareThreads="75"
enableLookups="false"redirectPort="8443"acceptCount="100"
debug="0"connectionTimeout="20000"
disableUploadTimeout="true"URIEncoding=″utf-8″/
隨便找個(gè)位置,新建一個(gè)文本文檔,打入中文,之后用IO流用 GBK和unicode
讀一下就知道是什么了
實(shí)踐才是硬道理