不知道是CS還是BS的 BS可以用過濾器實現(xiàn) 不知道閣下知否 CS的話 可以對字符轉(zhuǎn)碼 例如:String str="hello";String newStr=new String(str.getBytes("ISO-8859-1"));ISO-8859-1 是需要轉(zhuǎn)成的字符集編碼 根據(jù)閣下的需求定
成都創(chuàng)新互聯(lián)主營烏海網(wǎng)站建設(shè)的網(wǎng)絡(luò)公司,主營網(wǎng)站建設(shè)方案,app軟件開發(fā)公司,烏海h5微信小程序開發(fā)搭建,烏海網(wǎng)站營銷推廣歡迎烏海等地區(qū)企業(yè)咨詢
通過JDK1.6知道String類中g(shù)etBytes(”編碼“)方法可以講一個數(shù)用指定的編碼轉(zhuǎn)成一個字節(jié)數(shù)組,String中通過指定的 charset解碼指定的 byte 數(shù)組,構(gòu)造一個新的?String。代碼如下:
try{
String s = "java學(xué)習(xí)";
System.out.println(s);
String result = new String(s.getBytes("GB2312"),"iso-8859-1");
System.out.println(s);
} catch (UnsupportedEncodingException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
擴展資料:
getBytes() 方法有兩種形式:
1、getBytes(String charsetName):?使用指定的字符集將字符串編碼為 byte 序列,并將結(jié)果存儲到一個新的 byte 數(shù)組中。
2、getBytes():?使用平臺的默認(rèn)字符集將字符串編碼為 byte 序列,并將結(jié)果存儲到一個新的 byte 數(shù)組中。
參考資料:
百度百科-getBytes()
java不同編碼之間進(jìn)行轉(zhuǎn)換,都需要使用unicode作為中轉(zhuǎn)。
以utf-8轉(zhuǎn)gbk為例,示例代碼如下:
String?t?=?"這是一個字符串a(chǎn)aa111";??
String?utf8?=?new?String(t.getBytes(?"UTF-8"));??
System.out.println(utf8);??
String?unicode?=?new?String(utf8.getBytes(),"UTF-8");???
System.out.println(unicode);??
String?gbk?=?new?String(unicode.getBytes("GBK"));??
System.out.println(gbk);
Java中字符串轉(zhuǎn)碼,根據(jù)實際運用的環(huán)境有以下三種方式
使用Java.lang.String這是最常用的方法,先用對應(yīng)編碼獲取字節(jié),然后重新構(gòu)造新編碼,示例代碼如下:String?s?=?"清山";??
byte[]?b?=?s.getBytes("utf-8");//編碼??
String?sa?=?new?String(b,?"gb2312");//解碼:用什么字符集編碼就用什么字符集解碼
java.io.InputStreamReader/OutputStreamWriter:橋轉(zhuǎn)換讀寫文件的應(yīng)用中,可以使用這種方式,直接在IO流構(gòu)造中轉(zhuǎn)換,示例代碼如下:
InputStream?is?=?new?FileInputStream("C:/項目進(jìn)度跟蹤.txt");//文件讀取??
InputStreamReader?isr?=?new?InputStreamReader(is,?"utf-8");//解碼??
OutputStream?os?=?new?FileOutputStream("C:/項目進(jìn)度跟蹤_gb2312.txt");//文件輸出??
OutputStreamWriter?osw?=?new?OutputStreamWriter(os,?"gb2312");//開始編碼
java.nio.Charset使用nio中的Charset轉(zhuǎn)換字符,示例代碼如下:Charset?inSet?=?Charset.forName("utf-8");??//?解碼字符集?
Charset?outSet?=?Charset.forName("gb2312");??//?編碼字符集??
CharsetDecoder?de?=?inSet.newDecoder();??//?解碼器
CharsetEncoder?en?=?outSet.newEncoder();//?編碼
java不同編碼之間進(jìn)行轉(zhuǎn)換,都需要使用unicode作為中轉(zhuǎn)。
String str = "任意字符串";
str = new String(str.getBytes("gbk"),"utf-8");
備注說明:
str.getBytes("UTF-8"); 意思是以UTF-8的編碼取得字節(jié)
new String(XXX,"UTF-8"); 意思是以UTF-8的編碼生成字符串
舉例:
public static String getUTF8XMLString(String xml) {
// A StringBuffer Object
StringBuffer sb = new StringBuffer();
sb.append(xml);
String xmString = "";
String xmlUTF8="";
try {
xmString = new String(sb.toString().getBytes("UTF-8"));
xmlUTF8 = URLEncoder.encode(xmString, "UTF-8");
System.out.println("utf-8 編碼:" + xmlUTF8) ;
} catch (UnsupportedEncodingException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
// return to String Formed
return xmlUTF8;
擴展資料:
UTF-8編碼規(guī)則:
如果只有一個字節(jié)則其最高二進(jìn)制位為0;如果是多字節(jié),其第一個字節(jié)從最高位開始,連續(xù)的二進(jìn)制位值為1的個數(shù)決定了其編碼的字節(jié)數(shù),其余各字節(jié)均以10開頭。
實際表示ASCII字符的UNICODE字符,將會編碼成1個字節(jié),并且UTF-8表示與ASCII字符表示是一樣的。所有其他的UNICODE字符轉(zhuǎn)化成UTF-8將需要至少2個字節(jié)。每個字節(jié)由一個換碼序列開始。第一個字節(jié)由唯一的換碼序列,由n位連續(xù)的1加一位0組成,首字節(jié)連續(xù)的1的個數(shù)表示字符編碼所需的字節(jié)數(shù)。
Unicode轉(zhuǎn)換為UTF-8時,可以將Unicode二進(jìn)制從低位往高位取出二進(jìn)制數(shù)字,每次取6位,如上述的二進(jìn)制就可以分別取出為如下示例所示的格式,前面按格式填補,不足8位用0填補。
參考資料來源:百度百科:UTF-8