這篇“tomcat GET請求傳參亂碼問題怎么解決”文章的知識點大部分人都不太理解,所以小編給大家總結了以下內(nèi)容,內(nèi)容詳細,步驟清晰,具有一定的借鑒價值,希望大家閱讀完這篇文章能有所收獲,下面我們一起來看看這篇“tomcat GET請求傳參亂碼問題怎么解決”文章吧。
讓客戶滿意是我們工作的目標,不斷超越客戶的期望值來自于我們對這個行業(yè)的熱愛。我們立志把好的技術通過有效、簡單的方式提供給客戶,將通過不懈努力成為客戶在信息化領域值得信任、有價值的長期合作伙伴,公司提供的服務項目有:空間域名、虛擬空間、營銷軟件、網(wǎng)站建設、蓋州網(wǎng)站維護、網(wǎng)站推廣。
在Tomcat的通道(Connector)配置中,除了URIEncoding之外,還有一個影響編碼的參數(shù)useBodyEncodingForURI,關于這個參數(shù),官方文檔說明如下:
This specifies if the encoding specified in contentType should be used for URI query parameters, instead of using the URIEncoding.This
setting is present for compatibility with Tomcat 4.1.x, where the encoding
specified in the contentType, or explicitly set using Request.setCharacterEncoding method was also used for the parameters from the URL. The default value is
false
.Notes:1) This setting is applied only to the query string of a request. Unlike
URIEncoding
it does not affect the path portion of a request URI. 2) If request character encoding is not known (is not provided by a browser and is not set bySetCharacterEncodingFilter
or a similar filter using Request.setCharacterEncoding method), the default encoding is always "ISO-8859-1". TheURIEncoding
setting has no effect on this default.
其作用大致概括下就是,contentType中指定的編碼是否要替換URIEncoding已經(jīng)設置的值?;蛘哒f將Body的編碼用于URI的參數(shù)解析,這個Body的編碼有兩方面的來源:
request.setCharacterEncoding()
request header中設置的contentType中包含的編碼
如果從上述兩個地方能夠獲取到charset信息,同時useBodyEncodingForURI參數(shù)也設置為true,此時GET請求的參數(shù)解析也使用同一個charset。
如果兩個地方都拿不到charset,那Body的編碼會使用默認值ISO-8859-1,這個一般都能注意到。但這個參數(shù)設置為true時,相當于有個隱含的條件,即GET請求的編碼也會使用默認編碼ISO-8859-1,而無論你之前的URIEncoding設置的是什么編碼。
那這種情況下,雖然URIEncoding設置的編碼可以正常處理中文,但再配置上了這個開并,卻并沒有按照其規(guī)定設置,就會導致亂碼再次產(chǎn)生。而Tomcat8默認已經(jīng)將URIEncoding設置為UTF-8,如果配置中指定useBodyEncodingForURI這一項,亂碼就出現(xiàn)了。
這一配置,默認項為false,
/**
* URI encoding as body.
*/
protected boolean useBodyEncodingForURI = false;
使用這一配置是否生效的地方,在這里
// getCharacterEncoding() may have been overridden to search for
// hidden form field containing request encoding
String enc = getCharacterEncoding();
boolean useBodyEncodingForURI = connector.getUseBodyEncodingForURI();
if (enc != null) {
parameters.setEncoding(enc);
if (useBodyEncodingForURI) {
parameters.setQueryStringEncoding(enc);
}
} else {
parameters.setEncoding
(org.apache.coyote.Constants.DEFAULT_CHARACTER_ENCODING);
if (useBodyEncodingForURI) { //這里的配置是比較容易忽略的地方
parameters.setQueryStringEncoding
(org.apache.coyote.Constants.DEFAULT_CHARACTER_ENCODING); }
}
再看對于enc變量的獲取
coyote包中的Request類:/**
* Get the character encoding used for this request.
*/
public String getCharacterEncoding() {
if (charEncoding != null) { //這里的值即是通過request.setCharacterEncoding設置的
return charEncoding;
}
charEncoding = getCharsetFromContentType(getContentType());
return charEncoding;
}
關于從ContentType中獲取charSet的代碼的代碼此處就不再羅列了。
簡要總結如下:
影響URI參數(shù)解析編碼(GET請求)的地方共有:
1. Connector 的URIEncoding 配置
2. Connector的useBodyEncodingForURI配置,此配置為true時則直接使用ContentType的charset或者request.setCharacterEncoding指定的encoding。
注意,request設置的會先被使用。
3. 特別注意,當設置useBodyEncodingForURI為true時,如果getCharacterEncoding為空,即request未設置編碼,并且ContentType也未配置charset,則queryString會被設置為ISO-8859-1
以上就是關于“tomcat GET請求傳參亂碼問題怎么解決”這篇文章的內(nèi)容,相信大家都有了一定的了解,希望小編分享的內(nèi)容對大家有幫助,若想了解更多相關的知識內(nèi)容,請關注創(chuàng)新互聯(lián)行業(yè)資訊頻道。