MySQL/Java服務(wù)端對(duì)emoji的支持與問題的解決方法,相信很多沒有經(jīng)驗(yàn)的人對(duì)此束手無(wú)策,為此本文總結(jié)了問題出現(xiàn)的原因和解決方法,通過這篇文章希望你能解決這個(gè)問題。
成都創(chuàng)新互聯(lián)公司專注為客戶提供全方位的互聯(lián)網(wǎng)綜合服務(wù),包含不限于網(wǎng)站制作、網(wǎng)站建設(shè)、崇川網(wǎng)絡(luò)推廣、微信平臺(tái)小程序開發(fā)、崇川網(wǎng)絡(luò)營(yíng)銷、崇川企業(yè)策劃、崇川品牌公關(guān)、搜索引擎seo、人物專訪、企業(yè)宣傳片、企業(yè)代運(yùn)營(yíng)等,從售前售中售后,我們都將竭誠(chéng)為您服務(wù),您的肯定,是我們最大的嘉獎(jiǎng);成都創(chuàng)新互聯(lián)公司為所有大學(xué)生創(chuàng)業(yè)者提供崇川建站搭建服務(wù),24小時(shí)服務(wù)熱線:028-86922220,官方網(wǎng)址:www.cdcxhl.com
問題描述
將底層抓取的微博數(shù)據(jù)存入mysql,有些數(shù)據(jù)存入失敗,查看Tomcat后,核心錯(cuò)誤信息如下:
// 拋出字符集不支持的異常sql.SQLException: Incorrect string value: '\xF0\x9F\x98\x97\xF0\x9F...' for column 'CONTENT' at row 1
原因分析
MYSQL 5.5 之前, utf8 編碼只支持1~3個(gè)字節(jié),即BMP這部分的unicode編碼區(qū)(基本就是0000~FFFF這一區(qū))。 Emoji表情是4個(gè)字節(jié),而mysql的utf8編碼最多3個(gè)字節(jié),所以導(dǎo)致數(shù)據(jù)插不進(jìn)去 5.5之后,mysql加入utf8mb4編碼,可支持4個(gè)字節(jié),即一個(gè)字符最多能有4字符,因此utf8mb4編碼可支持更多的字符集。 因此,如果項(xiàng)目要存儲(chǔ)移動(dòng)產(chǎn)品的用戶文本,必須將DB字符集從UTF8/GBK等傳統(tǒng)字符集升級(jí)到utf8mb4
【注】
utf8mb4兼容utf8,且比utf8能表示更多的字符。所以將DB字符集從UTF8或GBK等傳統(tǒng)字符集升級(jí)到utf8mb4時(shí)不用擔(dān)心字符的兼容性問題
解決方法
過濾特殊的表情符
content = content.replaceAll("[\\x{10000}-\\x{10FFFF}]", "");// 簡(jiǎn)單粗暴,不人性化
升級(jí)數(shù)據(jù)庫(kù)字符集
1、utf8mb4支持的mysql版本為5.5.3+,若mysql低于該版本請(qǐng)先升級(jí)
2、修改database、table和column字符集
3、修改mysql配置文件my.cnf(windows為my.ini),my.cnf一般在etc/mysql/目錄下,找到后在以下三部分里添加如下內(nèi)容:
[client] default-character-set = utf8mb4
[mysql] default-character-set = utf8mb4
[mysqld]character-set-client-handshake = FALSEcharacter-set-server = utf8mb4collation-server = utf8mb4_unicode_ciinit_connect='SET NAMES utf8mb4'
4、重啟mysql并查看字符集
在mysql命令行輸入:
SHOW VARIABLES WHERE Variable_name LIKE 'character_set_%' OR Variable_name LIKE 'collation%';
重啟之前的字符集
重啟之后的字符集
【注】
必須保證以下字段為utf8mb4 character_set_client character_set_connection character_set_database character_set_results character_set_server
以上4步完成后,利用mysql客戶端navicat在表中手動(dòng)加入Emoji表情?,若能保存成功說明數(shù)據(jù)庫(kù)已升級(jí)成功。
這些字符集配置的具體區(qū)別參考 深入Mysql字符集設(shè)置
5、檢查服務(wù)器端db配置文件
// 配置spring時(shí)使用的鏈接如下:url="jdbc:mysql://localhost:3306/gzhou?allowMultiQueries=true&useUnicode=true&zeroDateTimeBehavior=convertToNull&transformedBitIsBoolean=true&autoReconnect=true&autoReconnectForPools=true&failOverReadOnly=false&maxReconnects=10"http:// 若characterEncoding=utf8mb4,插入數(shù)據(jù)時(shí)報(bào)錯(cuò)Caused by: java.sql.SQLException: Unsupported character encoding 'utf8mb4'// 去掉characterEncoding或characterEncoding=utf8
Emoji表情
android系統(tǒng)中,搜狗、百度輸入法自帶Emoji表情。
【注】
如果系統(tǒng)之間Emoji表情符號(hào)不兼容,只能看到方塊;
看完上述內(nèi)容,你們掌握mysql/Java服務(wù)端對(duì)emoji的支持與問題的解決方法的方法了嗎?如果還想學(xué)到更多技能或想了解更多相關(guān)內(nèi)容,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝各位的閱讀!