utf8編碼的數(shù)據(jù)可直接使用下面的代碼
創(chuàng)新互聯(lián)長(zhǎng)期為上1000家客戶提供的網(wǎng)站建設(shè)服務(wù),團(tuán)隊(duì)從業(yè)經(jīng)驗(yàn)10年,關(guān)注不同地域、不同群體,并針對(duì)不同對(duì)象提供差異化的產(chǎn)品和服務(wù);打造開放共贏平臺(tái),與合作伙伴共同營(yíng)造健康的互聯(lián)網(wǎng)生態(tài)環(huán)境。為云城企業(yè)提供專業(yè)的成都網(wǎng)站建設(shè)、
網(wǎng)站制作,
云城網(wǎng)站改版等技術(shù)服務(wù)。擁有十余年豐富建站經(jīng)驗(yàn)和眾多成功案例,為您定制開發(fā)。
最關(guān)鍵的步驟就是把字符串拆成單個(gè)字,UTF-8編碼的字,如果只有一個(gè)字節(jié)則其最高二進(jìn)制位為0;如果是多字節(jié),其第一個(gè)字節(jié)從最高位開始,連續(xù)的二進(jìn)制位值為1的個(gè)數(shù)決定了其編碼的位數(shù),其余各字節(jié)均以10開頭。
UTF-8最多可用到6個(gè)字節(jié)。
1字節(jié) 0xxxxxxx
2字節(jié) 110xxxxx 10xxxxxx
3字節(jié) 1110xxxx 10xxxxxx 10xxxxxx
4字節(jié) 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
5字節(jié) 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
6字節(jié) 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
其它就很簡(jiǎn)單了
1、禁用字處理 禁用字拆分后以第一個(gè)為key保存
2、待測(cè)試字符串
a)、拆分成單字
b)、大寫轉(zhuǎn)小寫,字母和空格全角轉(zhuǎn)半角,去掉多余空格(英文字母后最多只會(huì)有一個(gè)空格,中文后不應(yīng)該有空格)
c)、遍歷字符串的所有字 檢測(cè)每個(gè)字對(duì)應(yīng)的禁用字組是否在待測(cè)字符串中
#include
#include
#include
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國(guó)服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡(jiǎn)單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢(shì),專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場(chǎng)景需求。
文章名稱:禁用字檢測(cè)-創(chuàng)新互聯(lián)
標(biāo)題來源:
http://weahome.cn/article/ceojji.html