1.字符編碼
ascii碼(不能直接寫字符,漢字從而引入了GBK碼)
GB2312 收錄了7445個(gè)漢字及字符;
GBK1.0 收錄了21886個(gè)漢字及字符;
GB18030 收錄了27484個(gè)漢字及字符;
unicode 國(guó)際標(biāo)準(zhǔn)但都需要倆個(gè)字節(jié);
utf-8 是優(yōu)化的國(guó)際化的統(tǒng)一標(biāo)準(zhǔn),(是可變長(zhǎng)的字符集)英文及其字符用1byte表示,而漢字要用3bite表示;
創(chuàng)新互聯(lián)是一家專注于網(wǎng)站設(shè)計(jì)制作、成都做網(wǎng)站與策劃設(shè)計(jì),永和網(wǎng)站建設(shè)哪家好?創(chuàng)新互聯(lián)做網(wǎng)站,專注于網(wǎng)站建設(shè)十年,網(wǎng)設(shè)計(jì)領(lǐng)域的專業(yè)建站公司;建站業(yè)務(wù)涵蓋:永和等地區(qū)。永和做網(wǎng)站價(jià)格咨詢:13518219792
2 .代碼中的體現(xiàn)
res1='你好'
res2='hello'
print(res1.encode('utf-8') ,type(res1.encode('utf-8'))) # b'**\xe4\xbd\xa0**\xe5\xa5\xbd' bytes類型
print(res2.encode('utf-8')) # b'hello'
print(res1.encode('gbk'),type(res1.encode('gbk'))) # b'**\xc4\xe3**\xba\xc3' bytes類型
print(res2.encode('gbk')) # b'hello'
能夠發(fā)現(xiàn)英文在gbk與utf-8的編碼下是不發(fā)生變換的;而漢字在gbk的編碼下是2字節(jié),而在utf-8的編碼下是3字節(jié),類型是bytes類型
ret1=b'\xe4\xbd\xa0\xe5\xa5\xbd'
print(ret1.decode('utf-8'))
print(ret1.decode('gbk')) # 會(huì)出現(xiàn)亂碼 浣犲ソ
能夠發(fā)現(xiàn)utf-8編碼下的bytes類型,由gbk解碼能夠解碼但出現(xiàn)了亂碼,因?yàn)間bk每2個(gè)字節(jié)解碼一次
ret2=b'\xc4\xe3\xba\xc3'
print(ret2.decode('gbk')) # 能夠解碼為 你好
print(ret2.decode('utf-8'))
# 報(bào)錯(cuò)的類型: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc4 in position 0: invalid continuation byte
能夠發(fā)現(xiàn)utf-8編碼下的bytes類型,由gbk解碼能夠解碼但出現(xiàn)了亂碼,因?yàn)間bk每2個(gè)字節(jié)解碼一次
3.實(shí)際中遇到的問(wèn)題(模擬黏包問(wèn)題)`
server端:
import socket
sk=socket.socket()
sk.bind(('127.0.0.1',8091))
sk.setsockopt(socket.SOL_SOCKET,socket.SO_REUSEADDR,1)
sk.listen()
conn,addre=sk.accept()
while True:
cmd=input('>>>')
if cmd=='Q':
conn.send(cmd.encode('utf-8'))
break
conn.send(cmd.encode('utf-8'))
res=conn.recv(1024)
print(res.decode('utf-8'))
conn.close()
sk.close()
client端:
import socket
import subprocess
sk=socket.socket()
sk.connect(('127.0.0.1',8091))
while True:
cmd=sk.recv(1024).decode('utf-8')
if cmd=='Q':
break
res=subprocess.Popen(cmd,shell=True,stdout=subprocess.PIPE,stderr=subprocess.PIPE) # stdout;stderr拿到的數(shù)據(jù)就是bytes類型
stdout='stdout:'+res.stdout.read().**decode('gbk')** # 這里的解碼只能是gbk,因?yàn)樗木幋a形式就是gbk
stderr = 'stderr:' + res.stderr.read()**.decode('gbk')**
sk.send(bytes(stdout,encoding='utf-8'))
sk.send(bytes(stderr,encoding='utf-8'))
sk.close()
4.個(gè)注意的問(wèn)題:
1.socket,send('數(shù)據(jù)類型只能是bytes,傳碼之前一定要編碼');
2.str+ bytes是不能拼接的,只有將bytes類型解碼成str才能拼接;
(能力有限,多多指教^-^)