什么是序列化,把程序中的對(duì)象或者變量,從內(nèi)存中轉(zhuǎn)換為可存儲(chǔ)或可傳輸?shù)倪^(guò)程稱為序列化。在 Python 中,這個(gè)過(guò)程稱為 pickling,在其他語(yǔ)言中也被稱為 serialization,marshalling,flattening 等。程序中的對(duì)象(或者變量)在序列化之后,就可以直接存放到存儲(chǔ)設(shè)備上,或者直接發(fā)送到網(wǎng)絡(luò)上進(jìn)行傳輸。
從網(wǎng)站建設(shè)到定制行業(yè)解決方案,為提供網(wǎng)站設(shè)計(jì)、成都做網(wǎng)站服務(wù)體系,各種行業(yè)企業(yè)客戶提供網(wǎng)站建設(shè)解決方案,助力業(yè)務(wù)快速發(fā)展。創(chuàng)新互聯(lián)將不斷加快創(chuàng)新步伐,提供優(yōu)質(zhì)的建站服務(wù)。序列化的逆向過(guò)程,即為反序列化(unpickling),就是把序列化的對(duì)象(或者變量)重新讀到內(nèi)存中~
json 模塊就用于序列化和反序列化。對(duì)象(變量)使用json模塊序列化后,表現(xiàn)為一個(gè)字符串,序列化為字符串格式的好處是:序列化后的對(duì)象可以在不同的編程語(yǔ)言之間傳遞。
?
python 數(shù)據(jù)類型和 json 中的字符串對(duì)應(yīng)關(guān)系如下:
python數(shù)據(jù)類型 | json字符串 |
---|---|
dict | '{}' |
list | '[]' |
tuple | '[]' |
str | 'string' |
int/float | '1.23' |
True/False | true/false |
None | null |
json模塊常用的就4個(gè)方法:dump,dumps,load,loads~
這兩個(gè)方法用于序列化對(duì)象,兩個(gè)方法的功能類似,區(qū)別在于,json.dumps 方法接收一個(gè)參數(shù),即需要序列化的對(duì)象,其余參數(shù)為可選參數(shù),方法執(zhí)行完成后,會(huì)返回序列化后得到的字符串;json.dump 接收兩個(gè)參數(shù),第一個(gè)參數(shù)和 dumps方法 相同,即需要序列化的對(duì)象,第二個(gè)參數(shù)為文件對(duì)象,例如 open方法 的返回對(duì)象,其余為可選參數(shù),方法執(zhí)行后,序列化后的字符串會(huì)直接寫(xiě)到文件中~
?
dump / dumps 示例:
import json
d = {'name': '貝貝', 'age': 18}
lst = [1, 2, 3]
tup = ('a', 'b', 'c')
s = 'hello'
i = 3
f = 1.2
flag_1 = True
flag_2 = False
abc = None
print(type(json.dumps(d))) #
print(json.dumps(d)) # {"name": "\u8d1d\u8d1d", "age": 18}
print(json.dumps(lst)) # [1, 2, 3]
print(json.dumps(tup)) # ["a", "b", "c"]
print(json.dumps(s)) # "hello"
print(json.dumps(i)) # 3
print(json.dumps(f)) # 1.2
print(json.dumps(flag_1)) # true
print(json.dumps(flag_2)) # false
print(json.dumps(abc)) # null
# 以上的輸出類型都是 class 'str' 類型,即字符串類型~
#################################
d = {'name': '貝貝', 'age': 18}
with open(file='/tmp/test_json', mode='w') as f:
json.dump(d, f)
# 執(zhí)行完成后,查看輸出的文件內(nèi)容:
? ~ cat /tmp/test_json
{"name": "\u8d1d\u8d1d", "age": 18}%
這兩個(gè)方法用于序列化后的字符串 反序列化,兩者的區(qū)別和 dump、dumps 類似,json.loads 接收一個(gè)字符串參數(shù),其余參數(shù)為可選參數(shù),json.load 也接收一個(gè)參數(shù),該參數(shù)為包含 json 字符串的文件對(duì)象~
json.loads示例:
d = json.loads('{"name": "\u8d1d\u8d1d", "age": 18}')
print(type(d), '--', d)
abc = json.loads('null')
print(type(abc), '--', abc)
tup = json.loads('["a", "b", "c"]')
print(type(tup), '--', tup)
s = json.loads('"hello"')
print(type(s), '--', s)
# 輸出結(jié)果:
-- {'name': '貝貝', 'age': 18}
-- None
-- ['a', 'b', 'c']
-- hello
注意:傳遞給 json.loads 方法的參數(shù)必須用 單引號(hào)括起來(lái),里面的字符串使用雙引號(hào),例如不能有這樣的寫(xiě)法:json.loads("hello"),json.loads("['a', 'b', 'c']"),json 字符串中不支持單引號(hào)~
?
json.load示例:
with open(file='/tmp/test_json', mode='r') as f:
json_data = json.load(f)
print(type(json_data), '--', json_data)
# 輸出結(jié)果:
-- {'name': '貝貝', 'age': 18}
我們可以看到上述示例中,字典對(duì)象中包含有中文字符,在進(jìn)行序列化后,不管是使用 dumps 存放到字符串中 還是使用 dump 存放到文件中,中文字符串是使用 unicode 編碼格式存放的。
?
在Python3中,代碼中的字符串都是使用 unicode 格式存放的,序列化之后也是以u(píng)nicode 格式存放,所以序列化和反序列化過(guò)程都不存在問(wèn)題。
Python2中,代碼中的字符串是 str類型,str類型 和 unicode類型 的關(guān)系如下所示:
unicode -----> encode --------> str(例如為 utf-8編碼)
utf-8(例如為 utf-8編碼) --------> decode ----------> unicode
所以在Python2中,序列化過(guò)程和反序列化過(guò)程都有涉及到轉(zhuǎn)碼過(guò)程(encode和decode),序列化過(guò)程 會(huì)先將對(duì)象中的字符串 使用utf-8 進(jìn)行解碼(decode),轉(zhuǎn)換為unicode類型后,再存放到文件或者字符串中,反序列化過(guò)程 會(huì)將 json字符串 使用utf-8 編碼(encode),然后存放到內(nèi)存中的變量~
?
說(shuō)明:在Python2中,dumps(dump)和loads(load)默認(rèn)使用 utf-8 進(jìn)行 encode和decode,若要使用使用其他編碼方式,可以通過(guò) encode參數(shù) 指定;在Python3中,dumps(dump)和loads(load)方法都沒(méi)有 encode參數(shù)~
?
來(lái)看如下示例:
# -*- coding:utf-8 -*-
d = {'name': '貝貝', 'age': 18}
print type(json.dumps(d)), '--', json.dumps(d)
res_d = json.loads('{"age": 18, "name": "\u8d1d\u8d1d"}')
print type(res_d), '--', res_d
# 結(jié)果輸出:
-- {"age": 18, "name": "\u8d1d\u8d1d"}
-- {u'age': 18, u'name': u'\u8d1d\u8d1d'}
如上過(guò)程,序列化和反序列化都沒(méi)有問(wèn)題,這是因?yàn)椋募拈_(kāi)頭指定了 ‘# -- coding:utf-8 --’,程序中的字符串(str類型)就是使用utf-8編碼后存放于內(nèi)存中~
?
現(xiàn)在修改一下文件開(kāi)頭的編碼:
# -*- coding:gbk -*-
d = {'name': '貝貝', 'age': 18}
print type(json.dumps(d)), '--', json.dumps(d)
res_d = json.loads('{"age": 18, "name": "\u8d1d\u8d1d"}')
print type(res_d), '--', res_d
這個(gè)時(shí)候就會(huì)報(bào)出如下錯(cuò)誤信息,很簡(jiǎn)單,utf-8 無(wú)法解碼 gbk編碼的字符串('貝貝')
UnicodeDecodeError: 'utf8' codec can't decode byte 0xb1 in position 0: invalid start byte
解決方法就是,在 dumps 過(guò)程中指定使用 gbk 進(jìn)行解碼,然后輸出就正常了~
# -*- coding:gbk -*-
d = {'name': '貝貝', 'age': 18}
json_str = json.dumps(d, encoding='gbk')
print type(json_str), '--', json_str
res_d = json.loads('{"age": 18, "name": "\u8d1d\u8d1d"}')
print type(res_d), '--', res_d
# 輸出結(jié)果:
-- {"age": 18, "name": "\u8d1d\u8d1d"}
-- {u'age': 18, u'name': u'\u8d1d\u8d1d'}
注意:這里 loads 過(guò)程不需要指定編碼格式,因?yàn)榉葱蛄谢蟠娣诺絻?nèi)存中的依舊是unicode格式的字符串~
?
還有一種更簡(jiǎn)單的解決方式,即在中文字符前加 u
d = {'name': u'貝貝', 'age': 18}
json_str = json.dumps(d)
pickle 模塊也用于序列化和反序列化Python對(duì)象(變量),其用法和 json 模塊的使用基本一致。pickle 模塊 和 json 模塊 區(qū)別在于:pickle 模塊 僅用于Python的數(shù)據(jù)類型,序列化后的對(duì)象不能再不同的編程語(yǔ)言之間傳遞,但是 pickle 模塊 可序列化幾乎所有的Python數(shù)據(jù)類型,包括時(shí)間對(duì)象,函數(shù),類…
?
import pickle
d = {'name': '貝貝', 'age': 18}
d_dump = pickle.dumps(d)
print(d_dump)
d_load = pickle.loads(d_dump)
print(type(d_load), '--', d_load)
# 結(jié)果輸出:
b'\x80\x03}q\x00(X\x04\x00\x00\x00nameq\x01X\x06\x00\x00\x00\xe8\xb4\x9d\xe8\xb4\x9dq\x02X\x03\x00\x00\x00ageq\x03K\x12u.' # 注意 輸出的是 byte 類型(即python2中的str類型)
-- {'name': '貝貝', 'age': 18}
####################################
lst = [1, 2, 3]
with open('/tmp/test_pickle', mode='wb') as f: # 打開(kāi)文件的模式為二進(jìn)制寫(xiě)
pickle.dump(lst, f)
with open('/tmp/test_pickle', mode='rb') as f: # 打開(kāi)文件的模式為二進(jìn)制讀
lst_load = pickle.load(f)
print(type(lst_load), '--', lst_load)
# 結(jié)果輸出:
-- [1, 2, 3]
# 存放序列化對(duì)象的文件:
? ~ cat /tmp/test_pickle
q(KKKe.%
可以看到 pickle序列化后的數(shù)據(jù),可讀性差,不像json那樣一目了然~
import pickle
class Person:
def __init__(self, name, age):
self.name = name
self.age = age
def say_hello(self):
print('hello %s' % (self.name))
p = Person('貝貝', 18)
# p.say_hello()
# del Person
with open('/tmp/test_pickle', mode='wb') as f:
pickle.dump(p, f)
with open('/tmp/test_pickle', mode='rb') as f:
p_load = pickle.load(f)
p_load.say_hello()
# 輸出結(jié)果:
hello 貝貝
注意:中途不能del Person,不然會(huì)出現(xiàn)如下錯(cuò)誤
_pickle.PicklingError: Can't pickle : attribute lookup Person on __main__ failed
shelve 模塊也用于序列化,shelve 模塊是在 pickle 模塊上做了一層封裝,也僅支持兩個(gè)Python程序之間進(jìn)行交換~,優(yōu)點(diǎn)是 shelve 模塊 可以序列化 Python 的所有數(shù)據(jù)類型~
?
shelve 模塊比 pickle 模塊更加簡(jiǎn)單,只有一個(gè) open函數(shù),返回類似字典的對(duì)象,可讀可寫(xiě),當(dāng)為某個(gè) key 賦值時(shí),這個(gè)值會(huì)被序列化,并進(jìn)行存儲(chǔ);通過(guò)某個(gè) key 讀出對(duì)應(yīng)的值時(shí),即是一個(gè)反序列化過(guò)程,其中 key 必須為字符串,而值可以是python所支持的數(shù)據(jù)類型。
?
shelve 模塊存取過(guò)程:
import shelve
class Person:
def __init__(self, name, age):
self.name = name
self.age = age
def say_hello(self):
print('hello %s' % (self.name))
p = Person('貝貝', 18)
d = {'name': 'abc', 'age': 20}
f = shelve.open(r'/tmp/test_shelve')
f['d_info'] = d
f['p_info'] = p
print(f.get('d_info'))
f.get('p_info').say_hello()
f.close()
如上過(guò)程,class對(duì)象和基本數(shù)據(jù)類型會(huì)被序列化并存放在文件 '/tmp/test_shelve' 中,f.get() 取出過(guò)程即是一個(gè)反序列化過(guò)程~
?
若是一個(gè)可變對(duì)象,使用 shelve 模塊序列化之后存放到文件中,然后取出(get)對(duì)可變對(duì)象進(jìn)行更改,這個(gè)時(shí)候,已經(jīng)改變的可變對(duì)象只是保存在內(nèi)存中,不會(huì)被寫(xiě)入到文件中,看如下示例:
import shelve
f = shelve.open(r'/tmp/test_shelve')
f['lst_info'] = [1,2,3]
f.get('lst_info').append(4)
print(f.get('lst_info'))
# 輸出結(jié)果:
[1, 2, 3]
若要進(jìn)行更改需要重新寫(xiě)入,即重新序列化:
import shelve
f = shelve.open(r'/tmp/test_shelve')
f['lst_info'] = [1, 2, 3]
lst = f.get('lst_info')
lst.append(4)
f['lst_info'] = lst
print(f.get('lst_info'))
# 輸出結(jié)果:
[1, 2, 3, 4]
或者在使用 shelve 打開(kāi)文件時(shí),設(shè)置 writeback 為True:
f = shelve.open(r'/tmp/test_shelve', writeback=True)
f['lst_info'] = [1, 2, 3]
f.get('lst_info').append(4)
print(f.get('lst_info'))
# 輸出結(jié)果:
[1, 2, 3, 4]
.................^_^
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無(wú)理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國(guó)服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡(jiǎn)單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢(shì),專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場(chǎng)景需求。