歡迎來到 protocol buffers 的開發(fā)者指南。protocol buffers 是一個語言中立,平臺中立針對通訊協(xié)議,數(shù)據(jù)存儲和其他領(lǐng)域中對結(jié)構(gòu)化數(shù)據(jù)進行序列化的擴展方法。
創(chuàng)新互聯(lián)公司堅持“要么做到,要么別承諾”的工作理念,服務(wù)領(lǐng)域包括:成都做網(wǎng)站、成都網(wǎng)站設(shè)計、企業(yè)官網(wǎng)、英文網(wǎng)站、手機端網(wǎng)站、網(wǎng)站推廣等服務(wù),滿足客戶于互聯(lián)網(wǎng)時代的南湖網(wǎng)站設(shè)計、移動媒體設(shè)計的需求,幫助企業(yè)找到有效的互聯(lián)網(wǎng)解決方案。努力成為您成熟可靠的網(wǎng)絡(luò)建設(shè)合作伙伴!
本文檔主要針對的是 Java,C++ 或 Python 的開發(fā)人員希望在開發(fā)的應用程序中使用 Protocol Buffers。這個有關(guān)?Protocol Buffers 摘要性的介紹將會告訴你如何開始使用?Protocol Buffers。如果你希望更加深入的了解有關(guān)?Protocol Buffers 的內(nèi)容,你可以進入?tutorials?或者?protocol buffer encoding?頁面來詳細了解。
有關(guān) API 的參考文檔,請參考頁面:reference documentation?這里提供了所有這 3 種語言的參考,同時也針對?.proto?language?和?style?提供相關(guān)的指南。
Protocol buffers 是對結(jié)構(gòu)化數(shù)據(jù)序列化的一個靈活,高效,自動化工具 —— 你可以將?Protocol buffers 想象成 XML,但是體積更小,更快也更加簡單。
你可以自己定義你的結(jié)構(gòu)化數(shù)據(jù),然后你可以使用特定的代碼生成工具來非常容易對你的結(jié)構(gòu)化數(shù)據(jù)進行讀取和寫入。這些數(shù)據(jù)的讀取和寫入可以是一系列的數(shù)據(jù)流和使用不同的計算機程序語言。你甚至可以在不對已經(jīng)部署的程序進行破壞的情況下更新你的數(shù)據(jù)結(jié)構(gòu)。
你需要制定你希望如何將你的數(shù)據(jù)進行序列化。你是通過?proto?文件來定義你的消息結(jié)構(gòu)化數(shù)據(jù)的。
每一 protocol buffer message 是一個小的信息記錄邏輯,這個消息中包含有一系列的名字,變量對照序列。下面是一些基本的.proto?文件,這些文件中定義了一個消息,這個消息包含有一個 person 信息:
message Person { ?? required string name =? 1 ; ?? required int32 id =? 2 ; ?? optional string email =? 3 ; ? ?? enum ?PhoneType { ???? MOBILE =? 0 ; ???? HOME =? 1 ; ???? WORK =? 2 ; ?? } ? ?? message PhoneNumber { ???? required string number =? 1 ; ???? optional PhoneType type =? 2 ?[ default ?= HOME]; ?? } ? ?? repeated PhoneNumber phone =? 4 ; } |
通過上面你可以看到這個消息的格式非常簡單—— 每一個消息類型都有一個或者多個唯一進行編號的字段,每一個字段包含有一個名字和變量類型。
變量可以為數(shù)字(×××或者浮點型)(numbers),布爾類型(booleans),字符串(strings),原生二進制(raw bytes)甚至其他的 protocol buffer 消息類型,能夠允許你分級的結(jié)構(gòu)化你的數(shù)據(jù)。
你可以將字段指定為可選字段(optional fields),必須字段(required fields)和重復字段(repeated fields)。你可以從下面的?Protocol Buffer Language Guide?頁面中找到更多有關(guān) .proto?的定義。
一旦你成功定義了你的消息,你可以針對你使用的語言使用你定義的 .proto?來運行 protocol buffer 編譯器(protocol buffer compiler)來生成數(shù)據(jù)訪問類。
針對每一個字段,在數(shù)據(jù)訪問類中提供了簡單的訪問方法(例如?name()?和?set_name())和序列化到原生 2 進制數(shù)據(jù)和從原生 2 進制數(shù)據(jù)反序列化的方法。
針對上面的定義,如果你現(xiàn)在使用的是? C++ 語言的話,當你把消息定義進行編譯后,你將會得到一個稱為?Person
?的類。 你可以使用這個類在你的應用程序中進行填充數(shù)據(jù),對數(shù)據(jù)進行序列化和從序列化的數(shù)據(jù)中(protocol buffer 消息)重新獲得 Person 數(shù)據(jù)。
然后你可以寫一些類似 Person person; 的代碼。
Person person; person.set_name( "John Doe" ); person.set_id( 1234 ); person.set_email( "jdoe@example.com" ); fstream output( "myfile" , ios::out | ios::binary); person.SerializeToOstream(&output); |
隨后,你可以對消息進行讀?。?/p>
fstream input( "myfile" , ios::in | ios::binary); Person person; person.ParseFromIstream(&input); cout < "Name: " ?<< person.name() << endl; cout < "E-mail: " ?<< person.email() << endl; |
你可以向你的消息中添加新的字段而不會損壞老的消息。這是因為在老的消息處理中,針對新的字段是完全忽略掉的。因此,如果你在你的通訊協(xié)議中使用?protocol buffers 為數(shù)據(jù)結(jié)構(gòu)的話,你可以對你的協(xié)議和消息進行擴展而不需要擔心老的代碼沒有辦法編譯通過,或者損壞老的代碼。
你可以訪問?API Reference section?頁面中的內(nèi)容來了解完整?protocol buffer 代碼的生成和使用。
你也可以在?Protocol Buffer Encoding?頁面中了解更多protocol buffer 消息是如何進行編碼的。
針對 XML 來說 Protocol Buffers 具有更多的優(yōu)勢來對序列化結(jié)構(gòu)數(shù)據(jù)。
更加簡單
小于 XML? 3 到 10 倍
快于 XML 20 到 100 倍
松耦合
使用程序工具來創(chuàng)建數(shù)據(jù)訪問類,使數(shù)訪問類更加簡單
假設(shè),你需要講 person 這個數(shù)據(jù)進行定義,在 XML 你需要使用:
??
??
@example .com
|
來進行定義。
在?Protocol Buffers 中針對上面的消息文本化(text format)后顯示為:
# Textual representation of a protocol buffer. # This is *not* the binary format used on the wire. person { ?? name:? "John Doe" ?? email:? "jdoe@example.com" } |
當上面的消息被編碼為?Protocol Buffer 二進制格式(binary format)上面的文字可能小于?28 bytes,并且可能需要 100-200 納秒(nanoseconds)來進行處理。
我們將上面轉(zhuǎn)換為可以人為讀取的目的主要是為進行調(diào)試和編輯。
如果你使用 XML 的話,上面的信息至少需要?69 bytes (你需要刪除所有的空格),同時你需要 5,000-10,000?納秒(nanoseconds)來進行處理。
同時,對?protocol buffer 進行操作也是非常容易的:
cout < "Name: " ?<< person.name() << endl; cout < "E-mail: " ?<< person.email() << endl; |
如果使用的是 XML 的話,你需要進行下面的操作:
cout < "Name: " ????? << person.getElementsByTagName( "name" )->item( 0 )->innerText() ????? << endl; cout < "E-mail: " ????? << person.getElementsByTagName( "email" )->item( 0 )->innerText() ????? << endl; |
但是,protocol buffers 并不是任何時候都會比 XML 好。例如,針對基于文本的標記語言(例如,XML),protocol buffers 就不是一個很好的選項,因為你不能使用?protocol buffer 更好的在文檔中進行交換。更主要的是 HTML 是人類可以閱讀和編輯的。protocol buffer 也不是不可以人為的讀取,但是針對原生的?protocol buffer 格式是沒有辦法人為進行讀取和編輯的。
XML 與? HTML 一樣,在某種程度上是一種自我描述數(shù)據(jù)。protocol buffer 只針對你在?.proto 文件中描述的內(nèi)容進行表達。
Download the package?– 這包中含有針對 Java, Python, 和 C++ protocol buffer 編譯器源代碼,和你需要進行 I/O 和測試的類。希望對你的編譯器進行編譯和構(gòu)建,請參考代碼中的 README 文件。
一旦你完成了所有的設(shè)置,請參考?tutorial?頁面中的內(nèi)容來選擇你需要的語言——這個能夠幫助你使用 protocol buffer 創(chuàng)建一個簡單的應用程序。
在我們最新的 version 3?發(fā)行版?中推出了新的語言版本 —— Protocol Buffers language version 3(另稱 proto3),在這個版本中針對我們已經(jīng)存在的語言版本(proto2)使用了一些新的特性。
Proto3 簡化了 protocol buffer 語言,使其更加容易使用并且能夠支持更多的語言:我們當前發(fā)行的 proto3 能夠讓你創(chuàng)建 Java, C++, Python, Java Lite, Ruby, JavaScript, Objective-C, and C#。
另外你也可以通過使用 Go protoc 插件來用 proto3 創(chuàng)建 Go 代碼,這個插件你可以到?golang/protobuf?Github 中下載到。更多的語言還在逐步進行支持中。
請注意,這 2 個版本的 API 并不是完全兼容的。為了照顧還在使用老版本的用戶,我們將會在新的 protocol buffers 發(fā)行中同時支持老的版本。
你可以在下面的發(fā)行日志(release notes)查看 2 個版本的主要不同。有關(guān)?proto3 的句法,請參考?Proto3 Language Guide?中的內(nèi)容,針對?proto3 的完整文檔還沒有編寫完成,將會隨后推出。
看起來 proto2 和 proto3 可能會產(chǎn)生一些混淆,這是因為原始的開源? protocol buffers 實際上是 Google 內(nèi)部語言的第二個版本,同時我們的開源版本也是從 v2.0.0 開始的。簡單來說就是 proto 最開始的版本是 Google 內(nèi)部使用的,在 proto 第二個版本的時候,Google 決定進行開源了,所以開源的 proto 是從 proto2 開始的。
Protocol buffers 最開始是在 Google 內(nèi)部進行開發(fā)的,用于處理在索引服務(wù)器上請求/響應(request/response)的協(xié)議。
在?Protocol buffers 之前,針對請求和響應,使用的是?marshalling/unmarshalling,這個能夠支持一系列的協(xié)議。但是結(jié)果看起來卻是非常的難看,例如:
if ?(version ==? 3 ) { ?? ... }? else ?if ?(version >? 4 ) { ?? if ?(version ==? 5 ) { ???? ... ?? } ?? ... } |
明確格式化的的協(xié)議也使新版本的協(xié)議更加難以推出,這是因為開發(fā)者必須能夠了解老協(xié)議在服務(wù)器之間是如何進行處理的,同時也需要了解新的協(xié)議。只有對新老協(xié)議都有所了解后才能逐步使用新的協(xié)議替換老的協(xié)議。
Protocol buffers 被用來設(shè)計解決上面的很多問題:
新的字段比較能夠容易的進行定義,中級服務(wù)器不需要對數(shù)據(jù)進行檢查,直接對數(shù)據(jù)進行處理,同時也可以直接傳輸數(shù)據(jù)而不需要了解數(shù)據(jù)是如何進行定義的。
格式使用自描述,能夠更加容易支持更多的語言(C++,Java 等)。
但是,用戶還是需要手動書寫他們自己的處理diam。
作為系統(tǒng)的進化來說,它獲得了許多其他的特性和用途:
自動生成序列化和反序列化代碼而避免手動書寫這些代碼。
除了開始使用短期RPC(遠程過程調(diào)用)請求,人們開始使用 protocol buffers 作為高效的自描述結(jié)構(gòu)化數(shù)據(jù)格式(主要針對數(shù)據(jù)短期存在,例如在 Bigtable)。
服務(wù)器RPC接口開始被聲明為協(xié)議文件的一部分,協(xié)議編譯器生成根類,用戶可以通過服務(wù)器接口的實現(xiàn)和重載它們。
Protocol buffers 在 Google 中成為針對數(shù)據(jù)的通用語言—— 隨著時間的流逝,在 Google 內(nèi)部已經(jīng)有超過 348,952?.proto 文件被定義。這些被用在 RPC 系統(tǒng)和存儲系統(tǒng)中存儲數(shù)據(jù)。
https://www.cwiki.us/display/ProtocolBuffers/Developer+Guide