前言
網(wǎng)站的建設(shè)成都創(chuàng)新互聯(lián)專注網(wǎng)站定制,經(jīng)驗豐富,不做模板,主營網(wǎng)站定制開發(fā).小程序定制開發(fā),H5頁面制作!給你煥然一新的設(shè)計體驗!已為成都咖啡廳設(shè)計等企業(yè)提供專業(yè)服務(wù)。
最近工作中遇到的一個場景,php項目中需要使用一個第三方的功能,而恰好有一個用Golang寫好的類庫。那么問題就來了,要如何實現(xiàn)不同語言之間的通信呢?下面就來一起看看吧。
常規(guī)的方案
1、 用Golang寫一個http/TCP服務(wù),php通過http/TCP與Golang通信
2、將Golang經(jīng)過較多封裝,做為php擴(kuò)展。
3、PHP通過系統(tǒng)命令,調(diào)取Golang的可執(zhí)行文件
存在的問題
1、http請求,網(wǎng)絡(luò)I/O將會消耗大量時間
2、需要封裝大量代碼
3、PHP每調(diào)取一次Golang程序,就需要一次初始化,時間消耗很多
優(yōu)化目標(biāo)
1、Golang程序只初始化一次(因為初始化很耗時)
2、所有請求不需要走網(wǎng)絡(luò)
3、盡量不大量修改代碼
解決方案
1、簡單的Golang封裝,將第三方類庫編譯生成為一個可執(zhí)行文件
2、PHP與Golang通過雙向管道通信
使用雙向管道通信優(yōu)勢
1:只需要對原有Golang類庫進(jìn)行很少的封裝
2:性能最佳 (IPC通信是進(jìn)程間通信的最佳途徑)
3:不需要走網(wǎng)絡(luò)請求,節(jié)約大量時間
4:程序只需初始化一次,并一直保持在內(nèi)存中
具體實現(xiàn)步驟
1:類庫中的原始調(diào)取demo
package main
import (
"fmt"
"github.com/yanyiwu/gojieba"
"strings"
)
func main() {
x := gojieba.NewJieba()
defer x.Free()
s := "小明碩士畢業(yè)于中國科學(xué)院計算所,后在日本京都大學(xué)深造"
words := x.CutForSearch(s, true)
fmt.Println(strings.Join(words, "/"))
}
保存文件為main.go,就可以運(yùn)行
2:調(diào)整后代碼為:
package main
import (
"bufio"
"fmt"
"github.com/yanyiwu/gojieba"
"io"
"os"
"strings"
)
func main() {
x := gojieba.NewJieba(
"/data/tmp/jiebaDict/jieba.dict.utf8",
"/data/tmp/jiebaDict/hmm_model.utf8",
"/data/tmp/jiebaDict/user.dict.utf8"
)
defer x.Free()
inputReader := bufio.NewReader(os.Stdin)
for {
s, err := inputReader.ReadString('\n')
if err != nil err == io.EOF {
break
}
s = strings.TrimSpace(s)
if s != "" {
words := x.CutForSearch(s, true)
fmt.Println(strings.Join(words, " "))
} else {
fmt.Println("get empty \n")
}
}
}
只需要簡單的幾行調(diào)整,即可實現(xiàn):從標(biāo)準(zhǔn)輸入接收字符串,經(jīng)過分詞再輸出
測試:
# go build test
# ./test
# //等待用戶輸入,輸入”這是一個測試“
# 這是 一個 測試 //程序
3:使用cat與Golang通信做簡單測試
//準(zhǔn)備一個title.txt,每行是一句文本
# cat title.txt | ./test
正常輸出,表示cat已經(jīng)可以和Golang正常交互了
4:PHP與Golang通信
以上所示的cat與Golang通信,使用的是單向管道。即:只能從cat向Golang傳入數(shù)據(jù),Golang輸出的數(shù)據(jù)并沒有傳回給cat,而是直接輸出到屏幕。但文中的需求是:php與Golang通信。即php要傳數(shù)據(jù)給Golang,同時Golang也必須把執(zhí)行結(jié)果返回給php。因此,需要引入雙向管道。
在PHP中管道的使用:popen("/path/test") ,具體就不展開說了,因為此方法解決不了文中的問題。
雙向管道:
$descriptorspec = array(
0 = array("pipe", "r"),
1 = array("pipe", "w")
);
$handle = proc_open(
'/webroot/go/src/test/test',
$descriptorspec,
$pipes
);
fwrite($pipes['0'], "這是一個測試文本\n");
echo fgets($pipes[1]);
解釋:使用proc_open打開一個進(jìn)程,調(diào)用Golang程序。同時返回一個雙向管道pipes數(shù)組,php向$pipe['0']中寫數(shù)據(jù),從$pipe['1']中讀數(shù)據(jù)。
好吧,也許你已經(jīng)發(fā)現(xiàn),我是標(biāo)題檔,這里重點要講的并不只是PHP與Golang如何通信。而是在介紹一種方法: 通過雙向管道讓任意語言通信。(所有語言都會實現(xiàn)管道相關(guān)內(nèi)容)
測試:
通過對比測試,計算出各個流程占用的時間。下面提到的title.txt文件,包含100萬行文本,每行文本是從b2b平臺取的商品標(biāo)題
1: 整體流程耗時
time cat title.txt | ./test /dev/null
耗時:14.819秒,消耗時間包含:
進(jìn)程cat讀出文本
通過管道將數(shù)據(jù)傳入Golang
Golang處理數(shù)據(jù),將結(jié)果返回到屏幕
2:計算分詞函數(shù)耗時。方案:去除分詞函數(shù)的調(diào)取,即:注釋掉Golang源代碼中的調(diào)取分詞那行的代碼
time cat title.txt | ./test /dev/null
耗時:1.817秒時間,消耗時間包含:
進(jìn)程cat讀出文本
通過管道將數(shù)據(jù)傳入Golang
Golang處理數(shù)據(jù),將結(jié)果返回到屏幕
分詞耗時 = (第一步耗時) - (以上命令所耗時)
分詞耗時 : 14.819 - 1.817 = 13.002秒
3:測試cat進(jìn)程與Golang進(jìn)程之間通信所占時間
time cat title.txt /dev/null
耗時:0.015秒,消耗時間包含:
進(jìn)程cat讀出文本
通過管道將數(shù)據(jù)傳入Golang
go處理數(shù)據(jù),將結(jié)果返回到屏幕
管道通信耗時:(第二步耗時) - (第三步耗時)
管道通信耗時: 1.817 - 0.015 = 1.802秒
4:PHP與Golang通信的時間消耗
編寫簡單的php文件:
?php
$descriptorspec = array(
0 = array("pipe", "r"),
1 = array("pipe", "w")
);
$handle = proc_open(
'/webroot/go/src/test/test',
$descriptorspec,
$pipes
);
$fp = fopen("title.txt", "rb");
while (!feof($fp)) {
fwrite($pipes['0'], trim(fgets($fp))."\n");
echo fgets($pipes[1]);
}
fclose($pipes['0']);
fclose($pipes['1']);
proc_close($handle);
流程與上面基本一致,讀出title.txt內(nèi)容,通過雙向管道傳入Golang進(jìn)程分詞后,再返回給php (比上面的測試多一步:數(shù)據(jù)再通過管道返回)
time php popen.php /dev/null
耗時:24.037秒,消耗時間包含:
進(jìn)程PHP讀出文本
通過管道將數(shù)據(jù)傳入Golang
Golang處理數(shù)據(jù)
Golang將返回結(jié)果再寫入管道,PHP通過管道接收數(shù)據(jù)
將結(jié)果返回到屏幕
結(jié)論:
1 :整個分詞過程中的耗時分布
使用cat控制邏輯耗時: 14.819 秒
使用PHP控制邏輯耗時: 24.037 秒(比cat多一次管道通信)
單向管道通信耗時: 1.8 秒
Golang中的分詞函數(shù)耗時: 13.002 秒
2:分詞函數(shù)的性能: 單進(jìn)程,100萬商品標(biāo)題分詞,耗時13秒
以上時間只包括分詞時間,不包括詞典載入時間。但在本方案中,詞典只載入一次,所以載入詞典時間可以忽略(1秒左右)
3:PHP比cat慢 (這結(jié)論有點多余了,呵呵)
語言層面慢: (24.037 - 1.8 - 14.819) / 14.819 = 50%
單進(jìn)程對比測試的話,應(yīng)該不會有哪個語言比cat更快。
相關(guān)問題:
1:以上Golang源碼中寫的是一個循環(huán),也就是會一直從管道中讀數(shù)據(jù)。那么存在一個問題:是不是php進(jìn)程結(jié)束后,Golang的進(jìn)程還會一直存在?
管道機(jī)制自身可解決此問題。管道提供兩個接口:讀、寫。當(dāng)寫進(jìn)程結(jié)束或者意外掛掉時,讀進(jìn)程也會報錯,以上Golang源代碼中的err邏輯就會執(zhí)行,Golang進(jìn)程結(jié)束。
但如果PHP進(jìn)程沒有結(jié)束,只是暫時沒有數(shù)據(jù)傳入,此時Golang進(jìn)程會一直等待。直到php結(jié)束后,Golang進(jìn)程才會自動結(jié)束。
2:能否多個php進(jìn)程并行讀寫同一個管道,Golang進(jìn)程同時為其服務(wù)?
不可以。管道是單向的,如果多個進(jìn)程同時向管道中寫,那Golang的返回值就會錯亂。
可以多開幾個Golang進(jìn)程實現(xiàn),每個php進(jìn)程對應(yīng)一個Golang進(jìn)程。
最后,上面都是瞎扯的。如果你了解管道、雙向管道,上面的解釋對你基本沒啥用。但如果你不了解管道,調(diào)試上面的代碼沒問題,但稍有修改就有可能掉坑里。
無緩沖的通道(unbuffered channel)是指在接收前沒有能力保存任何值的通道。
這種類型的通道要求發(fā)送goroutine和接收goroutine同時準(zhǔn)備好,才能完成發(fā)送和接收操作。否則,通道會導(dǎo)致先執(zhí)行發(fā)送或接收操作的 goroutine 阻塞等待。
這種對通道進(jìn)行發(fā)送和接收的交互行為本身就是同步的。其中任意一個操作都無法離開另一個操作單獨(dú)存在。
阻塞:由于某種原因數(shù)據(jù)沒有到達(dá),當(dāng)前協(xié)程(線程)持續(xù)處于等待狀態(tài),直到條件滿足,才接觸阻塞。
同步:在兩個或多個協(xié)程(線程)間,保持?jǐn)?shù)據(jù)內(nèi)容一致性的機(jī)制。
下圖展示兩個 goroutine 如何利用無緩沖的通道來共享一個值:
在第 1 步,兩個 goroutine 都到達(dá)通道,但哪個都沒有開始執(zhí)行發(fā)送或者接收。
在第 2 步,左側(cè)的 goroutine 將它的手伸進(jìn)了通道,這模擬了向通道發(fā)送數(shù)據(jù)的行為。這時,這個 goroutine 會在通道中被鎖住,直到交換完成。
在第 3 步,右側(cè)的 goroutine 將它的手放入通道,這模擬了從通道里接收數(shù)據(jù)。這個 goroutine 一樣也會在通道中被鎖住,直到交換完成。
在第 4 步和第 5 步,進(jìn)行交換,并最終,在第 6 步,兩個 goroutine 都將它們的手從通道里拿出來,這模擬了被鎖住的 goroutine 得到釋放。兩個 goroutine 現(xiàn)在都可以去做別的事情了。
如果沒有指定緩沖區(qū)容量,那么該通道就是同步的,因此會阻塞到發(fā)送者準(zhǔn)備好發(fā)送和接收者準(zhǔn)備好接收。
無緩沖channel: —— 同步通信
通過var聲明或者make函數(shù)創(chuàng)建的channel變量是一個存儲在函數(shù)棧幀上的指針,占用8個字節(jié),指向堆上的hchan結(jié)構(gòu)體
源碼包中src/runtime/chan.go定義了hchan的數(shù)據(jù)結(jié)構(gòu)如下:
hchan結(jié)構(gòu)體的主要組成部分有四個:
用來保存goroutine之間傳遞數(shù)據(jù)的循環(huán)數(shù)組:buf
用來記錄此循環(huán)數(shù)組當(dāng)前發(fā)送或接收數(shù)據(jù)的下標(biāo)值:sendx和recvx
用于保存向該chan發(fā)送和從該chan接收數(shù)據(jù)被阻塞的goroutine隊列: sendq 和 recvq
保證channel寫入和讀取數(shù)據(jù)時線程安全的鎖:lock
環(huán)形數(shù)組作為channel 的緩沖區(qū) 數(shù)組的長度就是定義channnel 時channel 的緩沖大小
在hchan 中包括了讀/寫 等待隊列, waitq是一個雙向隊列,包括了一個頭結(jié)點和尾節(jié)點。 每個節(jié)點是一個sudog結(jié)構(gòu)體變量
channel有2種類型:無緩沖、有緩沖, 在創(chuàng)建時 make(chan type cap) 通過cap 設(shè)定緩沖大小
channel有3種模式:寫操作模式(單向通道)、讀操作模式(單向通道)、讀寫操作模式(雙向通道)
channel有3種狀態(tài):未初始化、正常、關(guān)閉
如下幾種狀態(tài)會引發(fā)panic
channel 是線程安全的,channel的底層實現(xiàn)中,hchan結(jié)構(gòu)體中采用Mutex鎖來保證數(shù)據(jù)讀寫安全。在對循環(huán)數(shù)組buf中的數(shù)據(jù)進(jìn)行入隊和出隊操作時,必須先獲取互斥鎖,才能操作channel數(shù)據(jù)