這篇文章主要介紹如何使用PHP的FFI調用cjieba,文中介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們一定要看完!
創(chuàng)新互聯(lián)公司秉承實現(xiàn)全網(wǎng)價值營銷的理念,以專業(yè)定制企業(yè)官網(wǎng),網(wǎng)站設計、成都網(wǎng)站設計,小程序制作,網(wǎng)頁設計制作,成都做手機網(wǎng)站,營銷型網(wǎng)站幫助傳統(tǒng)企業(yè)實現(xiàn)“互聯(lián)網(wǎng)+”轉型升級專業(yè)定制企業(yè)官網(wǎng),公司注重人才、技術和管理,匯聚了一批優(yōu)秀的互聯(lián)網(wǎng)技術人才,對客戶都以感恩的心態(tài)奉獻自己的專業(yè)和所長。
phpjieba_ffi
使用PHP 7.4的 FFI 測試直接調用cjieba分詞的動態(tài)庫
選用CJieba的原因是FFI使用的是C的調用約定,如果用Cpp,還得自己包裝一下,然后extern C,讓編譯器生成標準C的動態(tài)庫。
碰到的問題
段錯誤
C變量沒有初始化
直接調用了C的函數(shù),沒有通過FFI 初始化后的的C對象調用
非空判斷 需要使用 FFI::isNull($x)
指針形式的數(shù)組 不能用foreach
指針形式數(shù)組的循環(huán)
查看C代碼發(fā)現(xiàn)Cut部分如下:
CJiebaWord* Cut(Jieba handle, const char* sentence, size_t len) { cppjieba::Jieba* x = (cppjieba::Jieba*)handle; vectorwords; string s(sentence, len); x->Cut(s, words); CJiebaWord* res = (CJiebaWord*)malloc(sizeof(CJiebaWord) * (words.size() + 1)); size_t offset = 0; for (size_t i = 0; i < words.size(); i++) { res[i].word = sentence + offset; res[i].len = words[i].size(); offset += res[i].len; } if (offset != len) { free(res); return NULL; } res[words.size()].word = NULL; res[words.size()].len = 0; return res; }
返回的是一個結構體指針,在C語言里,數(shù)組名實際是數(shù)組第一個變量的指針地址,所以可以通過指針地址++的操作來遍歷,在FFI里面呢?
對于這個數(shù)組,我一開始用foreach 循環(huán),直接報段錯誤了,后來和C一樣,直接用指針++,發(fā)現(xiàn)是可行的,這里給FFI點贊,居然也可以直接操作C指針。
分詞結果獲取
如上面的代碼,對于單個分詞CJiebaWord,也不是保存的分詞,而是sentence + offset,就是說第一個分詞結果肯定是原始字符串。
在C的demo里是printf格式化(. 表示字段寬度和對齊),但是PHP里沒有類似的方法,需要截取字符串substr($x->word, 0, $x->len)
for (x = words; x->word; x++) { printf("%*.*s\n", x->len, x->len, x->word); }
用法示例
編譯動態(tài)庫
make libjieba.so
運行
time php demo.php
運行c demo
make demo time ./demo
結果
PHP load: 0.00025701522827148 real 1m59.619s user 1m56.093s sys 0m3.517s C real 1m54.738s user 1m50.382s sys 0m4.323s CPU 占用 基本都是 12%
可以發(fā)現(xiàn)使用FFI,PHP的速度基本和C差不多,如有CPU占用大的業(yè)務,可以嘗試使用其它語言(C/C++,golang,Rust等)編寫然后導出標準C的動態(tài)庫。
FFI的用途
在沒有FFI之前,需要系統(tǒng)調用或者sdk方式調用的地方,PHP就需要開發(fā)擴展,但是開發(fā)擴展不僅需要理解C語言,還得了解PHP內核,比較困難。 現(xiàn)在就方便多了,直接使用FFI調用動態(tài)庫即可。
擴展 宏展開
比如??档膕dk里有大量的宏 gcc -E -P HCNetSDK.h -o HCNetSDK_unfold.h 支持 type define 放心使用
以上是如何使用PHP的FFI調用cjieba的所有內容,感謝各位的閱讀!希望分享的內容對大家有幫助,更多相關知識,歡迎關注創(chuàng)新互聯(lián)行業(yè)資訊頻道!