在Python中pandas庫用于數(shù)據(jù)處理,我們從1787頁的pandas官網(wǎng)文檔中總結(jié)出最常用的36個(gè)函數(shù),通過這些函數(shù)介紹如何通過Python完成數(shù)據(jù)生成和導(dǎo)入,數(shù)據(jù)清洗,預(yù)處理,以及最常見的數(shù)據(jù)分類,數(shù)據(jù)篩選,分類匯總,透視等最常見的操作。
創(chuàng)新互聯(lián)公司專注于安塞網(wǎng)站建設(shè)服務(wù)及定制,我們擁有豐富的企業(yè)做網(wǎng)站經(jīng)驗(yàn)。 熱誠(chéng)為您提供安塞營(yíng)銷型網(wǎng)站建設(shè),安塞網(wǎng)站制作、安塞網(wǎng)頁設(shè)計(jì)、安塞網(wǎng)站官網(wǎng)定制、微信小程序服務(wù),打造安塞網(wǎng)絡(luò)公司原創(chuàng)品牌,更為您提供安塞網(wǎng)站排名全網(wǎng)營(yíng)銷落地服務(wù)。
在C語言中,字符串處理是每天都要面對(duì)的問題。我們都知道C語言中其實(shí)并沒有一種原生的字符串類型,‘字符串’在C語言里只是一種特殊的以''結(jié)尾的字符數(shù)組。因此,如何將C語言與更高層次的Python語言在‘字符串’處理這個(gè)問題上對(duì)接是一個(gè)有難度的問題。所幸有swig這種強(qiáng)大的工具。
如何封裝一個(gè)函數(shù),它修改參數(shù)字符串的內(nèi)容
假如有這樣一個(gè)C語言的函數(shù),
!-- lang: cpp --
void FillZero(char* pc,size_t * piLen)
{
size_t i=0;
while(i++*piLen/2 )
*pc++ = '0';
*pc = 0;
*piLen = i+1;
}
這個(gè)函數(shù)的功能是把字符串變成n個(gè)0。不過我們更關(guān)注函數(shù)的形式。這樣的函數(shù),表面上看char* pc是函數(shù)的參數(shù),可是實(shí)際上它才是函數(shù)的返回值和執(zhí)行的結(jié)果。piLen這個(gè)參數(shù)既是pc的最大長(zhǎng)度,也是新的字符串的長(zhǎng)度。我們直接用python封裝,看看運(yùn)行結(jié)果。
Type "help", "copyright", "credits" or "license" for more information.
import cchar
s='123456'
cchar.FillZero(s,6)
Traceback (most recent call last):
File "stdin", line 1, in module
TypeError: in method 'FillZero', argument 2 of type 'size_t *'
結(jié)果差強(qiáng)人意,不是我們想要得到的結(jié)果。函數(shù)的第二個(gè)參數(shù)為size_t* 我們很難用python來表示,而且python中也不存在既是輸入,也是輸出的參數(shù)。
swig有一個(gè)標(biāo)準(zhǔn)庫,其中有一個(gè)cstring.i文件就是用來解決C語言字符串類型的問題。
我們?cè)?i文件中加入這樣幾行
!-- lang: cpp --
%include "cstring.i"
%cstring_output_withsize(char* pc,size_t* pi)
void FillZero(char* pc, size_t* pi);
然后運(yùn)行看結(jié)果
Type "help", "copyright", "credits" or "license" for more information.
import cchar
cchar.FillZero(10)
'00000\x00'
s=cchar.FillZero(10)
print s
00000
我們看函數(shù)的變化。首先在python里, FillZero變成了只有一個(gè)參數(shù)的函數(shù)。然后函數(shù)的返回值變成了一個(gè)字符串。其實(shí)cstring_output_size其實(shí)是一個(gè)宏,通過這個(gè)宏的定義改變了函數(shù)的形式,直接在Python中得到我們想要的結(jié)果。
其實(shí)類似cstring_output_size的宏還有好幾個(gè),我列舉一下:
cstring_output_allocate(char *s,free($1));
第一個(gè)參數(shù)是指向字符串地址的指針,第二個(gè)參數(shù)為釋放空間的方法。
大家考慮這一下這樣的函數(shù):
void foo(char* s)
{
s = (char*)malloc(10);
memcpy(s,"123456789",9);
}
s這個(gè)參數(shù)表面上看是輸入,實(shí)際上是函數(shù)真正的輸出。 函數(shù)中真正改變的東西是chars指向的字符串的值。而且char這個(gè)類型,
python或者其他腳本語言里應(yīng)該都沒有對(duì)應(yīng)的類型。那么我們用cstring_output_allocate將這個(gè)函數(shù)轉(zhuǎn)換成另外一個(gè)形式的python或者其他腳本語言的函數(shù)。轉(zhuǎn)換后的函數(shù)其實(shí)是這樣的,以python為例str
foo()。
!-- lang: cpp --
%module a
%include "cstring.i"
%{
void foo(char* s);
%}
%cstring_output_allocate(char *s, free(*$1));
void foo(char *s);
在python中的調(diào)用:
!-- lang: python --
import a
a.foo()
'123456789'
cstring_output_maxsize(char *path, int maxpath);
第一個(gè)參數(shù)也是可以改變的字符串首地址,第二個(gè)參數(shù)為字符串的最大長(zhǎng)度。在Python中調(diào)用的時(shí)候,只有maxpath這個(gè)參數(shù),返回字符串。
cstring_output_allocate(char *s, free($1));
第一個(gè)參數(shù)為指向字符串首地址的指針,第二個(gè)參數(shù)為釋放指針的方法。這個(gè)宏主要是封裝一種直接在函數(shù)內(nèi)部malloc空間的函數(shù)。在Python中調(diào)用時(shí)沒有參數(shù),直接返回字符串。
cstring_output_allocate_size(char *s, int slen, free(*$1));
這個(gè)相當(dāng)于前面兩個(gè)函數(shù)的組合。在函數(shù)內(nèi)部malloc空間,然后將字符串長(zhǎng)度通過slen返回。其實(shí)在調(diào)用的時(shí)候非常簡(jiǎn)單,沒有參數(shù),直接返回字符串。
如何處理c++的std::string
std::string是C++標(biāo)準(zhǔn)類庫STL中常見的類。在平時(shí)工作中大家肯定是沒少用。在python中如何封裝std::string? swig提供了標(biāo)準(zhǔn)庫
例如函數(shù):
!-- lang: cpp --
string Repeat(const string s)
{
return s+s;
}
只要在swig中加入這樣幾行:
!-- lang: cpp --
%include "std_string.i"
using namespace std;
string Repeat(const string s);
運(yùn)行結(jié)果:
Python 2.6.6 (r266:84292, Dec 27 2010, 00:02:40)
[GCC 4.4.5] on linux2
Type "help", "copyright", "credits" or "license" for more information.
import cchar
cchar.Repeat('123')
'123123'
使用起來很方便,但需要注意的是,假如函數(shù)的參數(shù)的內(nèi)容是可以被修改,就不能用這種方式封裝。
例如:
!-- lang: cpp --
void repeat(string s)
{
s+=s;
}
這樣的函數(shù)直接使用 'std_string.i' 就是無效的。遇到這種函數(shù),只能用C語言封裝成 void repeat(chars, int maxsize), 再用swig調(diào)用 'cstring_output_withsize' 這個(gè)宏再封裝一次了。
在離散數(shù)學(xué)里的定義就是具有單值性的關(guān)系。
我用過c和python,他們的函數(shù)都是符合離散數(shù)學(xué)定義的,也就是說只有一個(gè)返回值。
但是,c的函數(shù)可以返回指針,這就意味著你可以返回一個(gè)數(shù)組或者鏈表,相當(dāng)于返回了多個(gè)值。