null/None/NaN
創(chuàng)新互聯(lián)主營仙居網(wǎng)站建設(shè)的網(wǎng)絡(luò)公司,主營網(wǎng)站建設(shè)方案,app軟件開發(fā)公司,仙居h5微信小程序搭建,仙居網(wǎng)站營銷推廣歡迎仙居等地區(qū)企業(yè)咨詢
null經(jīng)常出現(xiàn)在數(shù)據(jù)庫中
None是Python中的缺失值,類型是NoneType
NaN也是python中的缺失值,意思是不是一個(gè)數(shù)字,類型是float
在pandas和Numpy中會將None替換為NaN,而導(dǎo)入數(shù)據(jù)庫中的時(shí)候則需要把NaN替換成None
找出空值
isnull()
notnull()
添加空值
numeric容器會把None轉(zhuǎn)換為NaN
In [20]: s = pd.Series([1, 2, 3])
In [21]: s.loc[0] = None
In [22]: s
Out[22]:
0 NaN
1 2.0
2 3.0
dtype: float641234567891012345678910
object容器會儲存None
In [23]: s = pd.Series(["a", "b", "c"])
In [24]: s.loc[0] = None
In [25]: s.loc[1] = np.nan
In [26]: s
Out[26]:
0 None
1 NaN
2 c
dtype: object123456789101112123456789101112
空值計(jì)算
arithmetic operations(數(shù)學(xué)計(jì)算)
NaN運(yùn)算的結(jié)果是NaN
statistics and computational methods(統(tǒng)計(jì)計(jì)算)
NaN會被當(dāng)成空置
GroupBy
在分組中會忽略空值
清洗空值
填充空值
fillna
DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs)
參數(shù)
value : scalar, dict, Series, or DataFrame
method : {‘backfill’, ‘bfill’, ‘pad’, ‘ffill’, None}, default None(bfill使用后面的值填充,ffill相反)
axis : {0 or ‘index’, 1 or ‘columns’}
inplace : boolean, default False
limit : int, default None
downcast : dict, default is None
返回值
filled : DataFrame
Interpolation
replace
刪除空值行或列
DataFrame.dropna(axis=0, how=’any’, thresh=None, subset=None, inplace=False)
參數(shù)
axis : {0 or ‘index’, 1 or ‘columns’}, or tuple/list thereof
how : {‘a(chǎn)ny’, ‘a(chǎn)ll’}
thresh : int, default None
subset : array-like
inplace : boolean, default False
返回
dropped : DataFrame
1.在定義有默認(rèn)參數(shù)的函數(shù)時(shí),需要注意以下: 必傳參數(shù)必須在前面,默認(rèn)參數(shù)在后;
備注:python為了簡化函數(shù)的調(diào)用,提供了默認(rèn)參數(shù)機(jī)制,這樣在調(diào)用函數(shù)時(shí),就可以省略最后一個(gè)參數(shù)不寫;設(shè)置何種參數(shù)為默認(rèn)參數(shù)?一般來說,將參數(shù)值變化小的設(shè)置為默認(rèn)參數(shù)。
2. 若參數(shù)為列表,且有默認(rèn)值
2.1若調(diào)用方法時(shí)傳該參數(shù),則沒有問題
2.2 若調(diào)用方法時(shí)不傳該參數(shù),則有問題 ,問題是:每次調(diào)用該方法時(shí),該參數(shù)不是創(chuàng)建方法時(shí)的默認(rèn)值,而是多次調(diào)用被修改后的列表。
Pos()功能在一個(gè)字符串中查找所包含的另一個(gè)字符串的起始位置。語法Pos ( string1, string2 {, start } )
參數(shù)string1:string類型,指定要從中查找子串string2的字符串string2:string類型,指定要在string1中查找的字符串start:long類型,可選項(xiàng),指定從string1的第幾個(gè)字符開始查找。缺省值為1返回值Long。函數(shù)執(zhí)行成功時(shí)返回在start位置后string2在string1中第一次出現(xiàn)的起始位置。如果在string1中按指定要求未找到string2、或start的值超過了string1的長度,那么Pos()函數(shù)返回0。如果任何參數(shù)的值為NULL,Pos()函數(shù)返回NULL。用法Pos()函數(shù)在字符串查找時(shí)區(qū)分大小寫,因此,"aa"不匹配"AA"。
拓展資料:
公式的運(yùn)用
一、數(shù)字處理
1、取絕對值函數(shù)
公式:=ABS(數(shù)字)
2、取整函數(shù)
公式:=INT(數(shù)字)
3、四舍五入函數(shù)
公式:=ROUND(數(shù)字,小數(shù)位數(shù))
二、判斷公式
1、如果計(jì)算的結(jié)果值錯誤那么顯示為空
公式:=IFERROR(數(shù)字/數(shù)字,)
說明:如果計(jì)算的結(jié)果錯誤則顯示為空,否則正常顯示。
2、IF語句的多條件判定及返回值
公式:IF(AND(單元格(邏輯運(yùn)算符)數(shù)值,指定單元格=返回值1),返回值2,)
說明:所有條件同時(shí)成立時(shí)用AND,任一個(gè)成立用OR函數(shù)。
三、常用的統(tǒng)計(jì)公式
1、統(tǒng)計(jì)在兩個(gè)表格中相同的內(nèi)容
公式:B2=COUNTIF(數(shù)據(jù)源:位置,指定的,目標(biāo)位置)
說明:如果返回值大于0說明在另一個(gè)表中存在,0則不存在。
如果,在此示例中所用到的公式為:B2=COUNTIF(Sheet15!A:A,A2)
2、統(tǒng)計(jì)不重復(fù)的總數(shù)據(jù)
公式:C2=SUMPRODUCT(1/COUNTIF(A2:A8,A2:A8))
說明:用COUNTIF函數(shù)統(tǒng)計(jì)出源數(shù)據(jù)中每人的出現(xiàn)次數(shù),并用1除的方式把變成分?jǐn)?shù),最后再相加。
四、數(shù)據(jù)求和公式
1、隔列求和的應(yīng)用
公式:H3=SUMIF($A$2:$G$2,H$2,A3:G3)或=SUMPRODUCT((MOD(COLUMN(B3:G3),2)=0)*B3:G3)
說明:如果在標(biāo)題行中沒有規(guī)則就可以用第2個(gè)公式
2、單條件應(yīng)用之求和
公式:F2=SUMIF(A:A,C:C)
說明:這是SUMIF函數(shù)的最基礎(chǔ)的用法
五、查找與引用公式
1、單條件查找
說明:VLOOKUP是excel中最常用的查找方式
六、字符串處理公式
1、多單元格字符串的合并
說明:Phonetic函數(shù)只能合并字符型數(shù)據(jù),不能合并數(shù)值。
2、截取結(jié)果3位之外的部分
說明:LEN計(jì)算總長度,LEFT從左邊截總長度-3個(gè)。