真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

數(shù)據(jù)清洗常用的2個(gè)小trick分別是什么

今天就跟大家聊聊有關(guān)數(shù)據(jù)清洗常用的2個(gè)小trick分別是什么,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結(jié)了以下內(nèi)容,希望大家根據(jù)這篇文章可以有所收獲。

成都創(chuàng)新互聯(lián)公司-專業(yè)網(wǎng)站定制、快速模板網(wǎng)站建設(shè)、高性價(jià)比硚口網(wǎng)站開發(fā)、企業(yè)建站全套包干低至880元,成熟完善的模板庫(kù),直接使用。一站式硚口網(wǎng)站制作公司更省心,省錢,快速模板網(wǎng)站建設(shè)找我們,業(yè)務(wù)覆蓋硚口地區(qū)。費(fèi)用合理售后完善,10年實(shí)體公司更值得信賴。

Pandas 巧用 str.splitstr.cat

因?yàn)橐陨蟽蓚€(gè)方法,直接按列操作,所以省掉一層 for 循環(huán),下面直接看例子。

df = pd.DataFrame({'names':["Geordi La Forge", "Deanna Troi", "Jack"],'IDs':[1,2,3]})
df
 
數(shù)據(jù)清洗常用的2個(gè)小trick分別是什么  
 

列分割

對(duì) names 列,按照第一個(gè)空格分割為兩列:

df["first_name"] = df["names"].str.split(n = 1).str[0]
df["last_name"] = df["names"].str.split(n = 1).str[1]
df
 

結(jié)果如下:

數(shù)據(jù)清洗常用的2個(gè)小trick分別是什么  
 

列合并方法 1

分割列搞定,接下來再合并回去,使用 cat 方法:

df["names_copy"] = df["first_name"].str.cat(df["last_name"], sep = " ")
df
 
數(shù)據(jù)清洗常用的2個(gè)小trick分別是什么  

合并兩列得到一個(gè)新列 names_copy 搞定!

 

列合并方法 2

還有別的合并方法嗎,直接使用 + 連接字符串:

df["names_copy2"] = df["first_name"] + " "+ df["last_name"]
df
 

效果是一樣的:

數(shù)據(jù)清洗常用的2個(gè)小trick分別是什么  
 

Pandas 多條件篩選可讀性較好的寫法

有特征上百個(gè),根據(jù)多個(gè)特征篩選 DataFrame 時(shí),如果這么做,可讀性不太友好:

數(shù)據(jù)清洗常用的2個(gè)小trick分別是什么  
df[(df["continent"] == "Europe") & (df["beer_servings"] > 150) & (df["wine_servings"] > 50) & (df["spirit_servings"] < 60)]
 

連續(xù)多個(gè)篩選條件寫到一行里。

更好可讀性的寫法

cr1 = df["continent"] == "Europe"
cr2 = df["beer_servings"] > 150
cr3 = df["wine_servings"] > 50
cr4 = df["spirit_servings"] < 60

df[cr1 & cr2 & cr3 & cr4]
看完上述內(nèi)容,你們對(duì)數(shù)據(jù)清洗常用的2個(gè)小trick分別是什么有進(jìn)一步的了解嗎?如果還想了解更多知識(shí)或者相關(guān)內(nèi)容,請(qǐng)關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝大家的支持。

新聞標(biāo)題:數(shù)據(jù)清洗常用的2個(gè)小trick分別是什么
當(dāng)前網(wǎng)址:http://weahome.cn/article/gjhhcp.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部