真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

Python中怎么處理大數(shù)據(jù)

本篇文章為大家展示了Python中怎么處理大數(shù)據(jù),內(nèi)容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細介紹希望你能有所收獲。

成都創(chuàng)新互聯(lián)是一家集網(wǎng)站建設,豐寧企業(yè)網(wǎng)站建設,豐寧品牌網(wǎng)站建設,網(wǎng)站定制,豐寧網(wǎng)站建設報價,網(wǎng)絡營銷,網(wǎng)絡優(yōu)化,豐寧網(wǎng)站推廣為一體的創(chuàng)新建站企業(yè),幫助傳統(tǒng)企業(yè)提升企業(yè)形象加強企業(yè)競爭力??沙浞譂M足這一群體相比中小企業(yè)更為豐富、高端、多元的互聯(lián)網(wǎng)需求。同時我們時刻保持專業(yè)、時尚、前沿,時刻以成就客戶成長自我,堅持不斷學習、思考、沉淀、凈化自己,讓我們?yōu)楦嗟钠髽I(yè)打造出實用型網(wǎng)站。

import pandas as pd import collections df = pd.read_excel("D:/Download/chrome/sample-salesv3.xlsx") #print (df.head(10)) df["date"] = pd.to_datetime(df["date"]) # print (df.head(10)) df1 = df.set_index("date").resample("M")['ext price'].sum() # print(df1.head())
Python中怎么處理大數(shù)據(jù)

統(tǒng)計每個用戶每個月"ext price"這個屬性的sum值,利用Grouper

df2 = df.groupby(["name",pd.Grouper(key = "date",freq="M")])["ext price"] print(df2.head(10))
Python中怎么處理大數(shù)據(jù)

Agg

agg函數(shù),它提供基于列的聚合操作。而groupby可以看做是基于行,或者說index的聚合操作。

從實現(xiàn)上看,groupby返回的是一個DataFrameGroupBy結(jié)構(gòu),這個結(jié)構(gòu)必須調(diào)用聚合函數(shù)(如sum)之后,才會得到結(jié)構(gòu)為Series的數(shù)據(jù)結(jié)果。

而agg是DataFrame的直接方法,返回的也是一個DataFrame。當然,很多功能用sum、mean等等也可以實現(xiàn)。但是agg更加簡潔,  而且傳給它的函數(shù)可以是字符串,也可以自定義,參數(shù)是column對應的子DataFrame

獲取"ext price","quantity","unit price"3列的各自的累計值和均值

df3 = df[["ext price","quantity","unit price"]].agg(["sum","mean"]) print(df3.head())
Python中怎么處理大數(shù)據(jù)

可以針對不同的列使用不同的聚合函數(shù)

df4 = df.agg({"ext price":["sum","mean"],"quantity":["sum","mean"],"unit price":["mean"]}) print(df4.head())
Python中怎么處理大數(shù)據(jù)

也可以自定義函數(shù),比如,統(tǒng)計sku中,購買次數(shù)最多的產(chǎn)品編號,通過lambda表達式來做。

#統(tǒng)計sku中,購買次數(shù)最多的產(chǎn)品編號 get_max = lambda x:x.value_counts(dropna=False).index[0] get_max.__name__ = "most frequent" df5 = df.agg({"ext price":["sum","mean"],  "quantity":["sum","mean"],  "unit price":["mean"],  "sku":[get_max]  }) print(df5)
Python中怎么處理大數(shù)據(jù)

如果希望輸出的列按照某個順序排列,可以使用collections的OrderedDict

agg_dict = {  "ext price":["sum","mean"],  "quantity":["sum","mean"],  "unit price":["mean"],  "sku":[get_max] } #按照列名的長度排序。OrderedDict的順序是跟插入順序一致的 df6 = df.agg(collections.OrderedDict(sorted(agg_dict.items(),key=lambda x:len(x[0])))) print(df6)
Python中怎么處理大數(shù)據(jù)

上述內(nèi)容就是Python中怎么處理大數(shù)據(jù),你們學到知識或技能了嗎?如果還想學到更多技能或者豐富自己的知識儲備,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。


網(wǎng)站標題:Python中怎么處理大數(shù)據(jù)
瀏覽路徑:http://weahome.cn/article/pihddg.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部