本篇內(nèi)容主要講解“Python分析包中的qcut怎么用”,感興趣的朋友不妨來看看。本文介紹的方法操作簡(jiǎn)單快捷,實(shí)用性強(qiáng)。下面就讓小編來帶大家學(xué)習(xí)“Python分析包中的qcut怎么用”吧!
成都創(chuàng)新互聯(lián)基于分布式IDC數(shù)據(jù)中心構(gòu)建的平臺(tái)為眾多戶提供資陽服務(wù)器托管 四川大帶寬租用 成都機(jī)柜租用 成都服務(wù)器租用。
它的作用是根據(jù)值的頻率來決定箱子的間隔,盡可能地滿足樣本在每個(gè)箱子的數(shù)量相等。
先看例子:
ages = np.array([5,10,36,12,77,89,100,30,1]) #年齡數(shù)據(jù)
pd.qcut(ages, 3, labels=['青','中','老']).value_counts()
#結(jié)果:
青 3
中 3
老 3
dtype: int64
可以看到,每個(gè)區(qū)間的樣本數(shù)量都為3. 不過,qcut得到的三個(gè)區(qū)間長(zhǎng)度就不一定相等了。這是和 cut 的最大區(qū)別,cut 切分的是等長(zhǎng)區(qū)間。
# 這是qcut后到得到的三個(gè)區(qū)間:
Categories(3, interval[float64]):
[(0.999, 11.333] < (11.333, 49.667] < (49.667, 100.0]]
很明顯,區(qū)間長(zhǎng)度是不等的。
到此,相信大家對(duì)“Python分析包中的qcut怎么用”有了更深的了解,不妨來實(shí)際操作一番吧!這里是創(chuàng)新互聯(lián)網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!