前言
Pandas是python的一個(gè)數(shù)據(jù)分析包,提供了大量的快速便捷處理數(shù)據(jù)的函數(shù)和方法。其中Pandas定義了Series 和 DataFrame兩種數(shù)據(jù)類型,這使數(shù)據(jù)操作變得更簡單。Series 是一種一維的數(shù)據(jù)結(jié)構(gòu),類似于將列表數(shù)據(jù)值與索引值相結(jié)合。DataFrame 是一種二維的數(shù)據(jù)結(jié)構(gòu),接近于電子表格或者mysql數(shù)據(jù)庫的形式。
在數(shù)據(jù)分析中不可避免的涉及到對(duì)數(shù)據(jù)的遍歷查詢和處理,比如我們需要將dataframe兩列數(shù)據(jù)兩兩相除,并將結(jié)果存儲(chǔ)于一個(gè)新的列表中。本文通過該例程介紹對(duì)pandas數(shù)據(jù)遍歷的幾種方法。
for..in循環(huán)迭代方式
for語句是Python內(nèi)置的迭代器工具,用于從可迭代容器對(duì)象(如列表、元組、字典、集合、文件等)中逐個(gè)讀取元素,直到容器中沒有更多元素為止,工具和對(duì)象之間只要遵循可迭代協(xié)議即可進(jìn)行迭代操作。
具體的迭代的過程:可迭代對(duì)象通過__iter__方法返回迭代器,迭代器具有__next__方法,for循環(huán)不斷地調(diào)用__next__方法,每次按序返回迭代器中的一個(gè)值,直到迭代到最后,沒有更多元素時(shí)拋出異常StopIteration(python自動(dòng)處理異常)。迭代的優(yōu)點(diǎn)是無需把所有元素一次加載到內(nèi)存中,可以在調(diào)用next方法時(shí)逐個(gè)返回元素,避免出現(xiàn)內(nèi)存空間不夠的情況。
>>> x = [1,2,3] >>> its = x.__iter__() #列表是可迭代對(duì)象,否則會(huì)提示不是迭代對(duì)象 >>> its>>> next(its) # its包含此方法,說明its是迭代器 1 >>> next(its) 2 >>>next(its) 3 >>> next(its) Traceback (most recent call last): File " ", line 1, in StopIteration
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢(shì),專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場(chǎng)景需求。