兩個Dataframe,df1 和 df2
創(chuàng)新互聯(lián)建站主要從事網(wǎng)站建設(shè)、成都網(wǎng)站建設(shè)、網(wǎng)頁設(shè)計、企業(yè)做網(wǎng)站、公司建網(wǎng)站等業(yè)務。立足成都服務山南,十多年網(wǎng)站建設(shè)經(jīng)驗,價格優(yōu)惠、服務專業(yè),歡迎來電咨詢建站服務:18982081108
df1與df2的差集
將交集追加進df1,然后刪除所有重復項
df1與df2的并集
將交集追加進df1,然后保留第一次出現(xiàn)的行,刪除后面的重復行
keep = first 可以不寫,默認值為first,也可等于last,表示保留最后一次出現(xiàn)的重復行
如果原數(shù)據(jù)是唯一的,就把每一個元素,添加到一個字典中
最終獲得類似{"A1":5,"A3":2,"D1":5,"D3":10}的字典,也就是記錄每一個元素出現(xiàn)的次數(shù),如果是10個元組的交集,那么次數(shù)=10。
python中set()函數(shù)的用法如下:
工具/原料:臺式電腦、Win10、Python3.6.5。
1、首先按下“Win+R”組合鍵,打開運行窗口,如下圖所示。
2、在打開文本框輸入“cmd”,點擊確定,如下圖所示。
3、在打開的cmd窗口中,輸入:“python”,點擊Enter鍵,如下圖所示。
4、在Python環(huán)境中,輸入:“x = set(('hi', 'hello', 'world'))”,點擊Enter鍵,如下圖所示。
5、在Python環(huán)境中,輸入:“print(x)”,如下圖所示。
6、點擊Enter鍵,即可使用Python內(nèi)置的set()函數(shù)創(chuàng)建一個集合對象,并打印出來,如下圖所示。
我們在遇到一些問題的時候,使用集合的交集、并集和差集能夠更便捷的幫助我們?nèi)ソ鉀Q問題,看下面一個例子。
某學校有兩個班級,班級A需要學習數(shù)學、語文、英語、物理、化學和生物,班級B需要學習數(shù)學、語文、英語、政治、地理和歷史。
我們可以直接看出A班級和B班級的交集為數(shù)學、語文和英語,并集為數(shù)學、語文、英語、物理、化學、生物、政治、地理、歷史,A和B的差集為物理、化學和生物。
那么怎么使用Python去完成這些運算?
我們先在這里定義兩個集合,
因為是求交集,因此A和B的位置調(diào)換依然不影響結(jié)果。
使用集合求并集的方式同樣也是兩種方式,一種是使用 ‘|’ 運算符進行操作,一種是使用 union() 方法來實現(xiàn)。
求并集的時候同樣不需要注意 A 和 B 的位置關(guān)系。
使用集合求差集的方式同樣也是兩種方式,一種是使用 ‘-’ 運算符進行操作,一種是使用 difference() 方法來實現(xiàn)。
在方法2中注意 A 和 B 的位置不同的時候是有區(qū)別的,如果是 A 使用 difference() 方法,那么是輸出 A 中有而 B 中沒有的元素,如果是 B 使用 difference() 方法,那么是輸出 B 中有而 A 中沒有的元素。
學習完了集合,四種核心集合我們已經(jīng)基本掌握,接下來幾節(jié)我們來通過學習一些字符串的相關(guān)操作,學習字符串的過程中會穿插著前面簡單介紹過但沒仔細講解的方法及操作。