本篇文章給大家分享的是有關(guān)Pandas中怎么實(shí)現(xiàn)SQL查詢數(shù)據(jù)操作,小編覺得挺實(shí)用的,因此分享給大家學(xué)習(xí),希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。
臨淄網(wǎng)站制作公司哪家好,找創(chuàng)新互聯(lián)建站!從網(wǎng)頁設(shè)計(jì)、網(wǎng)站建設(shè)、微信開發(fā)、APP開發(fā)、響應(yīng)式網(wǎng)站開發(fā)等網(wǎng)站項(xiàng)目制作,到程序開發(fā),運(yùn)營維護(hù)。創(chuàng)新互聯(lián)建站公司2013年成立到現(xiàn)在10年的時(shí)間,我們擁有了豐富的建站經(jīng)驗(yàn)和運(yùn)維經(jīng)驗(yàn),來保證我們的工作的順利進(jìn)行。專注于網(wǎng)站建設(shè)就選創(chuàng)新互聯(lián)建站。
SELECT * FROM
如果要選擇整個(gè)表,只需調(diào)用表的名稱:
# SQL SELECT * FROM table_df # Pandas table_df
SELECT a, b FROM
如果要從表中選擇特定列,請?jiān)陔p括號(hào)中列出要的列:
# SQL SELECT column_a, column_b FROM table_df # Pandas table_df[['column_a', 'column_b']]
SELECT DISTINCT
只需使用 .drop\u duplicates()即可獲得不同的值:
# SQL SELECT DISTINCT column_a FROM table_df # Pandas table_df['column_a'].drop_duplicates()
SELECT a as b
如果要重命名列,請使用 .rename():
# SQL SELECT column_a as Apple, column_b as Banana FROM table_df # Pandas table_df[['column_a', 'column_b']].rename(columns={'column_a': 'Apple', 'column_b':'Banana'})
SELECT CASE WHEN
對(duì)于"SELECT CASE WHEN"的等效項(xiàng),可以使用 np.select(), 其中首先指定每個(gè)選項(xiàng)的選擇和值。
# SQL SELECT CASE WHEN column_a > 30 THEN "Large" WHEN column_a <= 30 THEN "Small" END AS Size FROM table_df # Pandas conditions = [table_df['column_a']>30, table_df['column_b']<=30] choices = ['Large', 'Small'] table_df['Size'] = np.select(conditions, choices)
INNER/LEFT/RIGHT JOIN
只需使用 .merge()來連接表,就可以使用“how”參數(shù)指定它是 LEFT、RIGHT、 INNER 或者 OUTER聯(lián)接。
# SQL SELECT * FROM table_1 t1 LEFT JOIN table_2 t1 on t1.lkey = t2.rkey # Pandas table_1.merge(table_2, left_on='lkey', right_on='rkey', how='left')
UNION ALL
只需使用 pd.concat():
# SQL SELECT * FROM table_1 UNION ALL SELECT * FROM table_2 # Pandas final_table = pd.concat([table_1, table_2])
SELECT WHERE
在篩選數(shù)據(jù)幀時(shí),與在 SQL 中使用 WHERE 子句的方式相同時(shí),只需在方括號(hào)中定義條件:
# SQL SELECT * FROM table_df WHERE column_a = 1 # Pandas table_df[table_df['column_a'] == 1]
SELECT column_a WHERE column_b
如果要從表中選擇某個(gè)列并篩選其他列,請按照以下格式操作:
# SQL SELECT column_a FROM table_df WHERE column_b = 1 # Pandas table_df[table_df['column_b']==1]['column_a']
SELECT WHERE AND
如果要按多個(gè)條件進(jìn)行篩選,只需將每個(gè)條件換在括號(hào)中,并使用"&"分隔每個(gè)條件。
# SQL SELECT * FROM table_df WHERE column_a = 1 AND column_b = 2 # Pandas table_df[(table_df['column_a']==1) & (table_df['column_b']==2)]
SELECT WHERE LIKE
SQL 中的 LIKE 等效項(xiàng)是 .str.contains()。如果要應(yīng)用大小寫不敏感,只需在參數(shù)中添加 case=False。
# SQL SELECT * FROM table_df WHERE column_a LIKE '%ball%' # Pandas table_df[table_df['column_a'].str.contains('ball')]
SELECT WHERE column IN()
SQL 中 IN() 的等效項(xiàng)為 .isin()。
# SQL SELECT * FROM table_df WHERE column_a IN('Canada', 'USA') # Pandas table_df[table_df['column_a'].isin(['Canada', 'USA'])]
ORDER BY one column
在SQL中,ORDER BY 的等同于 .sort_values()。使用 'ascending' 參數(shù)指定是按升序還是降序?qū)χ蹬判颍J(rèn)值與 SQL 一樣升序。
# SQL SELECT * FROM table_df ORDER BY column_a DESC # Pandas table_df.sort_values('column_a', ascending=False)
ORDER BY multiple columns
如果要按多個(gè)列排序,可以列出括號(hào)中的列,并在括號(hào)中的 “ascending” 參數(shù)中指定排序方向。請確保遵循列出的列的相應(yīng)順序。
# SQL SELECT * FROM table_df ORDER BY column_a DESC, column_b ASC # Pandas table_df.sort_values(['column_a', 'column_b'], ascending=[False, True])
COUNT DISTINCT
聚合函數(shù)有一個(gè)通用模式。
要復(fù)制 COUNT DISTINCT,只需使用 .groupby()和.nunique()。
# SQL SELECT column_a, COUNT DISTINCT(ID) FROM table_df GROUP BY column_a # Pandas table_df.groupby('column_a')['ID'].nunique()
SUM
# SQL SELECT column_a, SUM(revenue) FROM table_df GROUP BY column_a # Pandas table_df.groupby(['column_a', 'revenue']).sum()
AVG
# SQL SELECT column_a, AVG(revenue) FROM table_df GROUP BY column_a # Pandas table_df.groupby('column_a')['revenue'].mean()
以上就是Pandas中怎么實(shí)現(xiàn)SQL查詢數(shù)據(jù)操作,小編相信有部分知識(shí)點(diǎn)可能是我們?nèi)粘9ぷ鲿?huì)見到或用到的。希望你能通過這篇文章學(xué)到更多知識(shí)。更多詳情敬請關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。