這期內(nèi)容當(dāng)中小編將會給大家?guī)碛嘘P(guān)如何避免Duplicate key在數(shù)據(jù)表插入中的應(yīng)用,文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。
創(chuàng)新互聯(lián)公司是一家成都做網(wǎng)站、成都網(wǎng)站建設(shè),提供網(wǎng)頁設(shè)計(jì),網(wǎng)站設(shè)計(jì),網(wǎng)站制作,建網(wǎng)站,定制設(shè)計(jì),網(wǎng)站開發(fā)公司,公司2013年成立是互聯(lián)行業(yè)建設(shè)者,服務(wù)者。以提升客戶品牌價值為核心業(yè)務(wù),全程參與項(xiàng)目的網(wǎng)站策劃設(shè)計(jì)制作,前端開發(fā),后臺程序制作以及后期項(xiàng)目運(yùn)營并提出專業(yè)建議和思路。
在一個數(shù)據(jù)表中插入數(shù)據(jù),防止有重復(fù)的數(shù)據(jù)插入,一般DBA大多的做法是
唯一索引,主鍵,在重復(fù)的數(shù)據(jù)插入的過程中,就通過數(shù)據(jù)庫的唯一約束或檢查,將這些重復(fù)的數(shù)據(jù)拒之門外。
而很多場合下,這樣的作法并不合適,因?yàn)槟阌龅降某绦騿T他可能不大會處理在數(shù)據(jù)拒絕插入的后續(xù)處理,這是比較尷尬的問題。如何能讓他用很簡單的SQL語句,來將這個問題解決,這需要 DBA 做點(diǎn)什么。
在SQL SERVER 中一般的情況是這樣使用的,(看下面的語句),通過在插入的過程中,進(jìn)行判斷,判斷插入tbl_A 來自于 tbl_B的數(shù)據(jù)不應(yīng)該和 tbl_A重復(fù),也就是在插入的前邊要來一次機(jī)遇標(biāo)識鍵的過濾
INSERT tbl_A (col, col2) SELECT col, col2 FROM tbl_B WHERE NOT EXISTS (SELECT col FROM tbl_A A2 WHERE A2.col = tbl_B.col);
這樣看著比較LOW 其實(shí)效率也一般。 所以微軟推薦的方法是下面的
Merge 功能,這個功能的在我工作的十幾年的經(jīng)歷中,是比較少的,因?yàn)榇蠖鄶?shù)的場景在現(xiàn)在的應(yīng)用開發(fā)中,CRUD 的操作已經(jīng)能覆蓋大部分?jǐn)?shù)據(jù)庫操作的功能,大部分的計(jì)算和判斷的功能大多是在應(yīng)用層來做的,通過程序來實(shí)踐,數(shù)據(jù)庫越來越多變得像一個容器被使用,數(shù)據(jù)庫只要做好MVCC,ISOLATE的事情就OK 了, 所以MERGE 的功能比較少的被引用到數(shù)據(jù)庫的使用中。
而何時要使用MERGE 功能,最近的一個項(xiàng)目的修改中,就遇到了,在原先的數(shù)據(jù)插入,使用了游標(biāo),這樣的結(jié)果可想而知,一定是糟糕的,數(shù)據(jù)庫使用游標(biāo)本來就是下下的選擇,如果一個程序員使用了游標(biāo),除非數(shù)據(jù)量很小,并且邏輯非常復(fù)雜,而且必須要用數(shù)據(jù)庫 PROCEDURE 來做,否則游標(biāo)應(yīng)該被踢出數(shù)據(jù)庫的語句層。
在修改后的存儲過程中,已經(jīng)沒有了游標(biāo),這是一個可喜的事情,但不好的事情又發(fā)生了,程序的邏輯中,需要判斷插入的數(shù)據(jù)是否已經(jīng)在數(shù)據(jù)庫中存在,如果存在,就不要插入,否則就插入。
當(dāng)然要解決這個問題,其實(shí)方法很多,相應(yīng)的每種方法的限制也不少。
1 唯一索引,聯(lián)合唯一索引 (被回絕,顧問提供的存儲過程是不會使用這樣的方法來處理那些中斷,錯誤,使用這樣的方法還是要程序報(bào)錯,目的沒有達(dá)到) PASS
2 insert into ....... select ...... where not exist (select .... ) 這個就不說了,上面已經(jīng)有這樣的語句了
3 本次的重點(diǎn),merge into 語句, 我們還拿上面的的語句改寫成merge into 來實(shí)現(xiàn)。INSERT tbl_A (col, col2) SELECT col, col2 FROM tbl_B WHERE NOT EXISTS (SELECT col FROM tbl_A A2 WHERE A2.col = tbl_B.col);
改寫后,
merge into tab1 as tab1
using (select id,size_2 from tab2) as tab2 on tab1.id_1 = tab2.id
WHEN NOT MATCHED THEN
insert (size_1) values (size_2);
結(jié)果:在沒有報(bào)錯的情況下,將兩個表重合的記錄去除后,在將不同的結(jié)果插入。
問題解決
MySQL
在MYSQL 中,處理這樣的事情比SQL SERVER的方法要多,主要有兩種
1 REPLACE INTO
2 DUPLICATE KEY UPDATE
以上兩種方法,在這樣的情況下,使用 DUPLICATE KEY UPDATE 是比較合適的,具體Replace into
這里就不在介紹,這兩個區(qū)別也是顯而易見的,一個 匹配 DELETE ,在INSERT ,另一個是 匹配UPDATE
這是明顯的兩個方式的不同。
這里還是MYSQL的兩個類似SQL SERVER 表
還是要將 tab2 的與 tab1 不同的數(shù)據(jù)插入到 tab1
insert into tab1 (id,name) select id,name_2 from tab2 on duplicate key update tab1.name= tab2.name_2;
以上的一條語句就可以完成這個工作,根據(jù)主鍵或者唯一索引,來判斷重復(fù)的數(shù)據(jù),并緊緊進(jìn)行更新,否則就插入tab1中在tab2中不存在的數(shù)據(jù)。
對比 SQL SERVER , MySQL在這項(xiàng)工作中顯然是要方便的多。
——————————————————————————————
ORACLE 在處理這樣數(shù)據(jù)的方式和SQL SERVER 類似,
merge into tab1 using tab2 on (tab1.id=tab2.id) when not matched then insert (id,name) values (tab2.id,tab2.name_2);
_____________________________________________________________
Postgresql 簡述: Postgresql 的確是數(shù)據(jù)庫界的黑馬,無論是MYSQL的
duplicate key update ,還是 ORACLE SQL SERVER 支持的 MERGE INTO 語法均在數(shù)據(jù)庫中支持(11版本)
——————————————————————————————————總結(jié):
相比MYSQL ,SQL SERVER 和ORACLE 在處理重復(fù)值上比較麻煩,雖然SQL SERVER 和ORACLE 在處理的路數(shù)上近似一致,但也有不同點(diǎn),PostgreSQL 的確是后來者居上,三種數(shù)據(jù)庫支持的方式均在最新版的數(shù)據(jù)庫中支持
1 ORACLE 勝出,在MATCH 下的語句還是可以添加 where 條件,這樣操作會更靈活,SQL SERVER 不可以
2 SQL SERVER 勝出, SQL SERVER 可以在判斷中,將目標(biāo)表未操作的數(shù)據(jù)刪除,但ORACLE 不可以
3 MYSQL 在使用中針對去重記錄,是最簡便最快速的,但功能簡單,如果要進(jìn)行ORACLE 或者 SQL SERVER 復(fù)雜的功能,則沒有現(xiàn)成的語句完成。
4 PostgreSQL,勝出,三種數(shù)據(jù)庫支持的方法均都支持,缺點(diǎn),需要更新的 11版本的PostgreSQL.
上述就是小編為大家分享的如何避免Duplicate key在數(shù)據(jù)表插入中的應(yīng)用了,如果剛好有類似的疑惑,不妨參照上述分析進(jìn)行理解。如果想知道更多相關(guān)知識,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。