本篇內(nèi)容介紹了“MySQL/Oracle數(shù)據(jù)庫優(yōu)化方法有哪些”的有關(guān)知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧!希望大家仔細閱讀,能夠?qū)W有所成!
創(chuàng)新互聯(lián)公司是一家專注網(wǎng)站建設(shè)、網(wǎng)絡(luò)營銷策劃、小程序設(shè)計、電子商務(wù)建設(shè)、網(wǎng)絡(luò)推廣、移動互聯(lián)開發(fā)、研究、服務(wù)為一體的技術(shù)型公司。公司成立十載以來,已經(jīng)為1000+混凝土攪拌站各業(yè)的企業(yè)公司提供互聯(lián)網(wǎng)服務(wù)?,F(xiàn)在,服務(wù)的1000+客戶與我們一路同行,見證我們的成長;未來,我們一起分享成功的喜悅。
1、選取最適用的字段屬性
MySQL可以很好的支持大數(shù)據(jù)量的存取,但是一般說來,數(shù)據(jù)庫中的表越小,在它上面執(zhí)行的查詢也就會越快。因此,在創(chuàng)建表的時候,為了獲得更好的性能,我們可以將表中字段的寬度設(shè)得盡可能小。
例如,在定義郵政編碼這個字段時,如果將其設(shè)置為CHAR(255),顯然給數(shù)據(jù)庫增加了不必要的空間,甚至使用VARCHAR這種類型也是多余的,因為CHAR(6)就可以很好的完成任務(wù)了。同樣的,如果可以的話,我們應(yīng)該使用MEDIUMINT而不是BIGIN來定義整型字段。
另外一個提高效率的方法是在可能的情況下,應(yīng)該盡量把字段設(shè)置為NOTNULL,這樣在將來執(zhí)行查詢的時候,數(shù)據(jù)庫不用去比較NULL值。
對于某些文本字段,例如“省份”或者“性別”,我們可以將它們定義為ENUM類型。因為在MySQL中,ENUM類型被當(dāng)作數(shù)值型數(shù)據(jù)來處理,而數(shù)值型數(shù)據(jù)被處理起來的速度要比文本類型快得多。這樣,我們又可以提高數(shù)據(jù)庫的性能。
2、使用連接(JOIN)來代替子查詢(Sub-Queries)
MySQL從4.1開始支持SQL的子查詢。這個技術(shù)可以使用SELECT語句來創(chuàng)建一個單列的查詢結(jié)果,然后把這個結(jié)果作為過濾條件用在另一個查詢中。例如,我們要將客戶基本信息表中沒有任何訂單的客戶刪除掉,就可以利用子查詢先從銷售信息表中將所有發(fā)出訂單的客戶ID取出來,然后將結(jié)果傳遞給主查詢,如下所示:
DELETEFROMcustomerinfo
WHERECustomerIDNOTin(SELECTCustomerIDFROMsalesinfo)
使用子查詢可以一次性的完成很多邏輯上需要多個步驟才能完成的SQL操作,同時也可以避免事務(wù)或者表鎖死,并且寫起來也很容易。但是,有些情況下,子查詢可以被更有效率的連接(JOIN)..替代。例如,假設(shè)我們要將所有沒有訂單記錄的用戶取出來,可以用下面這個查詢完成:
SELECT*FROMcustomerinfo
WHERECustomerIDNOTin(SELECTCustomerIDFROMsalesinfo)
如果使用連接(JOIN)..來完成這個查詢工作,速度將會快很多。尤其是當(dāng)salesinfo表中對CustomerID建有索引的話,性能將會更好,查詢?nèi)缦拢?/p>
SELECT*FROMcustomerinfo
LEFTJOINsalesinfoONcustomerinfo.CustomerID=salesinfo.CustomerID
WHEREsalesinfo.CustomerIDISNULL
連接(JOIN)..之所以更有效率一些,是因為MySQL不需要在內(nèi)存中創(chuàng)建臨時表來完成這個邏輯上的需要兩個步驟的查詢工作。
3、使用聯(lián)合(UNION)來代替手動創(chuàng)建的臨時表
MySQL從4.0的版本開始支持union查詢,它可以把需要使用臨時表的兩條或更多的select查詢合并的一個查詢中。在客戶端的查詢會話結(jié)束的時候,臨時表會被自動刪除,從而保證數(shù)據(jù)庫整齊、高效。使用union來創(chuàng)建查詢的時候,我們只需要用UNION作為關(guān)鍵字把多個select語句連接起來就可以了,要注意的是所有select語句中的字段數(shù)目要想同。下面的例子就演示了一個使用UNION的查詢。
SELECTName,PhoneFROMclientUNION
SELECTName,BirthDateFROMauthorUNION
SELECTName,SupplierFROMproduct
4、事務(wù)
盡管我們可以使用子查詢(Sub-Queries)、連接(JOIN)和聯(lián)合(UNION)來創(chuàng)建各種各樣的查詢,但不是所有的數(shù)據(jù)庫操作都可以只用一條或少數(shù)幾條SQL語句就可以完成的。更多的時候是需要用到一系列的語句來完成某種工作。但是在這種情況下,當(dāng)這個語句塊中的某一條語句運行出錯的時候,整個語句塊的操作就會變得不確定起來。設(shè)想一下,要把某個數(shù)據(jù)同時插入兩個相關(guān)聯(lián)的表中,可能會出現(xiàn)這樣的情況:第一個表中成功更新后,數(shù)據(jù)庫突然出現(xiàn)意外狀況,造成第二個表中的操作沒有完成,這樣,就會造成數(shù)據(jù)的不完整,甚至?xí)茐臄?shù)據(jù)庫中的數(shù)據(jù)。要避免這種情況,就應(yīng)該使用事務(wù),它的作用是:要么語句塊中每條語句都操作成功,要么都失敗。換句話說,就是可以保持?jǐn)?shù)據(jù)庫中數(shù)據(jù)的一致性和完整性。事物以BEGIN關(guān)鍵字開始,COMMIT關(guān)鍵字結(jié)束。在這之間的一條SQL操作失敗,那么,ROLLBACK命令就可以把數(shù)據(jù)庫恢復(fù)到BEGIN開始之前的狀態(tài)。
BEGIN; INSERTINTOsalesinfoSETCustomerID=14;UPDATEinventorySETQuantity=11WHEREitem='book';COMMIT;
事務(wù)的另一個重要作用是當(dāng)多個用戶同時使用相同的數(shù)據(jù)源時,它可以利用鎖定數(shù)據(jù)庫的方法來為用戶提供一種安全的訪問方式,這樣可以保證用戶的操作不被其它的用戶所干擾。
5、鎖定表
盡管事務(wù)是維護數(shù)據(jù)庫完整性的一個非常好的方法,但卻因為它的獨占性,有時會影響數(shù)據(jù)庫的性能,尤其是在很大的應(yīng)用系統(tǒng)中。由于在事務(wù)執(zhí)行的過程中,數(shù)據(jù)庫將會被鎖定,因此其它的用戶請求只能暫時等待直到該事務(wù)結(jié)束。如果一個數(shù)據(jù)庫系統(tǒng)只有少數(shù)幾個用戶來使用,事務(wù)造成的影響不會成為一個太大的問題;但假設(shè)有成千上萬的用戶同時訪問一個數(shù)據(jù)庫系統(tǒng),例如訪問一個電子商務(wù)網(wǎng)站,就會產(chǎn)生比較嚴(yán)重的響應(yīng)延遲。
其實,有些情況下我們可以通過鎖定表的方法來獲得更好的性能。下面的例子就用鎖定表的方法來完成前面一個例子中事務(wù)的功能。
LOCKTABLEinventoryWRITESELECTQuantityFROMinventoryWHEREItem='book';
...
UPDATEinventorySETQuantity=11WHEREItem='book';UNLOCKTABLES
這里,我們用一個select語句取出初始數(shù)據(jù),通過一些計算,用update語句將新值更新到表中。包含有WRITE關(guān)鍵字的LOCKTABLE語句可以保證在UNLOCKTABLES命令被執(zhí)行之前,不會有其它的訪問來對inventory進行插入、更新或者刪除的操作。
6、使用外鍵
鎖定表的方法可以維護數(shù)據(jù)的完整性,但是它卻不能保證數(shù)據(jù)的關(guān)聯(lián)性。這個時候我們就可以使用外鍵。
例如,外鍵可以保證每一條銷售記錄都指向某一個存在的客戶。在這里,外鍵可以把customerinfo表中的CustomerID映射到salesinfo表中CustomerID,任何一條沒有合法CustomerID的記錄都不會被更新或插入到salesinfo中。
CREATETABLEcustomerinfo( CustomerIDINTNOTNULL,PRIMARYKEY(CustomerID))TYPE=INNODB;
CREATETABLEsalesinfo( SalesIDINTNOTNULL,CustomerIDINTNOTNULL,
PRIMARYKEY(CustomerID,SalesID),
FOREIGNKEY(CustomerID)REFERENCEScustomerinfo(CustomerID)ONDELETECASCADE)TYPE=INNODB;
注意例子中的參數(shù)“ONDELETECASCADE”。該參數(shù)保證當(dāng)customerinfo表中的一條客戶記錄被刪除的時候,salesinfo表中所有與該客戶相關(guān)的記錄也會被自動刪除。如果要在MySQL中使用外鍵,一定要記住在創(chuàng)建表的時候?qū)⒈淼念愋投x為事務(wù)安全表InnoDB類型。該類型不是MySQL表的默認(rèn)類型。定義的方法是在CREATETABLE語句中加上TYPE=INNODB。如例中所示。
7、使用索引
索引是提高數(shù)據(jù)庫性能的常用方法,它可以令數(shù)據(jù)庫 最后,應(yīng)該注意避免在查詢中讓MySQL進行自動類型轉(zhuǎn)換,因為轉(zhuǎn)換過程也會使索引變得不起作用。 優(yōu)化Mysql數(shù)據(jù)庫的8個方法 本文通過8個方法優(yōu)化Mysql數(shù)據(jù)庫:創(chuàng)建索引、復(fù)合索引、索引不會包含有NULL值的列、使用短索引、排序的索引問題、like語句操作、不要在列上進行運算、不使用NOT IN和<>操作 1、創(chuàng)建索引 對于查詢占主要的應(yīng)用來說,索引顯得尤為重要。很多時候性能問題很簡單的就是因為我們忘了添加索引而造成的,或者說沒有添加更為有效的索引導(dǎo)致。如果不加索引的話,那么查找任何哪怕只是一條特定的數(shù)據(jù)都會進行一次全表掃描,如果一張表的數(shù)據(jù)量很大而符合條件的結(jié)果又很少,那么不加索引會引起致命的性能下降。但是也不是什么情況都非得建索引不可,比如性別可能就只有兩個值,建索引不僅沒什么優(yōu)勢,還會影響到更新速度,這被稱為過度索引。 2、復(fù)合索引 比如有一條語句是這樣的:select * from users where area='beijing' and age=22; 如果我們是在area和age上分別創(chuàng)建單個索引的話,由于mysql查詢每次只能使用一個索引,所以雖然這樣已經(jīng)相對不做索引時全表掃描提高了很多效率,但是如果在area、age兩列上創(chuàng)建復(fù)合索引的話將帶來更高的效率。如果我們創(chuàng)建了(area, age, salary)的復(fù)合索引,那么其實相當(dāng)于創(chuàng)建了(area,age,salary)、(area,age)、(area)三個索引,這被稱為最佳左前綴特性。因此我們在創(chuàng)建復(fù)合索引時應(yīng)該將最常用作限制條件的列放在最左邊,依次遞減。 3、索引不會包含有NULL值的列 只要列中包含有NULL值都將不會被包含在索引中,復(fù)合索引中只要有一列含有NULL值,那么這一列對于此復(fù)合索引就是無效的。所以我們在數(shù)據(jù)庫設(shè)計時不要讓字段的默認(rèn)值為NULL。 4、使用短索引 對串列進行索引,如果可能應(yīng)該指定一個前綴長度。例如,如果有一個CHAR(255)的 列,如果在前10 個或20 個字符內(nèi),多數(shù)值是惟一的,那么就不要對整個列進行索引。短索引不僅可以提高查詢速度而且可以節(jié)省磁盤空間和I/O操作。 5、排序的索引問題 mysql查詢只使用一個索引,因此如果where子句中已經(jīng)使用了索引的話,那么order by中的列是不會使用索引的。因此數(shù)據(jù)庫默認(rèn)排序可以符合要求的情況下不要使用排序操作;盡量不要包含多個列的排序,如果需要最好給這些列創(chuàng)建復(fù)合索引。 6、like語句操作 一般情況下不鼓勵使用like操作,如果非使用不可,如何使用也是一個問題。like “%aaa%” 不會使用索引而like “aaa%”可以使用索引。 7、不要在列上進行運算 select * from users where YEAR(adddate)<2007; 將在每個行上進行運算,這將導(dǎo)致索引失效而進行全表掃描,因此我們可以改成 select * from users where adddate<‘2007-01-01'; 8、不使用NOT IN和<>操作 NOT IN和<>操作都不會使用索引將進行全表掃描。NOT IN可以NOT EXISTS代替,id<>3則可使用id>3 or id<3來代替。 數(shù)據(jù)庫SQL優(yōu)化大總結(jié)之 百萬級數(shù)據(jù)庫優(yōu)化方案 網(wǎng)上關(guān)于SQL優(yōu)化的教程很多,但是比較雜亂。近日有空整理了一下,寫出來跟大家分享一下,其中有錯誤和不足的地方,還請大家糾正補充。 這篇文章我花費了大量的時間查找資料、修改、排版,希望大家閱讀之后,感覺好的話推薦給更多的人,讓更多的人看到、糾正以及補充。 1.對查詢進行優(yōu)化,要盡量避免全表掃描,首先應(yīng)考慮在 where 及 order by 涉及的列上建立索引。 2.應(yīng)盡量避免在 where 子句中對字段進行 null 值判斷,否則將導(dǎo)致引擎放棄使用索引而進行全表掃描,如: select id from t where num is null 最好不要給數(shù)據(jù)庫留NULL,盡可能的使用 NOT NULL填充數(shù)據(jù)庫. 備注、描述、評論之類的可以設(shè)置為 NULL,其他的,最好不要使用NULL。 不要以為 NULL 不需要空間,比如:char(100) 型,在字段建立時,空間就固定了, 不管是否插入值(NULL也包含在內(nèi)),都是占用 100個字符的空間的,如果是varchar這樣的變長字段, null 不占用空間。 可以在num上設(shè)置默認(rèn)值0,確保表中num列沒有null值,然后這樣查詢: select id from t where num = 0 3.應(yīng)盡量避免在 where 子句中使用 != 或 <> 操作符,否則將引擎放棄使用索引而進行全表掃描。 4.應(yīng)盡量避免在 where 子句中使用 or 來連接條件,如果一個字段有索引,一個字段沒有索引,將導(dǎo)致引擎放棄使用索引而進行全表掃描,如: select id from t where num=10 or Name = 'admin' 可以這樣查詢: select id from t where num = 10 union all select id from t where Name = 'admin' 5.in 和 not in 也要慎用,否則會導(dǎo)致全表掃描,如: select id from t where num in(1,2,3) 對于連續(xù)的數(shù)值,能用 between 就不要用 in 了: select id from t where num between 1 and 3 很多時候用 exists 代替 in 是一個好的選擇: select num from a where num in(select num from b) 用下面的語句替換: select num from a where exists(select 1 from b where num=a.num) 6.下面的查詢也將導(dǎo)致全表掃描: select id from t where name like ‘%abc%’ 若要提高效率,可以考慮全文檢索。 7.如果在 where 子句中使用參數(shù),也會導(dǎo)致全表掃描。因為SQL只有在運行時才會解析局部變量,但優(yōu)化程序不能將訪問計劃的選擇推遲到運行時;它必須在編譯時進行選擇。然 而,如果在編譯時建立訪問計劃,變量的值還是未知的,因而無法作為索引選擇的輸入項。如下面語句將進行全表掃描: select id from t where num = @num 可以改為強制查詢使用索引: select id from t with(index(索引名)) where num = @num .應(yīng)盡量避免在 where 子句中對字段進行表達式操作,這將導(dǎo)致引擎放棄使用索引而進行全表掃描。如: select id from t where num/2 = 100 應(yīng)改為: select id from t where num = 100*2 9.應(yīng)盡量避免在where子句中對字段進行函數(shù)操作,這將導(dǎo)致引擎放棄使用索引而進行全表掃描。如: select id from t where substring(name,1,3) = ’abc’ -–name以abc開頭的id select id from t where datediff(day,createdate,’2005-11-30′) = 0 -–‘2005-11-30’ --生成的id 應(yīng)改為: select id from t where name like 'abc%' select id from t where createdate >= '2005-11-30' and createdate < '2005-12-1' 10.不要在 where 子句中的“=”左邊進行函數(shù)、算術(shù)運算或其他表達式運算,否則系統(tǒng)將可能無法正確使用索引。 11.在使用索引字段作為條件時,如果該索引是復(fù)合索引,那么必須使用到該索引中的第一個字段作為條件時才能保證系統(tǒng)使用該索引,否則該索引將不會被使用,并且應(yīng)盡可能的讓字段順序與索引順序相一致。 12.不要寫一些沒有意義的查詢,如需要生成一個空表結(jié)構(gòu): select col1,col2 into #t from t where 1=0 這類代碼不會返回任何結(jié)果集,但是會消耗系統(tǒng)資源的,應(yīng)改成這樣: create table #t(…) 13.Update 語句,如果只更改1、2個字段,不要Update全部字段,否則頻繁調(diào)用會引起明顯的性能消耗,同時帶來大量日志。 14.對于多張大數(shù)據(jù)量(這里幾百條就算大了)的表JOIN,要先分頁再JOIN,否則邏輯讀會很高,性能很差。 15.select count(*) from table;這樣不帶任何條件的count會引起全表掃描,并且沒有任何業(yè)務(wù)意義,是一定要杜絕的。 16.索引并不是越多越好,索引固然可以提高相應(yīng)的 select 的效率,但同時也降低了 insert 及 update 的效率,因為 insert 或 update 時有可能會重建索引,所以怎樣建索引需要慎重考慮,視具體情況而定。一個表的索引數(shù)最好不要超過6個,若太多則應(yīng)考慮一些不常使用到的列上建的索引是否有 必要。 17.應(yīng)盡可能的避免更新 clustered 索引數(shù)據(jù)列,因為 clustered 索引數(shù)據(jù)列的順序就是表記錄的物理存儲順序,一旦該列值改變將導(dǎo)致整個表記錄的順序的調(diào)整,會耗費相當(dāng)大的資源。若應(yīng)用系統(tǒng)需要頻繁更新 clustered 索引數(shù)據(jù)列,那么需要考慮是否應(yīng)將該索引建為 clustered 索引。 18.盡量使用數(shù)字型字段,若只含數(shù)值信息的字段盡量不要設(shè)計為字符型,這會降低查詢和連接的性能,并會增加存儲開銷。這是因為引擎在處理查詢和連 接時會逐個比較字符串中每一個字符,而對于數(shù)字型而言只需要比較一次就夠了。 19.盡可能的使用 varchar/nvarchar 代替 char/nchar ,因為首先變長字段存儲空間小,可以節(jié)省存儲空間,其次對于查詢來說,在一個相對較小的字段內(nèi)搜索效率顯然要高些。 20.任何地方都不要使用 select * from t ,用具體的字段列表代替“*”,不要返回用不到的任何字段。 21.盡量使用表變量來代替臨時表。如果表變量包含大量數(shù)據(jù),請注意索引非常有限(只有主鍵索引)。 22. 避免頻繁創(chuàng)建和刪除臨時表,以減少系統(tǒng)表資源的消耗。臨時表并不是不可使用,適當(dāng)?shù)厥褂盟鼈兛梢允鼓承├谈行?,例如,?dāng)需要重復(fù)引用大型表或常用表中的某個數(shù)據(jù)集時。但是,對于一次性事件, 最好使用導(dǎo)出表。 23.在新建臨時表時,如果一次性插入數(shù)據(jù)量很大,那么可以使用 select into 代替 create table,避免造成大量 log ,以提高速度;如果數(shù)據(jù)量不大,為了緩和系統(tǒng)表的資源,應(yīng)先create table,然后insert。 24.如果使用到了臨時表,在存儲過程的最后務(wù)必將所有的臨時表顯式刪除,先 truncate table ,然后 drop table ,這樣可以避免系統(tǒng)表的較長時間鎖定。 25.盡量避免使用游標(biāo),因為游標(biāo)的效率較差,如果游標(biāo)操作的數(shù)據(jù)超過1萬行,那么就應(yīng)該考慮改寫。 26.使用基于游標(biāo)的方法或臨時表方法之前,應(yīng)先尋找基于集的解決方案來解決問題,基于集的方法通常更有效。 27.與臨時表一樣,游標(biāo)并不是不可使用。對小型數(shù)據(jù)集使用 FAST_FORWARD 游標(biāo)通常要優(yōu)于其他逐行處理方法,尤其是在必須引用幾個表才能獲得所需的數(shù)據(jù)時。在結(jié)果集中包括“合計”的例程通常要比使用游標(biāo)執(zhí)行的速度快。如果開發(fā)時 間允許,基于游標(biāo)的方法和基于集的方法都可以嘗試一下,看哪一種方法的效果更好。 28.在所有的存儲過程和觸發(fā)器的開始處設(shè)置 SET NOCOUNT ON ,在結(jié)束時設(shè)置 SET NOCOUNT OFF 。無需在執(zhí)行存儲過程和觸發(fā)器的每個語句后向客戶端發(fā)送 DONE_IN_PROC 消息。 29.盡量避免大事務(wù)操作,提高系統(tǒng)并發(fā)能力。 30.盡量避免向客戶端返回大數(shù)據(jù)量,若數(shù)據(jù)量過大,應(yīng)該考慮相應(yīng)需求是否合理。 實際案例分析:拆分大的 DELETE 或INSERT 語句,批量提交SQL語句 如果你需要在一個在線的網(wǎng)站上去執(zhí)行一個大的 DELETE 或 INSERT 查詢,你需要非常小心,要避免你的操作讓你的整個網(wǎng)站停止相應(yīng)。因為這兩個操作是會鎖表的,表一鎖住了,別的操作都進不來了。 Apache 會有很多的子進程或線程。所以,其工作起來相當(dāng)有效率,而我們的服務(wù)器也不希望有太多的子進程,線程和數(shù)據(jù)庫鏈接,這是極大的占服務(wù)器資源的事情,尤其是內(nèi)存。 如果你把你的表鎖上一段時間,比如30秒鐘,那么對于一個有很高訪問量的站點來說,這30秒所積累的訪問進程/線程,數(shù)據(jù)庫鏈接,打開的文件數(shù),可能不僅僅會讓你的WEB服務(wù)崩潰,還可能會讓你的整臺服務(wù)器馬上掛了。 所以,如果你有一個大的處理,你一定把其拆分,使用 LIMIT oracle(rownum),sqlserver(top)條件是一個好的方法。下面是一個mysql示例: while(1){ //每次只做1000條 mysql_query(“delete from logs where log_date <= ’2012-11-01’ limit 1000”); if(mysql_affected_rows() == 0){ //刪除完成,退出! break; } //每次暫停一段時間,釋放表讓其他進程/線程訪問。 usleep(50000) } 好了,到這里就寫完了。我知道還有很多沒有寫到的,還請大家補充。后面有空會介紹一些SQL優(yōu)化工具給大家。讓我們一起學(xué)習(xí),一起進步吧! 運維角度淺談MySQL數(shù)據(jù)庫優(yōu)化 一個成熟的數(shù)據(jù)庫架構(gòu)并不是一開始設(shè)計就具備高可用、高伸縮等特性的,它是隨著用戶量的增加,基礎(chǔ)架構(gòu)才逐漸完善。這篇博文主要談MySQL數(shù)據(jù)庫發(fā)展周期中所面臨的問題及優(yōu)化方案,暫且拋開前端應(yīng)用不說,大致分為以下五個階段: 1、數(shù)據(jù)庫表設(shè)計 項目立項后,開發(fā)部根據(jù)產(chǎn)品部需求開發(fā)項目,開發(fā)工程師工作其中一部分就是對表結(jié)構(gòu)設(shè)計。對于數(shù)據(jù)庫來說,這點很重要,如果設(shè)計不當(dāng),會直接影響訪問速度和用戶體驗。影響的因素很多,比如慢查詢、低效的查詢語句、沒有適當(dāng)建立索引、數(shù)據(jù)庫堵塞(死鎖)等。當(dāng)然,有測試工程師的團隊,會做壓力測試,找bug。對于沒有測試工程師的團隊來說,大多數(shù)開發(fā)工程師初期不會太多考慮數(shù)據(jù)庫設(shè)計是否合理,而是盡快完成功能實現(xiàn)和交付,等項目有一定訪問量后,隱藏的問題就會暴露,這時再去修改就不是這么容易的事了。 2、數(shù)據(jù)庫部署 該運維工程師出場了,項目初期訪問量不會很大,所以單臺部署足以應(yīng)對在1500左右的QPS(每秒查詢率)??紤]到高可用性,可采用MySQL主從復(fù)制+Keepalived做雙擊熱備,常見集群軟件有Keepalived、Heartbeat。 雙機熱備博文:http://lizhenliang.blog.51cto.com/7876557/1362313 3、數(shù)據(jù)庫性能優(yōu)化 如果將MySQL部署到普通的X86服務(wù)器上,在不經(jīng)過任何優(yōu)化情況下,MySQL理論值正常可以處理2000左右QPS,經(jīng)過優(yōu)化后,有可能會提升到2500左右QPS,否則,訪問量當(dāng)達到1500左右并發(fā)連接時,數(shù)據(jù)庫處理性能就會變慢,而且硬件資源還很富裕,這時就該考慮軟件問題了。那么怎樣讓數(shù)據(jù)庫最大化發(fā)揮性能呢?一方面可以單臺運行多個MySQL實例讓服務(wù)器性能發(fā)揮到最大化,另一方面是對數(shù)據(jù)庫進行優(yōu)化,往往操作系統(tǒng)和數(shù)據(jù)庫默認(rèn)配置都比較保守,會對數(shù)據(jù)庫發(fā)揮有一定限制,可對這些配置進行適當(dāng)?shù)恼{(diào)整,盡可能的處理更多連接數(shù)。 具體優(yōu)化有以下三個層面: 3.1 數(shù)據(jù)庫配置優(yōu)化 MySQL常用有兩種存儲引擎,一個是MyISAM,不支持事務(wù)處理,讀性能處理快,表級別鎖。另一個是InnoDB,支持事務(wù)處理(ACID),設(shè)計目標(biāo)是為處理大容量數(shù)據(jù)發(fā)揮最大化性能,行級別鎖。 表鎖:開銷小,鎖定粒度大,發(fā)生死鎖概率高,相對并發(fā)也低。 行鎖:開銷大,鎖定粒度小,發(fā)生死鎖概率低,相對并發(fā)也高。 為什么會出現(xiàn)表鎖和行鎖呢?主要是為了保證數(shù)據(jù)的完整性,舉個例子,一個用戶在操作一張表,其他用戶也想操作這張表,那么就要等第一個用戶操作完,其他用戶才能操作,表鎖和行鎖就是這個作用。否則多個用戶同時操作一張表,肯定會數(shù)據(jù)產(chǎn)生沖突或者異常。 根據(jù)以上看來,使用InnoDB存儲引擎是最好的選擇,也是MySQL5.5以后版本中默認(rèn)存儲引擎。每個存儲引擎相關(guān)聯(lián)參數(shù)比較多,以下列出主要影響數(shù)據(jù)庫性能的參數(shù)。 公共參數(shù)默認(rèn)值: 1 2 3 4 5 6 max_connections = 151 #同時處理最大連接數(shù),推薦設(shè)置最大連接數(shù)是上限連接數(shù)的80%左右 sort_buffer_size = 2M #查詢排序時緩沖區(qū)大小,只對order by和group by起作用,可增大此值為16M open_files_limit = 1024 #打開文件數(shù)限制,如果show global status like 'open_files'查看的值等于或者大于open_files_limit值時,程序會無法連接數(shù)據(jù)庫或卡死 MyISAM參數(shù)默認(rèn)值: 1 2 3 4 5 6 7 8 9 10 key_buffer_size = 16M #索引緩存區(qū)大小,一般設(shè)置物理內(nèi)存的30-40% read_buffer_size = 128K #讀操作緩沖區(qū)大小,推薦設(shè)置16M或32M query_cache_type = ON #打開查詢緩存功能 query_cache_limit = 1M #查詢緩存限制,只有1M以下查詢結(jié)果才會被緩存,以免結(jié)果數(shù)據(jù)較大把緩存池覆蓋 query_cache_size = 16M #查看緩沖區(qū)大小,用于緩存SELECT查詢結(jié)果,下一次有同樣SELECT查詢將直接從緩存池返回結(jié)果,可適當(dāng)成倍增加此值 InnoDB參數(shù)默認(rèn)值: 1 2 3 4 5 6 7 8 9 10 innodb_buffer_pool_size = 128M #索引和數(shù)據(jù)緩沖區(qū)大小,一般設(shè)置物理內(nèi)存的60%-70% innodb_buffer_pool_instances = 1 #緩沖池實例個數(shù),推薦設(shè)置4個或8個 innodb_flush_log_at_trx_commit = 1 #關(guān)鍵參數(shù),0代表大約每秒寫入到日志并同步到磁盤,數(shù)據(jù)庫故障會丟失1秒左右事務(wù)數(shù)據(jù)。1為每執(zhí)行一條SQL后寫入到日志并同步到磁盤,I/O開銷大,執(zhí)行完SQL要等待日志讀寫,效率低。2代表只把日志寫入到系統(tǒng)緩存區(qū),再每秒同步到磁盤,效率很高,如果服務(wù)器故障,才會丟失事務(wù)數(shù)據(jù)。對數(shù)據(jù)安全性要求不是很高的推薦設(shè)置2,性能高,修改后效果明顯。 innodb_file_per_table = OFF #默認(rèn)是共享表空間,共享表空間idbdata文件不斷增大,影響一定的I/O性能。推薦開啟獨立表空間模式,每個表的索引和數(shù)據(jù)都存在自己獨立的表空間中,可以實現(xiàn)單表在不同數(shù)據(jù)庫中移動。 innodb_log_buffer_size = 8M #日志緩沖區(qū)大小,由于日志最長每秒鐘刷新一次,所以一般不用超過16M 3.2 系統(tǒng)內(nèi)核優(yōu)化 大多數(shù)MySQL都部署在linux系統(tǒng)上,所以操作系統(tǒng)的一些參數(shù)也會影響到MySQL性能,以下對linux內(nèi)核進行適當(dāng)優(yōu)化。 1 2 3 4 5 6 7 8 9 10 net.ipv4.tcp_fin_timeout = 30 #TIME_WAIT超時時間,默認(rèn)是60s net.ipv4.tcp_tw_reuse = 1 #1表示開啟復(fù)用,允許TIME_WAIT socket重新用于新的TCP連接,0表示關(guān)閉 net.ipv4.tcp_tw_recycle = 1 #1表示開啟TIME_WAIT socket快速回收,0表示關(guān)閉 net.ipv4.tcp_max_tw_buckets = 4096 #系統(tǒng)保持TIME_WAIT socket最大數(shù)量,如果超出這個數(shù),系統(tǒng)將隨機清除一些TIME_WAIT并打印警告信息 net.ipv4.tcp_max_syn_backlog = 4096 #進入SYN隊列最大長度,加大隊列長度可容納更多的等待連接 在linux系統(tǒng)中,如果進程打開的文件句柄數(shù)量超過系統(tǒng)默認(rèn)值1024,就會提示“too many files open”信息,所以要調(diào)整打開文件句柄限制。 1 2 3 4 # vi /etc/security/limits.conf #加入以下配置,*代表所有用戶,也可以指定用戶,重啟系統(tǒng)生效 * soft nofile 65535 * hard nofile 65535 # ulimit -SHn 65535 #立刻生效 3.3 硬件配置 加大物理內(nèi)存,提高文件系統(tǒng)性能。linux內(nèi)核會從內(nèi)存中分配出緩存區(qū)(系統(tǒng)緩存和數(shù)據(jù)緩存)來存放熱數(shù)據(jù),通過文件系統(tǒng)延遲寫入機制,等滿足條件時(如緩存區(qū)大小到達一定百分比或者執(zhí)行sync命令)才會同步到磁盤。也就是說物理內(nèi)存越大,分配緩存區(qū)越大,緩存數(shù)據(jù)越多。當(dāng)然,服務(wù)器故障會丟失一定的緩存數(shù)據(jù)。 SSD硬盤代替SAS硬盤,將RAID級別調(diào)整為RAID1+0,相對于RAID1和RAID5有更好的讀寫性能(IOPS),畢竟數(shù)據(jù)庫的壓力主要來自磁盤I/O方面。 4、數(shù)據(jù)庫架構(gòu)擴展 隨著業(yè)務(wù)量越來越大,單臺數(shù)據(jù)庫服務(wù)器性能已無法滿足業(yè)務(wù)需求,該考慮加機器了,該做集群了~~~。主要思想是分解單臺數(shù)據(jù)庫負載,突破磁盤I/O性能,熱數(shù)據(jù)存放緩存中,降低磁盤I/O訪問頻率。 4.1 主從復(fù)制與讀寫分離 因為生產(chǎn)環(huán)境中,數(shù)據(jù)庫大多都是讀操作,所以部署一主多從架構(gòu),主數(shù)據(jù)庫負責(zé)寫操作,并做雙擊熱備,多臺從數(shù)據(jù)庫做負載均衡,負責(zé)讀操作,主流的負載均衡器有LVS、HAProxy、Nginx。 怎么來實現(xiàn)讀寫分離呢?大多數(shù)企業(yè)是在代碼層面實現(xiàn)讀寫分離,效率比較高。另一個種方式通過代理程序?qū)崿F(xiàn)讀寫分離,企業(yè)中應(yīng)用較少,常見代理程序有MySQL Proxy、Amoeba。在這樣數(shù)據(jù)庫集群架構(gòu)中,大大增加數(shù)據(jù)庫高并發(fā)能力,解決單臺性能瓶頸問題。如果從數(shù)據(jù)庫一臺從庫能處理2000 QPS,那么5臺就能處理1w QPS,數(shù)據(jù)庫橫向擴展性也很容易。 有時,面對大量寫操作的應(yīng)用時,單臺寫性能達不到業(yè)務(wù)需求。如果做雙主,就會遇到數(shù)據(jù)庫數(shù)據(jù)不一致現(xiàn)象,產(chǎn)生這個原因是在應(yīng)用程序不同的用戶會有可能操作兩臺數(shù)據(jù)庫,同時的更新操作造成兩臺數(shù)據(jù)庫數(shù)據(jù)庫數(shù)據(jù)發(fā)生沖突或者不一致。在單庫時MySQL利用存儲引擎機制表鎖和行鎖來保證數(shù)據(jù)完整性,怎樣在多臺主庫時解決這個問題呢?有一套基于perl語言開發(fā)的主從復(fù)制管理工具,叫MySQL-MMM(Master-Master replication managerfor Mysql,Mysql主主復(fù)制管理器),這個工具最大的優(yōu)點是在同一時間只提供一臺數(shù)據(jù)庫寫操作,有效保證數(shù)據(jù)一致性。 主從復(fù)制博文:http://lizhenliang.blog.51cto.com/7876557/1290431 讀寫分離博文:http://lizhenliang.blog.51cto.com/7876557/1305083 MySQL-MMM博文:http://lizhenliang.blog.51cto.com/7876557/1354576 4.2 增加緩存 給數(shù)據(jù)庫增加緩存系統(tǒng),把熱數(shù)據(jù)緩存到內(nèi)存中,如果緩存中有要請求的數(shù)據(jù)就不再去數(shù)據(jù)庫中返回結(jié)果,提高讀性能。緩存實現(xiàn)有本地緩存和分布式緩存,本地緩存是將數(shù)據(jù)緩存到本地服務(wù)器內(nèi)存中或者文件中。分布式緩存可以緩存海量數(shù)據(jù),擴展性好,主流的分布式緩存系統(tǒng)有memcached、redis,memcached性能穩(wěn)定,數(shù)據(jù)緩存在內(nèi)存中,速度很快,QPS可達8w左右。如果想數(shù)據(jù)持久化就選擇用redis,性能不低于memcached。 工作過程: 4.3 分庫 分庫是根據(jù)業(yè)務(wù)不同把相關(guān)的表切分到不同的數(shù)據(jù)庫中,比如web、bbs、blog等庫。如果業(yè)務(wù)量很大,還可將切分后的庫做主從架構(gòu),進一步避免單個庫壓力過大。 4.4 分表 數(shù)據(jù)量的日劇增加,數(shù)據(jù)庫中某個表有幾百萬條數(shù)據(jù),導(dǎo)致查詢和插入耗時太長,怎么能解決單表壓力呢?你就該考慮是否把這個表拆分成多個小表,來減輕單個表的壓力,提高處理效率,此方式稱為分表。 分表技術(shù)比較麻煩,要修改程序代碼里的SQL語句,還要手動去創(chuàng)建其他表,也可以用merge存儲引擎實現(xiàn)分表,相對簡單許多。分表后,程序是對一個總表進行操作,這個總表不存放數(shù)據(jù),只有一些分表的關(guān)系,以及更新數(shù)據(jù)的方式,總表會根據(jù)不同的查詢,將壓力分到不同的小表上,因此提高并發(fā)能力和磁盤I/O性能。 分表分為垂直拆分和水平拆分: 垂直拆分:把原來的一個很多字段的表拆分多個表,解決表的寬度問題。你可以把不常用的字段單獨放到一個表中,也可以把大字段獨立放一個表中,或者把關(guān)聯(lián)密切的字段放一個表中。 水平拆分:把原來一個表拆分成多個表,每個表的結(jié)構(gòu)都一樣,解決單表數(shù)據(jù)量大的問題。 4.5 分區(qū) 分區(qū)就是把一張表的數(shù)據(jù)根據(jù)表結(jié)構(gòu)中的字段(如range、list、hash等)分成多個區(qū)塊,這些區(qū)塊可以在一個磁盤上,也可以在不同的磁盤上,分區(qū)后,表面上還是一張表,但數(shù)據(jù)散列在多個位置,這樣一來,多塊硬盤同時處理不同的請求,從而提高磁盤I/O讀寫性能,實現(xiàn)比較簡單。 注:增加緩存、分庫、分表和分區(qū)主要由程序猿來實現(xiàn)。 5、數(shù)據(jù)庫維護 數(shù)據(jù)庫維護是運維工程師或者DBA主要工作,包括性能監(jiān)控、性能分析、性能調(diào)優(yōu)、數(shù)據(jù)庫備份和恢復(fù)等。 5.1 性能狀態(tài)關(guān)鍵指標(biāo) QPS,Queries Per Second:每秒查詢數(shù),一臺數(shù)據(jù)庫每秒能夠處理的查詢次數(shù) TPS,Transactions Per Second:每秒處理事務(wù)數(shù) 通過show status查看運行狀態(tài),會有300多條狀態(tài)信息記錄,其中有幾個值幫可以我們計算出QPS和TPS,如下: Uptime:服務(wù)器已經(jīng)運行的實際,單位秒 Questions:已經(jīng)發(fā)送給數(shù)據(jù)庫查詢數(shù) Com_select:查詢次數(shù),實際操作數(shù)據(jù)庫的 Com_insert:插入次數(shù) Com_delete:刪除次數(shù) Com_update:更新次數(shù) Com_commit:事務(wù)次數(shù) Com_rollback:回滾次數(shù) 那么,計算方法來了,基于Questions計算出QPS: 1 2 mysql> show global status like 'Questions'; mysql> show global status like 'Uptime'; QPS = Questions / Uptime 基于Com_commit和Com_rollback計算出TPS: 1 2 3 mysql> show global status like 'Com_commit'; mysql> show global status like 'Com_rollback'; mysql> show global status like 'Uptime'; TPS = (Com_commit + Com_rollback) / Uptime 另一計算方式:基于Com_select、Com_insert、Com_delete、Com_update計算出QPS 1 mysql> show global status where Variable_name in('com_select','com_insert','com_delete','com_update'); 等待1秒再執(zhí)行,獲取間隔差值,第二次每個變量值減去第一次對應(yīng)的變量值,就是QPS TPS計算方法: 1 mysql> show global status where Variable_name in('com_insert','com_delete','com_update'); 計算TPS,就不算查詢操作了,計算出插入、刪除、更新四個值即可。 經(jīng)網(wǎng)友對這兩個計算方式的測試得出,當(dāng)數(shù)據(jù)庫中myisam表比較多時,使用Questions計算比較準(zhǔn)確。當(dāng)數(shù)據(jù)庫中innodb表比較多時,則以Com_*計算比較準(zhǔn)確。 5.2 開啟慢查詢?nèi)罩?/p> MySQL開啟慢查詢?nèi)罩?,分析出哪條SQL語句比較慢,使用set設(shè)置變量,重啟服務(wù)失效,可以在my.cnf添加參數(shù)永久生效。 1 2 3 4 mysql> set global slow-query-log=on #開啟慢查詢功能 mysql> set global slow_query_log_file='/var/log/mysql/mysql-slow.log'; #指定慢查詢?nèi)罩疚募恢?/p> mysql> set global log_queries_not_using_indexes=on; #記錄沒有使用索引的查詢 mysql> set global long_query_time=1; #只記錄處理時間1s以上的慢查詢 分析慢查詢?nèi)罩荆梢允褂肕ySQL自帶的mysqldumpslow工具,分析的日志較為簡單。 # mysqldumpslow -t 3 /var/log/mysql/mysql-slow.log #查看最慢的前三個查詢 也可以使用percona公司的pt-query-digest工具,日志分析功能全面,可分析slow log、binlog、general log。 分析慢查詢?nèi)罩荆簆t-query-digest /var/log/mysql/mysql-slow.log 分析binlog日志:mysqlbinlog mysql-bin.000001 >mysql-bin.000001.sql pt-query-digest --type=binlog mysql-bin.000001.sql 分析普通日志:pt-query-digest --type=genlog localhost.log 5.3 數(shù)據(jù)庫備份 備份數(shù)據(jù)庫是最基本的工作,也是最重要的,否則后果很嚴(yán)重,你懂得!但由于數(shù)據(jù)庫比較大,上百G,往往備份都很耗費時間,所以就該選擇一個效率高的備份策略,對于數(shù)據(jù)量大的數(shù)據(jù)庫,一般都采用增量備份。常用的備份工具有mysqldump、mysqlhotcopy、xtrabackup等,mysqldump比較適用于小的數(shù)據(jù)庫,因為是邏輯備份,所以備份和恢復(fù)耗時都比較長。mysqlhotcopy和xtrabackup是物理備份,備份和恢復(fù)速度快,不影響數(shù)據(jù)庫服務(wù)情況下進行熱拷貝,建議使用xtrabackup,支持增量備份。 Xtrabackup備份工具使用博文:http://lizhenliang.blog.51cto.com/7876557/1612800 5.4 數(shù)據(jù)庫修復(fù) 有時候MySQL服務(wù)器突然斷電、異常關(guān)閉,會導(dǎo)致表損壞,無法讀取表數(shù)據(jù)。這時就可以用到MySQL自帶的兩個工具進行修復(fù),myisamchk和mysqlcheck。 myisamchk:只能修復(fù)myisam表,需要停止數(shù)據(jù)庫 常用參數(shù): -f --force 強制修復(fù),覆蓋老的臨時文件,一般不使用 -r --recover 恢復(fù)模式 -q --quik 快速恢復(fù) -a --analyze 分析表 -o --safe-recover 老的恢復(fù)模式,如果-r無法修復(fù),可以使用此參數(shù)試試 -F --fast 只檢查沒有正常關(guān)閉的表 快速修復(fù)weibo數(shù)據(jù)庫: # cd /var/lib/mysql/weibo # myisamchk -r -q *.MYI mysqlcheck:myisam和innodb表都可以用,不需要停止數(shù)據(jù)庫,如修復(fù)單個表,可在數(shù)據(jù)庫后面添加表名,以空格分割 常用參數(shù): -a --all-databases 檢查所有的庫 -r --repair 修復(fù)表 -c --check 檢查表,默認(rèn)選項 -a --analyze 分析表 -o --optimize 優(yōu)化表 -q --quik 最快檢查或修復(fù)表 -F --fast 只檢查沒有正常關(guān)閉的表 快速修復(fù)weibo數(shù)據(jù)庫: mysqlcheck -r -q -uroot -p123 weibo 5.5 另外,查看CPU和I/O性能方法 #查看CPU性能 #參數(shù)-P是顯示CPU數(shù),ALL為所有,也可以只顯示第幾顆CPU #查看I/O性能 #參數(shù)-m是以M單位顯示,默認(rèn)K #%util:當(dāng)達到100%時,說明I/O很忙。 #await:請求在隊列中等待時間,直接影響read時間。 I/O極限:IOPS(r/s+w/s),一般RAID0/10在1200左右。(IOPS,每秒進行讀寫(I/O)操作次數(shù)) I/O帶寬:在順序讀寫模式下SAS硬盤理論值在300M/s左右,SSD硬盤理論值在600M/s左右。 “MySQL/Oracle數(shù)據(jù)庫優(yōu)化方法有哪些”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識可以關(guān)注創(chuàng)新互聯(lián)網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實用文章!
當(dāng)前標(biāo)題:MySQL/Oracle數(shù)據(jù)庫優(yōu)化方法有哪些
網(wǎng)頁URL:http://weahome.cn/article/pojeec.html