infobright數(shù)據(jù)倉(cāng)庫(kù)能在高強(qiáng)度的壓縮中把大量的數(shù)據(jù)壓縮存儲(chǔ),平時(shí)在不斷查詢(xún)的過(guò)程就是在做數(shù)據(jù)解壓的過(guò)程,當(dāng)然具體的詳細(xì)介紹在以前有提過(guò),這里就不做過(guò)程的介紹(https://blog.51cto.com/jim123/1975029)在infobright中支持所有的MySQL原有的數(shù)據(jù)類(lèi)型,其中對(duì)×××的效率會(huì)比其他類(lèi)型高,這一點(diǎn)同MySQL差不多,在infobright中比較高效的類(lèi)型如下:
創(chuàng)新互聯(lián),專(zhuān)注為中小企業(yè)提供官網(wǎng)建設(shè)、營(yíng)銷(xiāo)型網(wǎng)站制作、成都響應(yīng)式網(wǎng)站建設(shè)公司、展示型成都網(wǎng)站設(shè)計(jì)、網(wǎng)站制作等服務(wù),幫助中小企業(yè)通過(guò)網(wǎng)站體現(xiàn)價(jià)值、有效益。幫助企業(yè)快速建站、解決網(wǎng)站建設(shè)與網(wǎng)站營(yíng)銷(xiāo)推廣問(wèn)題。
1、TINYINT,SMALLINT,MEDIUMINT,INT,BIGINT
2、DECIMAL(盡量減少小數(shù)點(diǎn)后的精度)
3、DATE ,TIME
這3種類(lèi)型的數(shù)據(jù)能有比較高的壓縮比例及查詢(xún)速度,而效率比較低的、不推薦使用的數(shù)據(jù)類(lèi)型有這幾種:
1、BINARY VARBINARY(二進(jìn)制類(lèi)型)
2、FLOAT
3、DOUBLE
4、VARCHAR
5、TINYTEXT TEXT(可變長(zhǎng)度的非Unicode類(lèi)型)
這些數(shù)據(jù)類(lèi)型在使用的過(guò)程中效率比較低且壓縮比例并不是很高,其中VARCHAR字段在MySQL中效率就不如CHAR字段,當(dāng)然在某些業(yè)務(wù)場(chǎng)景下可能會(huì)不得不用到CHAR(VARCHAR)的時(shí)候又經(jīng)常需要頻繁的查詢(xún)時(shí),但數(shù)據(jù)的記錄數(shù)又并不是很多時(shí)(不多于10000行,且數(shù)據(jù)的類(lèi)型多于10種以上,類(lèi)似于省份、UUID這類(lèi)的數(shù)據(jù)),就可以通過(guò)comment lookup的方式創(chuàng)建建表時(shí)的DDL來(lái)提高平時(shí)查詢(xún)的效率如下:
#原建表DDL CREATE TABLE `test_default` ( `dstphone` varchar(11) DEFAULT NULL, `gateid` varchar(255) DEFAULT NULL ) ENGINE=BRIGHTHOUSE DEFAULT CHARSET=utf8; #comment lookup建表DDL CREATE TABLE `test_lookup` ( `dstphone` varchar(11) DEFAULT NULL COMMENT 'lookup', `gateid` varchar(255) DEFAULT NULL COMMENT 'lookup' ) ENGINE=BRIGHTHOUSE DEFAULT CHARSET=utf8;
這里需要注意的是comment lookup的方式目前僅有在CHAR(VARCHAR)中能使用,其次在平時(shí)帶來(lái)更高的查詢(xún)效率所帶來(lái)的代價(jià)就是磁盤(pán)開(kāi)銷(xiāo),因?yàn)閕nfobright在平時(shí)查詢(xún)的時(shí)候就是在做解壓的過(guò)程,所以使用comment lookup的方式就是降低壓縮比例,在查詢(xún)的時(shí)候能更快速的解壓數(shù)據(jù),如下可以看出comment lookup的方式同默認(rèn)的建表時(shí)不同的壓縮比例
查詢(xún)效率如下:
可以看相同的數(shù)據(jù)下所占用磁盤(pán)空間,但相應(yīng)的在查詢(xún)記錄不能超過(guò)10000行,不然反而還會(huì)降低其效率:
所以在使用的過(guò)程中還需要根據(jù)實(shí)際情況來(lái)選擇