1、點擊左上角的英文或者中文連接
創(chuàng)新互聯(lián)建站 - 服務(wù)器托管德陽,四川服務(wù)器租用,成都服務(wù)器租用,四川網(wǎng)通托管,綿陽服務(wù)器托管,德陽服務(wù)器托管,遂寧服務(wù)器托管,綿陽服務(wù)器托管,四川云主機,成都云主機,西南云主機,服務(wù)器托管德陽,西南服務(wù)器托管,四川/成都大帶寬,服務(wù)器機柜,四川老牌IDC服務(wù)商
2、在彈出框中輸入目標數(shù)據(jù)庫信息
3、點擊彈出框左下角測試,成功后點擊確定
千萬級數(shù)據(jù)統(tǒng)計而已。
每天寫表寫兩份。一張現(xiàn)有的總表,一張每天的臨時表,每天定時清空。
統(tǒng)計的數(shù)據(jù),可以寫成一張統(tǒng)計表。在頁面點擊查詢的時候,查的就是這張統(tǒng)計表。
執(zhí)行順序:
適用結(jié)構(gòu)相同的表聯(lián)結(jié)成一張大表
內(nèi)連接:返回兩個表共同的行
左連接:以表 1 為基礎(chǔ),匹配表 2 的相同行
右連接:以表 2 為基礎(chǔ),匹配表 1 的相同行
全連接:返回全部數(shù)據(jù),可以理解為左連接和右連接的結(jié)合
mysql 沒有全連接
常用于組內(nèi)排序,具體寫法如下
窗口函數(shù)可以用 rank 相關(guān)函數(shù)或者聚合函數(shù)
當(dāng)前日期+時間(date + time)函數(shù):now()
當(dāng)前時間戳函數(shù):current_timestamp()
日期或時間轉(zhuǎn)換為字符串 函數(shù):date_format(date,format), time_format(time,format)
lower(str):將字符串參數(shù)值轉(zhuǎn)換為全小寫字母后返回
upper(str):將字符串參數(shù)值轉(zhuǎn)換為全大寫字母后返回
concat(str1, str2,...):將多個字符串參數(shù)首尾相連后返回
concat_ws(separator,str1,str2,...):將多個字符串參數(shù)以給定的分隔符 separator 首尾相連后返回
substr(str,pos):截取從 pos 位置開始到最后的所有 str 字符串
substr(str, pos, len):截取 str 字符串,從 pos 位置開始的 len 個字符
length(str):返回字符串的存儲長度
char_length(str):返回字符串中的字符個數(shù)
format(X,D,locale):以格式 ‘#,###,###.##’ 格式化數(shù)字 X,D 指定小數(shù)位數(shù),locale 指定國家語言(默認的 locale 為 en_US)
left(str, len):返回最左邊的len長度的子串
right(str, len):返回最右邊的len長度的子串
ltrim(str),rtrim(str):去掉字符串的左邊或右邊的空格
repeat(str, count):將字符串 str 重復(fù) count 次后返回
reverse(str):將字符串 str 反轉(zhuǎn)后返回
通俗易懂的學(xué)會:SQL窗口函數(shù)
mysql format時間格式化說明
MySQL常用字符串函數(shù)
一、MySQL數(shù)據(jù)庫有幾個配置選項可以幫助我們及時捕獲低效SQL語句\x0d\x0a\x0d\x0a1,slow_query_log\x0d\x0a這個參數(shù)設(shè)置為ON,可以捕獲執(zhí)行時間超過一定數(shù)值的SQL語句。\x0d\x0a\x0d\x0a2,long_query_time\x0d\x0a當(dāng)SQL語句執(zhí)行時間超過此數(shù)值時,就會被記錄到日志中,建議設(shè)置為1或者更短。\x0d\x0a\x0d\x0a3,slow_query_log_file\x0d\x0a記錄日志的文件名。\x0d\x0a\x0d\x0a4,log_queries_not_using_indexes\x0d\x0a這個參數(shù)設(shè)置為ON,可以捕獲到所有未使用索引的SQL語句,盡管這個SQL語句有可能執(zhí)行得挺快。\x0d\x0a\x0d\x0a二、檢測mysql中sql語句的效率的方法\x0d\x0a\x0d\x0a1、通過查詢?nèi)罩綷x0d\x0a(1)、Windows下開啟MySQL慢查詢\x0d\x0aMySQL在Windows系統(tǒng)中的配置文件一般是是my.ini找到[mysqld]下面加上\x0d\x0a代碼如下\x0d\x0alog-slow-queries = F:/MySQL/log/mysqlslowquery。log\x0d\x0along_query_time = 2\x0d\x0a\x0d\x0a(2)、Linux下啟用MySQL慢查詢\x0d\x0aMySQL在Windows系統(tǒng)中的配置文件一般是是my.cnf找到[mysqld]下面加上\x0d\x0a代碼如下\x0d\x0alog-slow-queries=/data/mysqldata/slowquery。log\x0d\x0along_query_time=2\x0d\x0a說明\x0d\x0alog-slow-queries = F:/MySQL/log/mysqlslowquery。\x0d\x0a為慢查詢?nèi)罩敬娣诺奈恢?,一般這個目錄要有MySQL的運行帳號的可寫權(quán)限,一般都將這個目錄設(shè)置為MySQL的數(shù)據(jù)存放目錄;\x0d\x0along_query_time=2中的2表示查詢超過兩秒才記錄;\x0d\x0a\x0d\x0a2.show processlist 命令\x0d\x0a\x0d\x0aSHOW PROCESSLIST顯示哪些線程正在運行。您也可以使用mysqladmin processlist語句得到此信息。\x0d\x0a各列的含義和用途:\x0d\x0aID列\(zhòng)x0d\x0a一個標識,你要kill一個語句的時候很有用,用命令殺掉此查詢 /*/mysqladmin kill 進程號。\x0d\x0auser列\(zhòng)x0d\x0a顯示單前用戶,如果不是root,這個命令就只顯示你權(quán)限范圍內(nèi)的sql語句。\x0d\x0ahost列\(zhòng)x0d\x0a顯示這個語句是從哪個ip的哪個端口上發(fā)出的。用于追蹤出問題語句的用戶。\x0d\x0adb列\(zhòng)x0d\x0a顯示這個進程目前連接的是哪個數(shù)據(jù)庫。\x0d\x0acommand列\(zhòng)x0d\x0a顯示當(dāng)前連接的執(zhí)行的命令,一般就是休眠(sleep),查詢(query),連接(connect)。\x0d\x0atime列\(zhòng)x0d\x0a此這個狀態(tài)持續(xù)的時間,單位是秒。\x0d\x0astate列\(zhòng)x0d\x0a顯示使用當(dāng)前連接的sql語句的狀態(tài),很重要的列,后續(xù)會有所有的狀態(tài)的描述,請注意,state只是語句執(zhí)行中的某一個狀態(tài),一個 sql語句,以查詢?yōu)槔?,可能需要?jīng)過copying to tmp table,Sorting result,Sending data等狀態(tài)才可以完成\x0d\x0ainfo列\(zhòng)x0d\x0a顯示這個sql語句,因為長度有限,所以長的sql語句就顯示不全,但是一個判斷問題語句的重要依據(jù)。\x0d\x0a\x0d\x0a這個命令中最關(guān)鍵的就是state列,mysql列出的狀態(tài)主要有以下幾種:\x0d\x0aChecking table\x0d\x0a 正在檢查數(shù)據(jù)表(這是自動的)。\x0d\x0aClosing tables\x0d\x0a 正在將表中修改的數(shù)據(jù)刷新到磁盤中,同時正在關(guān)閉已經(jīng)用完的表。這是一個很快的操作,如果不是這樣的話,就應(yīng)該確認磁盤空間是否已經(jīng)滿了或者磁盤是否正處于重負中。\x0d\x0aConnect Out\x0d\x0a 復(fù)制從服務(wù)器正在連接主服務(wù)器。\x0d\x0a\x0d\x0aCopying to tmp table on disk\x0d\x0a 由于臨時結(jié)果集大于tmp_table_size,正在將臨時表從內(nèi)存存儲轉(zhuǎn)為磁盤存儲以此節(jié)省內(nèi)存。\x0d\x0aCreating tmp table\x0d\x0a 正在創(chuàng)建臨時表以存放部分查詢結(jié)果。\x0d\x0adeleting from main table\x0d\x0a 服務(wù)器正在執(zhí)行多表刪除中的第一部分,剛刪除第一個表。\x0d\x0adeleting from reference tables\x0d\x0a 服務(wù)器正在執(zhí)行多表刪除中的第二部分,正在刪除其他表的記錄。\x0d\x0a\x0d\x0aFlushing tables\x0d\x0a 正在執(zhí)行FLUSH TABLES,等待其他線程關(guān)閉數(shù)據(jù)表。\x0d\x0aKilled\x0d\x0a 發(fā)送了一個kill請求給某線程,那么這個線程將會檢查kill標志位,同時會放棄下一個kill請求。MySQL會在每次的主循環(huán)中檢查kill標志位,不過有些情況下該線程可能會過一小段才能死掉。如果該線程程被其他線程鎖住了,那么kill請求會在鎖釋放時馬上生效。\x0d\x0aLocked\x0d\x0a 被其他查詢鎖住了。\x0d\x0aSending data\x0d\x0a 正在處理SELECT查詢的記錄,同時正在把結(jié)果發(fā)送給客戶端。\x0d\x0a\x0d\x0aSorting for group\x0d\x0a 正在為GROUP BY做排序。\x0d\x0a Sorting for order\x0d\x0a 正在為ORDER BY做排序。\x0d\x0aOpening tables\x0d\x0a 這個過程應(yīng)該會很快,除非受到其他因素的干擾。例如,在執(zhí)ALTER TABLE或LOCK TABLE語句行完以前,數(shù)據(jù)表無法被其他線程打開。正嘗試打開一個表。\x0d\x0aRemoving duplicates\x0d\x0a 正在執(zhí)行一個SELECT DISTINCT方式的查詢,但是MySQL無法在前一個階段優(yōu)化掉那些重復(fù)的記錄。因此,MySQL需要再次去掉重復(fù)的記錄,然后再把結(jié)果發(fā)送給客戶端。\x0d\x0a\x0d\x0aReopen table\x0d\x0a 獲得了對一個表的鎖,但是必須在表結(jié)構(gòu)修改之后才能獲得這個鎖。已經(jīng)釋放鎖,關(guān)閉數(shù)據(jù)表,正嘗試重新打開數(shù)據(jù)表。\x0d\x0aRepair by sorting\x0d\x0a 修復(fù)指令正在排序以創(chuàng)建索引。\x0d\x0aRepair with keycache\x0d\x0a 修復(fù)指令正在利用索引緩存一個一個地創(chuàng)建新索引。它會比Repair by sorting慢些。\x0d\x0aSearching rows for update\x0d\x0a 正在講符合條件的記錄找出來以備更新。它必須在UPDATE要修改相關(guān)的記錄之前就完成了。\x0d\x0aSleeping\x0d\x0a 正在等待客戶端發(fā)送新請求.\x0d\x0a\x0d\x0aSystem lock\x0d\x0a 正在等待取得一個外部的系統(tǒng)鎖。如果當(dāng)前沒有運行多個mysqld服務(wù)器同時請求同一個表,那么可以通過增加--skip-external-locking參數(shù)來禁止外部系統(tǒng)鎖。\x0d\x0aUpgrading lock\x0d\x0a INSERT DELAYED正在嘗試取得一個鎖表以插入新記錄。\x0d\x0aUpdating\x0d\x0a 正在搜索匹配的記錄,并且修改它們。\x0d\x0a\x0d\x0aUser Lock\x0d\x0a 正在等待GET_LOCK()。\x0d\x0aWaiting for tables\x0d\x0a 該線程得到通知,數(shù)據(jù)表結(jié)構(gòu)已經(jīng)被修改了,需要重新打開數(shù)據(jù)表以取得新的結(jié)構(gòu)。然后,為了能的重新打開數(shù)據(jù)表,必須等到所有其他線程關(guān)閉這個表。以下幾種情況下會產(chǎn)生這個通知:FLUSH TABLES tbl_name, ALTER TABLE, RENAME TABLE, REPAIR TABLE, ANALYZE TABLE,或OPTIMIZE TABLE。\x0d\x0awaiting for handler insert\x0d\x0a INSERT DELAYED已經(jīng)處理完了所有待處理的插入操作,正在等待新的請求。\x0d\x0a 大部分狀態(tài)對應(yīng)很快的操作,只要有一個線程保持同一個狀態(tài)好幾秒鐘,那么可能是有問題發(fā)生了,需要檢查一下。\x0d\x0a 還有其他的狀態(tài)沒在上面中列出來,不過它們大部分只是在查看服務(wù)器是否有存在錯誤是才用得著。\x0d\x0a\x0d\x0a例如如圖:\x0d\x0a\x0d\x0a3、explain來了解SQL執(zhí)行的狀態(tài)\x0d\x0aexplain顯示了mysql如何使用索引來處理select語句以及連接表??梢詭椭x擇更好的索引和寫出更優(yōu)化的查詢語句。\x0d\x0a使用方法,在select語句前加上explain就可以了:\x0d\x0a例如:\x0d\x0aexplain select surname,first_name form a,b where a.id=b.id\x0d\x0a結(jié)果如圖\x0d\x0a\x0d\x0aEXPLAIN列的解釋\x0d\x0atable\x0d\x0a顯示這一行的數(shù)據(jù)是關(guān)于哪張表的\x0d\x0atype\x0d\x0a這是重要的列,顯示連接使用了何種類型。從最好到最差的連接類型為const、eq_reg、ref、range、indexhe和ALL\x0d\x0apossible_keys\x0d\x0a顯示可能應(yīng)用在這張表中的索引。如果為空,沒有可能的索引??梢詾橄嚓P(guān)的域從WHERE語句中選擇一個合適的語句\x0d\x0akey\x0d\x0a實際使用的索引。如果為NULL,則沒有使用索引。很少的情況下,MYSQL會選擇優(yōu)化不足的索引。這種情況下,可以在SELECT語句 中使用USE INDEX(indexname)來強制使用一個索引或者用IGNORE INDEX(indexname)來強制MYSQL忽略索引\x0d\x0akey_len\x0d\x0a使用的索引的長度。在不損失精確性的情況下,長度越短越好\x0d\x0aref\x0d\x0a顯示索引的哪一列被使用了,如果可能的話,是一個常數(shù)\x0d\x0arows\x0d\x0aMYSQL認為必須檢查的用來返回請求數(shù)據(jù)的行數(shù)\x0d\x0aExtra\x0d\x0a關(guān)于MYSQL如何解析查詢的額外信息。將在表4.3中討論,但這里可以看到的壞的例子是Using temporary和Using filesort,意思MYSQL根本不能使用索引,結(jié)果是檢索會很慢\x0d\x0a\x0d\x0aextra列返回的描述的意義\x0d\x0aDistinct\x0d\x0a一旦MYSQL找到了與行相聯(lián)合匹配的行,就不再搜索了\x0d\x0aNot exists\x0d\x0aMYSQL優(yōu)化了LEFT JOIN,一旦它找到了匹配LEFT JOIN標準的行,就不再搜索了\x0d\x0aRange checked for each Record(index map:#)\x0d\x0a沒有找到理想的索引,因此對于從前面表中來的每一個行組合,MYSQL檢查使用哪個索引,并用它來從表中返回行。這是使用索引的最慢的連接之一\x0d\x0aUsing filesort\x0d\x0a看到這個的時候,查詢就需要優(yōu)化了。MYSQL需要進行額外的步驟來發(fā)現(xiàn)如何對返回的行排序。它根據(jù)連接類型以及存儲排序鍵值和匹配條件的全部行的行指針來排序全部行\(zhòng)x0d\x0aUsing index\x0d\x0a列數(shù)據(jù)是從僅僅使用了索引中的信息而沒有讀取實際的行動的表返回的,這發(fā)生在對表的全部的請求列都是同一個索引的部分的時候\x0d\x0aUsing temporary\x0d\x0a看到這個的時候,查詢需要優(yōu)化了。這里,MYSQL需要創(chuàng)建一個臨時表來存儲結(jié)果,這通常發(fā)生在對不同的列集進行ORDER BY上,而不是GROUP BY上\x0d\x0aWhere used\x0d\x0a使用了WHERE從句來限制哪些行將與下一張表匹配或者是返回給用戶。如果不想返回表中的全部行,并且連接類型ALL或index,這就會發(fā)生,或者是查詢有問題不同連接類型的解釋(按照效率高低的順序排序)\x0d\x0aconst\x0d\x0a表中的一個記錄的最大值能夠匹配這個查詢(索引可以是主鍵或惟一索引)。因為只有一行,這個值實際就是常數(shù),因為MYSQL先讀這個值然后把它當(dāng)做常數(shù)來對待\x0d\x0aeq_ref\x0d\x0a在連接中,MYSQL在查詢時,從前面的表中,對每一個記錄的聯(lián)合都從表中讀取一個記錄,它在查詢使用了索引為主鍵或惟一鍵的全部時使用\x0d\x0aref\x0d\x0a這個連接類型只有在查詢使用了不是惟一或主鍵的鍵或者是這些類型的部分(比如,利用最左邊前綴)時發(fā)生。對于之前的表的每一個行聯(lián)合,全部記錄都將從表中讀出。這個類型嚴重依賴于根據(jù)索引匹配的記錄多少—越少越好\x0d\x0arange\x0d\x0a這個連接類型使用索引返回一個范圍中的行,比如使用或
回答于?2022-11-16
Pandas是Python下一個開源數(shù)據(jù)分析的庫,它提供的數(shù)據(jù)結(jié)構(gòu)DataFrame極大的簡化了數(shù)據(jù)分析過程中一些繁瑣操作。
1. 基本使用:創(chuàng)建DataFrame. DataFrame是一張二維的表,大家可以把它想象成一張Excel表單或者Sql表。Excel 2007及其以后的版本的最大行數(shù)是1048576,最大列數(shù)是16384,超過這個規(guī)模的數(shù)據(jù)Excel就會彈出個框框“此文本包含多行文本,無法放置在一個工作表中”。Pandas處理上千萬的數(shù)據(jù)是易如反掌的sh事情,同時隨后我們也將看到它比SQL有更強的表達能力,可以做很多復(fù)雜的操作,要寫的code也更少。
說了一大堆它的好處,要實際感觸還得動手碼代碼。首要的任務(wù)就是創(chuàng)建一個DataFrame,它有幾種創(chuàng)建方式:
(1)列表,序列(pandas.Series), numpy.ndarray的字典
二維numpy.ndarray
別的DataFrame
結(jié)構(gòu)化的記錄(structured arrays)
(2)其中,二維ndarray創(chuàng)建DataFrame,代碼敲得最少:
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(10, 4))
df
0 1 2 3
0 0.927474 0.127571 1.655908 0.570818
1 -0.425084 -0.382933 0.468073 -0.862898
2 -1.602712 -0.225793 -0.688641 1.167477
3 -1.771992 -0.692575 -0.693494 -1.063697
4 -0.456724 0.371165 1.883742 -0.344189
5 1.024734 0.647224 1.134449 0.266797
6 1.247507 0.114464 2.271932 -0.682767
7 -0.190627 -0.096997 -0.204778 -0.440155
8 -0.471289 -1.025644 -0.741181 -1.707240
9 -0.172242 0.702187 -1.138795 -0.112005
(3)通過describe方法,可以對df中的數(shù)據(jù)有個大概的了解:
df.describe()
0 1 2 3
count 10.000000 10.000000 10.000000 10.000000
mean -0.189096 -0.046133 0.394722 -0.320786
std 1.027134 0.557420 1.258019 0.837497
min -1.771992 -1.025644 -1.138795 -1.707240
25% -0.467648 -0.343648 -0.692281 -0.817865
50% -0.307856 0.008734 0.131648 -0.392172
75% 0.652545 0.310266 1.525543 0.172096
max 1.247507 0.702187 2.271932 1.167477
2. 改變cell。
3. group by。
4. 讀寫文件。
mysql數(shù)據(jù)庫有undo空間
5種mysql做可靠性分析的方案:
1.MySQL Clustering(ndb-cluster stogare)
簡介:
MySQL公司以存儲引擎方式提供的高可靠性方案,是事務(wù)安全的,實時復(fù)制數(shù)據(jù),可用于需要高可靠性及負載均衡的場合。該方案至少需要三個節(jié)點服務(wù)器才能達到較好的效果。
成本:
節(jié)點服務(wù)器對RAM的需求很大,與數(shù)據(jù)庫大小呈線性比例;
最好使用千兆以太網(wǎng)絡(luò);
還需要使用Dolphin公司提供的昂貴的SCI卡。
優(yōu)點:
可用于負載均衡場合;
可用于高可靠性場合;
高伸縮性;
真正的數(shù)據(jù)庫冗余;
容易維護。
缺點:
隨著數(shù)據(jù)庫的變大,對RAM的需求變得更大,因此成本很高;
速度:
幾乎 比典型的單獨服務(wù)器(無千兆以太網(wǎng),無SCI卡,存儲引擎相關(guān)的限制少)慢10倍。
應(yīng)用場合:
冗余,高可靠性,負載均衡
2. MySQL / GFS-GNBD/ HA (Active/Passive)
簡介:
如果多個MySQL服務(wù)器使用共享硬盤作為數(shù)據(jù)存儲,此方案如何?
GFS/GNBD可以提供所需的共享硬盤。
GFS是事務(wù)安全的文件系統(tǒng)。同一時刻你可以讓一個MySQL使用共享數(shù)據(jù)。
成本:
最多n臺高性能服務(wù)器的成本,其中一個激活的,其他作為備份服務(wù)器。
優(yōu)點:
高可靠性
某種程度的冗余
按照高可靠性進行伸縮
缺點:
沒有負載均衡
沒有保證的冗余
無法對寫操作進行伸縮
速度:
單獨服務(wù)器的2倍。對讀操作支持得較好。
應(yīng)用場合:
需要高可靠性的、讀操作密集型的應(yīng)用
3. MySQL / DRBD / HA (Active/Passive)
簡介:
如果多個MySQL服務(wù)器使用共享硬盤作為數(shù)據(jù)存儲,此方案如何?
DRBD可以提供這樣的共享硬盤。DRBD可以被設(shè)置成事務(wù)安全的。
同一時刻你可以讓一個MySQL使用共享數(shù)據(jù)。
成本:
最多n臺高性能服務(wù)器的成本,其中一個激活的,而其他則作為備份服務(wù)器。
優(yōu)點:
高可靠性;
一定程度的冗余;
以高可靠性名義來看是可伸縮的。
缺點:
沒有負載均衡
沒有保證的冗余
在寫負載方面沒有伸縮性
速度:
在讀寫方面相當(dāng)于單獨服務(wù)器
應(yīng)用場合
需要高可靠性、讀操作密集型的應(yīng)用
4. MySQL Write Master / Multiple MySQL Read Slaves (Active/Active)
簡介:
考慮不同的讀、寫DB數(shù)據(jù)庫連接的情況??梢允褂靡慌_主服務(wù)器用于寫操作,而采用n臺從服務(wù)器用于讀操作。
成本:
最多1臺高性能寫服務(wù)器,n臺讀服務(wù)器的成本
優(yōu)點:
讀操作的高可靠性;
讀操作的負載均衡;
在讀操作負載均衡方面是可伸縮的。
缺點:
無寫操作的高可靠性;
無寫操作的負載均衡;
在寫操作方面無伸縮性;
速度:
同單獨服務(wù)器;在讀操作方面支持得較好
應(yīng)用場合
讀操作密集型的、需要高可靠性和負載均衡的應(yīng)用。
5. Standalone MySQL Servers(Functionally separated) (Active)
多臺功能分離的單獨服務(wù)器,沒有高可靠性、負載均衡能力,明顯缺點太多,不予考慮。