來源丨經(jīng)授權(quán)轉(zhuǎn)自 小白debug(ID:xiaobaidebug) 作者丨小白 我熟練應(yīng)用ctrl c和ctrl v 開發(fā)curd代碼好多年了。 mysql查詢?yōu)槭裁磿P(guān)于這個問題,在實際開發(fā)經(jīng)常會遇到,而面試中,也是個高頻題。 遇到這種問題,我們一般也會想到是因為索引。 那除開索引之外,還有哪些因素會導(dǎo)致數(shù)據(jù)庫查詢變慢呢? 有哪些操作,可以提升mysql的查詢能力呢? 今天這篇文章,我們就來聊聊會導(dǎo)致數(shù)據(jù)庫查詢變慢的場景有哪些,并給出原因和解決方案。 數(shù)據(jù)庫查詢流程我們先來看下,一條查詢語句下來,會經(jīng)歷哪些流程。 比如我們有一張數(shù)據(jù)庫表 CREATE TABLE `user` ( 我們平常寫的應(yīng)用代碼(go或C++之類的),這時候就叫客戶端了。 客戶端底層會帶著賬號密碼,嘗試向mysql建立一條TCP長鏈接。 mysql的連接管理模塊會對這條連接進行管理。 建立連接后,客戶端執(zhí)行一條查詢sql語句。比如:
客戶端會將sql語句通過網(wǎng)絡(luò)連接給mysql。 mysql收到sql語句后,會在分析器中先判斷下SQL語句有沒有語法錯誤,比如select,如果少打一個 接下來是優(yōu)化器,在這里會根據(jù)一定的規(guī)則選擇該用什么索引。 之后,才是通過執(zhí)行器去調(diào)用存儲引擎的接口函數(shù)。 ![]() 存儲引擎類似于一個個組件,它們才是mysql真正獲取一行行數(shù)據(jù)并返回數(shù)據(jù)的地方,存儲引擎是可以替換更改的,既可以用不支持事務(wù)的MyISAM,也可以替換成支持事務(wù)的Innodb。這個可以在建表的時候指定。比如 CREATE TABLE `user` ( 現(xiàn)在最常用的是InnoDB。 我們就重點說這個。 InnoDB中,因為直接操作磁盤會比較慢,所以加了一層內(nèi)存提提速,叫buffer pool,這里面,放了很多內(nèi)存頁,每一頁16KB,有些內(nèi)存頁放的是數(shù)據(jù)庫表里看到的那種一行行的數(shù)據(jù),有些則是放的索引信息。 ![]() 查詢SQL到了InnoDB中。會根據(jù)前面優(yōu)化器里計算得到的索引,去查詢相應(yīng)的索引頁,如果不在buffer pool里則從磁盤里加載索引頁。再通過索引頁加速查詢,得到數(shù)據(jù)頁的具體位置。如果這些數(shù)據(jù)頁不在buffer pool中,則從磁盤里加載進來。 這樣我們就得到了我們想要的一行行數(shù)據(jù)。 ![]() 最后將得到的數(shù)據(jù)結(jié)果返回給客戶端。 慢查詢分析如果上面的流程比較慢的話,我們可以通過開啟
然后正常執(zhí)行sql語句。 這些SQL語句的執(zhí)行時間都會被記錄下來,此時你想查看有哪些語句被記錄下來了,可以執(zhí)行 mysql> show profiles; 關(guān)注下上面的
通過上面的各個項,大家就可以看到具體耗時在哪。比如從上面可以看出Sending data的耗時最大,這個是指執(zhí)行器開始查詢數(shù)據(jù)并將數(shù)據(jù)發(fā)送給客戶端的耗時,因為我的這張表符合條件的數(shù)據(jù)有好幾萬條,所以這塊耗時最大,也符合預(yù)期。 一般情況下,我們開發(fā)過程中,耗時大部分時候都在 索引相關(guān)原因索引相關(guān)的問題,一般能用explain命令幫助分析。通過它能看到用了哪些索引,大概會掃描多少行之類的信息。 mysql會在優(yōu)化器階段里看下選擇哪個索引,查詢速度會更快。 一般主要考慮幾個因素,比如:
回到show profile中提到的sql語句,我們使用 ![]() 上面的這條語句,使用的 這個是因為數(shù)據(jù)表里,符合條件的數(shù)據(jù)行數(shù)( 當(dāng)然上面只是舉了個例子,實際上,mysql執(zhí)行sql時,不用索引或者用的索引不符合我們預(yù)期這件事經(jīng)常發(fā)生,索引失效的場景有很多,比如用了不等號,隱式轉(zhuǎn)換等,這個相信大家背八股文的時候也背過不少了,我也不再贅述。 聊兩個生產(chǎn)中容易遇到的問題吧。 索引不符合預(yù)期實際開發(fā)中有些情況比較特殊,比如有些數(shù)據(jù)庫表一開始數(shù)據(jù)量小,索引少,執(zhí)行sql時,確實使用了符合你預(yù)期的索引。但隨時時間邊長,開發(fā)的人變多了,數(shù)據(jù)量也變大了,甚至還可能會加入一些其他重復(fù)多余的索引,就有可能出現(xiàn)用著用著,用到了不符合你預(yù)期的其他索引了。從而導(dǎo)致查詢突然變慢。 這種問題,也好解決,可以通過 ![]() 通過 走了索引還是很慢有些sql,用 第一種是索引區(qū)分度太低,比如網(wǎng)頁全路徑的url鏈接,這拿來做索引,一眼看過去全都是同一個域名,如果前綴索引的長度建得不夠長,那這走索引跟走全表掃描似的,正確姿勢是盡量讓索引的區(qū)分度更高,比如域名去掉,只拿后面URI部分去做索引。 ![]() 第二種是索引中匹配到的數(shù)據(jù)太大,這時候需要關(guān)注的是explain里的rows字段了。 它是用于預(yù)估這個查詢語句需要查的行數(shù)的,它不一定完全準確,但可以體現(xiàn)個大概量級。 當(dāng)它很大時,一般常見的是下面幾種情況。
連接數(shù)過小索引相關(guān)的原因我們聊完了,我們來聊聊,除了索引之外,還有哪些因素會限制我們的查詢速度的。 我們可以看到,mysql的server層里有個連接管理,它的作用是管理客戶端和mysql之間的長連接。 正常情況下,客戶端與server層如果只有一條連接,那么在執(zhí)行sql查詢之后,只能阻塞等待結(jié)果返回,如果有大量查詢同時并發(fā)請求,那么后面的請求都需要等待前面的請求執(zhí)行完成后,才能開始執(zhí)行。 ![]() 因此很多時候我們的應(yīng)用程序,比如go或java這些,會打印出sql執(zhí)行了幾分鐘的日志,但實際上你把這條語句單獨拎出來執(zhí)行,卻又是毫秒級別的。這都是因為這些sql語句在等待前面的sql執(zhí)行完成。 怎么解決呢? 如果我們能多建幾條連接,那么請求就可以并發(fā)執(zhí)行,后面的連接就不用等那么久了。 ![]() 而連接數(shù)過小的問題,受數(shù)據(jù)庫和客戶端兩側(cè)同時限制。 數(shù)據(jù)庫連接數(shù)過小Mysql的最大連接數(shù)默認是 可以通過設(shè)置mysql的 mysql> set global max_connections= 500; 上面的操作,就把最大連接數(shù)改成了500。 應(yīng)用側(cè)連接數(shù)過小數(shù)據(jù)庫連接大小是調(diào)整過了,但貌似問題還是沒有變化?還是有很多sql執(zhí)行達到了幾分鐘,甚至超時? 那有可能是因為你應(yīng)用側(cè)(go,java寫的應(yīng)用,也就是mysql的客戶端)的連接數(shù)也過小。 應(yīng)用側(cè)與mysql底層的連接,是基于TCP協(xié)議的長鏈接,而TCP協(xié)議,需要經(jīng)過三次握手和四次揮手來實現(xiàn)建連和釋放。如果我每次執(zhí)行sql都重新建立一個新的連接的話,那就要不斷握手和揮手,這很耗時。所以一般會建立一個長連接池,連接用完之后,塞到連接池里,下次要執(zhí)行sql的時候,再從里面撈一條連接出來用,非常環(huán)保。 ![]() 我們一般寫代碼的時候,都會通過第三方的orm庫來對數(shù)據(jù)庫進行操作,而成熟的orm庫,百分之一千萬都會有個連接池。 而這個連接池,一般會有個大小。這個大小就控制了你的連接數(shù)最大值,如果說你的連接池太小,都還沒有數(shù)據(jù)庫的大,那調(diào)了數(shù)據(jù)庫的最大連接數(shù)也沒啥作用。 一般情況下,可以翻下你使用的orm庫的文檔,看下怎么設(shè)置這個連接池的大小,就幾行代碼的事情,改改就好。比如go語言里的
buffer pool太小連接數(shù)是上去了,速度也提升了。 曾經(jīng)遇到過面試官會追問,有沒有其他辦法可以讓速度更快呢? 那必須要眉頭緊鎖,假裝思考,然后說:有的。 我們在前面的數(shù)據(jù)庫查詢流程里,提到了進了innodb之后,會有一層內(nèi)存buffer pool,用于將磁盤數(shù)據(jù)頁加載到內(nèi)存頁中,只要查詢到buffer pool里有,就可以直接返回,否則就要走磁盤IO,那就慢了。 也就是說,如果我的buffer pool 越大,那我們能放的數(shù)據(jù)頁就越多,相應(yīng)的,sql查詢時就更可能命中buffer pool,那查詢速度自然就更快了。 可以通過下面的命令查詢到buffer pool的大小,單位是 mysql> show global variables like 'innodb_buffer_pool_size'; 也就是 如果想要調(diào)大一點。可以執(zhí)行
這樣就把buffer pool增大到512Mb了。 但是吧,如果buffer pool大小正常,只是別的原因導(dǎo)致的查詢變慢,那改buffer pool毫無意義。 但問題又來了。 怎么知道buffer pool是不是太小了?這個我們可以看buffer pool的緩存命中率。 ![]() 通過
所以buffer pool的命中率就可以這樣得到: buffer pool 命中率 = 1 - (Innodb_buffer_pool_reads/Innodb_buffer_pool_read_requests) * 100% 比如我上面截圖里的就是,1 - (405/2278354) = 99.98%。可以說命中率非常高了。 一般情況下buffer pool命中率都在 當(dāng)然,還可以把這個命中率做到監(jiān)控里,這樣半夜sql變慢了,早上上班還能定位到原因,就很舒服。 還有哪些騷操作?前面提到的是在存儲引擎層里加入了buffer pool用于緩存內(nèi)存頁,這樣可以加速查詢。 那同樣的道理,server層也可以加個緩存,直接將第一次查詢的結(jié)果緩存下來,這樣下次查詢就能立刻返回,聽著挺美的。 按道理,如果命中緩存的話,確實是能為查詢加速的。但這個功能限制很大,其中最大的問題是只要數(shù)據(jù)庫表被更新過,表里面的所有緩存都會失效,數(shù)據(jù)表頻繁的更新,就會帶來頻繁的緩存失效。所以這個功能只適合用于那些不怎么更新的數(shù)據(jù)表。 另外,這個功能在 ![]() 總結(jié)
|
|