軍規適用場(chǎng)景:并發(fā)量大、數據量大的互聯(lián)網(wǎng)業(yè)務(wù)
軍規:介紹內容
解讀:講解原因,解讀比軍規更重要
一、基礎規范
(1)必須使用InnoDB存儲引擎
解讀:支持事務(wù)、行級鎖、并發(fā)性能更好、CPU及內存緩存頁(yè)優(yōu)化使得資源利用率更高
(2)必須使用UTF8字符集
解讀:萬(wàn)國碼,無(wú)需轉碼,無(wú)亂碼風(fēng)險,節省空間
(3)數據表、數據字段必須加入中文注釋
解讀:N年后誰(shuí)tm知道這個(gè)r1,r2,r3字段是干嘛的
(4)禁止使用存儲過(guò)程、視圖、觸發(fā)器、Event
解讀:高并發(fā)大數據的互聯(lián)網(wǎng)業(yè)務(wù),架構設計思路是“解放數據庫CPU,將計算轉移到服務(wù)層”,并發(fā)量大的情況下,這些功能很可能將數據庫拖死,業(yè)務(wù)邏輯放到服務(wù)層具備更好的擴展性,能夠輕易實(shí)現“增機器就加性能”。數據庫擅長(cháng)存儲與索引,CPU計算還是上移吧
(5)禁止存儲大文件或者大照片
解讀:為何要讓數據庫做它不擅長(cháng)的事情?大文件和照片存儲在文件系統,數據庫里存URI多好
二、命名規范
(6)只允許使用內網(wǎng)域名,而不是ip連接數據庫
(7)線(xiàn)上環(huán)境、開(kāi)發(fā)環(huán)境、測試環(huán)境數據庫內網(wǎng)域名遵循命名規范
業(yè)務(wù)名稱(chēng):xxx
線(xiàn)上環(huán)境:dj.xxx.db
開(kāi)發(fā)環(huán)境:dj.xxx.rdb
測試環(huán)境:dj.xxx.tdb
從庫在名稱(chēng)后加-s標識,備庫在名稱(chēng)后加-ss標識
線(xiàn)上從庫:dj.xxx-s.db
線(xiàn)上備庫:dj.xxx-sss.db
(8)庫名、表名、字段名:小寫(xiě),下劃線(xiàn)風(fēng)格,不超過(guò)32個(gè)字符,必須見(jiàn)名知意,禁止拼音英文混用
(9)表名t_xxx,非唯一索引名idx_xxx,唯一索引名uniq_xxx
三、表設計規范
(10)單實(shí)例表數目必須小于500
(11)單表列數目必須小于30
(12)表必須有主鍵,例如自增主鍵
解讀:
a)主鍵遞增,數據行寫(xiě)入可以提高插入性能,可以避免page分裂,減少表碎片提升空間和內存的使用
b)主鍵要選擇較短的數據類(lèi)型, Innodb引擎普通索引都會(huì )保存主鍵的值,較短的數據類(lèi)型可以有效的減少索引的磁盤(pán)空間,提高索引的緩存效率
c) 無(wú)主鍵的表刪除,在row模式的主從架構,會(huì )導致備庫夯住
(13)禁止使用外鍵,如果有外鍵完整性約束,需要應用程序控制
解讀:外鍵會(huì )導致表與表之間耦合,update與delete操作都會(huì )涉及相關(guān)聯(lián)的表,十分影響sql 的性能,甚至會(huì )造成死鎖。高并發(fā)情況下容易造成數據庫性能,大數據高并發(fā)業(yè)務(wù)場(chǎng)景數據庫使用以性能優(yōu)先
四、字段設計規范
(14)必須把字段定義為NOT NULL并且提供默認值
解讀:
a)null的列使索引/索引統計/值比較都更加復雜,對MySQL來(lái)說(shuō)更難優(yōu)化
b)null 這種類(lèi)型MySQL內部需要進(jìn)行特殊處理,增加數據庫處理記錄的復雜性;同等條件下,表中有較多空字段的時(shí)候,數據庫的處理性能會(huì )降低很多
c)null值需要更多的存儲空,無(wú)論是表還是索引中每行中的null的列都需要額外的空間來(lái)標識
d)對null 的處理時(shí)候,只能采用is null或is not null,而不能采用=、in、、<>、!=、not in這些操作符號。如:where name!=’shenjian’,如果存在name為null值的記錄,查詢(xún)結果就不會(huì )包含name為null值的記錄
(15)禁止使用TEXT、BLOB類(lèi)型
解讀:會(huì )浪費更多的磁盤(pán)和內存空間,非必要的大量的大字段查詢(xún)會(huì )淘汰掉熱數據,導致內存命中率急劇降低,影響數據庫性能
(16)禁止使用小數存儲貨幣
解讀:使用整數吧,小數容易導致錢(qián)對不上
(17)必須使用varchar(20)存儲手機號
解讀:
a)涉及到區號或者國家代號,可能出現+-()
b)手機號會(huì )去做數學(xué)運算么?
c)varchar可以支持模糊查詢(xún),例如:like“138%”
(18)禁止使用ENUM,可使用TINYINT代替
解讀:
a)增加新的ENUM值要做DDL操作
b)ENUM的內部實(shí)際存儲就是整數,你以為自己定義的是字符串?
五、索引設計規范
(19)單表索引建議控制在5個(gè)以?xún)?/span>
(20)單索引字段數不允許超過(guò)5個(gè)
解讀:字段超過(guò)5個(gè)時(shí),實(shí)際已經(jīng)起不到有效過(guò)濾數據的作用了
(21)禁止在更新十分頻繁、區分度不高的屬性上建立索引
解讀:
a)更新會(huì )變更B+樹(shù),更新頻繁的字段建立索引會(huì )大大降低數據庫性能
b)“性別”這種區分度不大的屬性,建立索引是沒(méi)有什么意義的,不能有效過(guò)濾數據,性能與全表掃描類(lèi)似
(22)建立組合索引,必須把區分度高的字段放在前面
解讀:能夠更加有效的過(guò)濾數據
六、SQL使用規范
(23)禁止使用SELECT *,只獲取必要的字段,需要顯示說(shuō)明列屬性
解讀:
a)讀取不需要的列會(huì )增加CPU、IO、NET消耗
b)不能有效的利用覆蓋索引
c)使用SELECT *容易在增加或者刪除字段后出現程序BUG
(24)禁止使用INSERT INTO t_xxx VALUES(xxx),必須顯示指定插入的列屬性
解讀:容易在增加或者刪除字段后出現程序BUG
(25)禁止使用屬性隱式轉換
解讀:SELECT uid FROM t_user WHERE phone=13812345678 會(huì )導致全表掃描,而不能命中phone索引,猜猜為什么?(這個(gè)線(xiàn)上問(wèn)題不止出現過(guò)一次)
(26)禁止在WHERE條件的屬性上使用函數或者表達式
解讀:SELECT uid FROM t_user WHERE from_unixtime(day)>='2017-02-15' 會(huì )導致全表掃描
正確的寫(xiě)法是:SELECT uid FROM t_user WHERE day>= unix_timestamp('2017-02-15 00:00:00')
(27)禁止負向查詢(xún),以及%開(kāi)頭的模糊查詢(xún)
解讀:
a)負向查詢(xún)條件:NOT、!=、<>、!、!>、NOT IN、NOT LIKE等,會(huì )導致全表掃描
b)%開(kāi)頭的模糊查詢(xún),會(huì )導致全表掃描
(28)禁止大表使用JOIN查詢(xún),禁止大表使用子查詢(xún)
解讀:會(huì )產(chǎn)生臨時(shí)表,消耗較多內存與CPU,極大影響數據庫性能
(29)禁止使用OR條件,必須改為IN查詢(xún)
解讀:舊版本Mysql的OR查詢(xún)是不能命中索引的,即使能命中索引,為何要讓數據庫耗費更多的CPU幫助實(shí)施查詢(xún)優(yōu)化呢?
(30)應用程序必須捕獲SQL異常,并有相應處理
總結:大數據量高并發(fā)的互聯(lián)網(wǎng)業(yè)務(wù),極大影響數據庫性能的都不讓用,不讓用喲。
==【完】==
自轉到58到家,負責過(guò)較長(cháng)一段時(shí)間DBA部門(mén),搭建團隊,討論流程,討論規范,討論自動(dòng)化,嘗試平臺化,故希望沉淀一些東西。
今天先寫(xiě)到這里,希望大伙有收獲,幫轉喲。
有疑問(wèn)歡迎留言討論。
聯(lián)系客服