婷婷色香五月综合激情_ [轉]MySQL索引優(yōu)化

文章分類(lèi):數據庫

寫(xiě)在前面：索引對查詢(xún)的速度有著(zhù)至關(guān)重要的影響，理解索引也是進(jìn)行數據庫性能調優(yōu)的起點(diǎn)?？紤]如下情況，假設數據庫中一個(gè)表有10^6條記錄，DBMS的頁(yè)面大小為4K，并存儲100條記錄。如果沒(méi)有索引，查詢(xún)將對整個(gè)表進(jìn)行掃描，最壞的情況下，如果所有數據頁(yè)都不在內存，需要讀取10^4 個(gè)頁(yè)面，如果這10^4個(gè)頁(yè)面在磁盤(pán)上隨機分布，需要進(jìn)行10^4次I/O，假設磁盤(pán)每次I/O時(shí)間為10ms(忽略數據傳輸時(shí)間)，則總共需要 100s(但實(shí)際上要好很多很多)。如果對之建立B-Tree索引，則只需要進(jìn)行log100(10^6)=3次頁(yè)面讀取，最壞情況下耗時(shí)30ms。這就是索引帶來(lái)的效果，很多時(shí)候，當你的應用程序進(jìn)行SQL查詢(xún)速度很慢時(shí)，應該想想是否可以建索引。進(jìn)入正題：

第二章、索引與優(yōu)化

1、選擇索引的數據類(lèi)型

MySQL支持很多數據類(lèi)型，選擇合適的數據類(lèi)型存儲數據對性能有很大的影響。通常來(lái)說(shuō)，可以遵循以下一些指導原則：

(1)越小的數據類(lèi)型通常更好：越小的數據類(lèi)型通常在磁盤(pán)、內存和CPU緩存中都需要更少的空間，處理起來(lái)更快。
(2)簡(jiǎn)單的數據類(lèi)型更好：整型數據比起字符，處理開(kāi)銷(xiāo)更小，因為字符串的比較更復雜。在MySQL中，應該用內置的日期和時(shí)間數據類(lèi)型，而不是用字符串來(lái)存儲時(shí)間；以及用整型數據類(lèi)型存儲IP地址。
(3)盡量避免NULL：應該指定列為NOT NULL，除非你想存儲NULL。在MySQL中，含有空值的列很難進(jìn)行查詢(xún)優(yōu)化，因為它們使得索引、索引的統計信息以及比較運算更加復雜。你應該用0、一個(gè)特殊的值或者一個(gè)空串代替空值。

1.1、選擇標識符
選擇合適的標識符是非常重要的。選擇時(shí)不僅應該考慮存儲類(lèi)型，而且應該考慮MySQL是怎樣進(jìn)行運算和比較的。一旦選定數據類(lèi)型，應該保證所有相關(guān)的表都使用相同的數據類(lèi)型。
(1)   整型：通常是作為標識符的最好選擇，因為可以更快的處理，而且可以設置為AUTO_INCREMENT。

(2)   字符串：盡量避免使用字符串作為標識符，它們消耗更好的空間，處理起來(lái)也較慢。而且，通常來(lái)說(shuō)，字符串都是隨機的，所以它們在索引中的位置也是隨機的，這會(huì )導致頁(yè)面分裂、隨機訪(fǎng)問(wèn)磁盤(pán)，聚簇索引分裂（對于使用聚簇索引的存儲引擎）。

2、索引入門(mén)
對于任何DBMS，索引都是進(jìn)行優(yōu)化的最主要的因素。對于少量的數據，沒(méi)有合適的索引影響不是很大，但是，當隨著(zhù)數據量的增加，性能會(huì )急劇下降。
如果對多列進(jìn)行索引(組合索引)，列的順序非常重要，MySQL僅能對索引最左邊的前綴進(jìn)行有效的查找。例如：
假設存在組合索引it1c1c2(c1,c2)，查詢(xún)語(yǔ)句select * from t1 where c1=1 and c2=2能夠使用該索引。查詢(xún)語(yǔ)句select * from t1 where c1=1也能夠使用該索引。但是，查詢(xún)語(yǔ)句select * from t1 where c2=2不能夠使用該索引，因為沒(méi)有組合索引的引導列，即，要想使用c2列進(jìn)行查找，必需出現c1等于某值。

2.1、索引的類(lèi)型
索引是在存儲引擎中實(shí)現的，而不是在服務(wù)器層中實(shí)現的。所以，每種存儲引擎的索引都不一定完全相同，并不是所有的存儲引擎都支持所有的索引類(lèi)型。
2.1.1、B-Tree索引
假設有如下一個(gè)表：

CREATE TABLE People (

   last_name varchar(50)    not null,

   first_name varchar(50)    not null,

   dob        date           not null,

   gender     enum('m', 'f') not null,

   key(last_name, first_name, dob)

);

其索引包含表中每一行的last_name、first_name和dob列。其結構大致如下：

索引存儲的值按索引列中的順序排列?？梢岳肂-Tree索引進(jìn)行全關(guān)鍵字、關(guān)鍵字范圍和關(guān)鍵字前綴查詢(xún)，當然，如果想使用索引，你必須保證按索引的最左邊前綴(leftmost prefix of the index)來(lái)進(jìn)行查詢(xún)。
(1)匹配全值(Match the full value)：對索引中的所有列都指定具體的值。例如，上圖中索引可以幫助你查找出生于1960-01-01的Cuba Allen。
(2)匹配最左前綴(Match a leftmost prefix)：你可以利用索引查找last name為Allen的人，僅僅使用索引中的第1列。
(3)匹配列前綴(Match a column prefix)：例如，你可以利用索引查找last name以J開(kāi)始的人，這僅僅使用索引中的第1列。
(4)匹配值的范圍查詢(xún)(Match a range of values)：可以利用索引查找last name在A(yíng)llen和Barrymore之間的人，僅僅使用索引中第1列。
(5)匹配部分精確而其它部分進(jìn)行范圍匹配(Match one part exactly and match a range on another part)：可以利用索引查找last name為Allen，而first name以字母K開(kāi)始的人。
(6)僅對索引進(jìn)行查詢(xún)(Index-only queries)：如果查詢(xún)的列都位于索引中，則不需要讀取元組的值。
由于B-樹(shù)中的節點(diǎn)都是順序存儲的，所以可以利用索引進(jìn)行查找(找某些值)，也可以對查詢(xún)結果進(jìn)行ORDER BY。當然，使用B-tree索引有以下一些限制：
(1) 查詢(xún)必須從索引的最左邊的列開(kāi)始。關(guān)于這點(diǎn)已經(jīng)提了很多遍了。例如你不能利用索引查找在某一天出生的人。
(2) 不能跳過(guò)某一索引列。例如，你不能利用索引查找last name為Smith且出生于某一天的人。
(3) 存儲引擎不能使用索引中范圍條件右邊的列。例如，如果你的查詢(xún)語(yǔ)句為WHERE last_name="Smith" AND first_name LIKE 'J%' AND dob='1976-12-23'，則該查詢(xún)只會(huì )使用索引中的前兩列，因為L(cháng)IKE是范圍查詢(xún)。

2.1.2、Hash索引
MySQL 中，只有Memory存儲引擎顯示支持hash索引，是Memory表的默認索引類(lèi)型，盡管Memory表也可以使用B-Tree索引。Memory存儲引擎支持非唯一hash索引，這在數據庫領(lǐng)域是罕見(jiàn)的，如果多個(gè)值有相同的hash code，索引把它們的行指針用鏈表保存到同一個(gè)hash表項中。
假設創(chuàng )建如下一個(gè)表：
CREATE TABLE testhash (
fname VARCHAR(50) NOT NULL,
lname VARCHAR(50) NOT NULL,
KEY USING HASH(fname)
) ENGINE=MEMORY;
包含的數據如下：

假設索引使用hash函數f( )，如下：

f('Arjen') = 2323

f('Baron') = 7437

f('Peter') = 8784

f('Vadim') = 2458

此時(shí)，索引的結構大概如下：

Slots是有序的，但是記錄不是有序的。當你執行
mysql> SELECT lname FROM testhash WHERE fname='Peter';
MySQL會(huì )計算’Peter’的hash值，然后通過(guò)它來(lái)查詢(xún)索引的行指針。因為f('Peter') = 8784，MySQL會(huì )在索引中查找8784，得到指向記錄3的指針。
因為索引自己僅僅存儲很短的值，所以，索引非常緊湊。Hash值不取決于列的數據類(lèi)型，一個(gè)TINYINT列的索引與一個(gè)長(cháng)字符串列的索引一樣大。

Hash索引有以下一些限制：
(1)由于索引僅包含hash code和記錄指針，所以，MySQL不能通過(guò)使用索引避免讀取記錄。但是訪(fǎng)問(wèn)內存中的記錄是非常迅速的，不會(huì )對性造成太大的影響。
(2)不能使用hash索引排序。
(3)Hash索引不支持鍵的部分匹配，因為是通過(guò)整個(gè)索引值來(lái)計算hash值的。
(4)Hash索引只支持等值比較，例如使用=，IN( )和<=>。對于WHERE price>100并不能加速查詢(xún)。
2.1.3、空間(R-Tree)索引
MyISAM支持空間索引，主要用于地理空間數據類(lèi)型，例如GEOMETRY。
2.1.4、全文(Full-text)索引
全文索引是MyISAM的一個(gè)特殊索引類(lèi)型，主要用于全文檢索。

3、高性能的索引策略
3.1、聚簇索引(Clustered Indexes)
聚簇索引保證關(guān)鍵字的值相近的元組存儲的物理位置也相同（所以字符串類(lèi)型不宜建立聚簇索引，特別是隨機字符串，會(huì )使得系統進(jìn)行大量的移動(dòng)操作），且一個(gè)表只能有一個(gè)聚簇索引。因為由存儲引擎實(shí)現索引，所以，并不是所有的引擎都支持聚簇索引。目前，只有solidDB和InnoDB支持。
聚簇索引的結構大致如下：

注：葉子頁(yè)面包含完整的元組，而內節點(diǎn)頁(yè)面僅包含索引的列(索引的列為整型)。一些DBMS允許用戶(hù)指定聚簇索引，但是MySQL的存儲引擎到目前為止都不支持。InnoDB對主鍵建立聚簇索引。如果你不指定主鍵，InnoDB會(huì )用一個(gè)具有唯一且非空值的索引來(lái)代替。如果不存在這樣的索引，InnoDB會(huì )定義一個(gè)隱藏的主鍵，然后對其建立聚簇索引。一般來(lái)說(shuō)，DBMS都會(huì )以聚簇索引的形式來(lái)存儲實(shí)際的數據，它是其它二級索引的基礎。

3.1.1、InnoDB和MyISAM的數據布局的比較
為了更加理解聚簇索引和非聚簇索引，或者primary索引和second索引(MyISAM不支持聚簇索引)，來(lái)比較一下InnoDB和MyISAM的數據布局，對于如下表：

CREATE TABLE layout_test (

   col1 int NOT NULL,

   col2 int NOT NULL,

   PRIMARY KEY(col1),

   KEY(col2)

);

假設主鍵的值位于1---10,000之間，且按隨機順序插入，然后用OPTIMIZE TABLE進(jìn)行優(yōu)化。col2隨機賦予1---100之間的值，所以會(huì )存在許多重復的值。
(1)   MyISAM的數據布局
其布局十分簡(jiǎn)單，MyISAM按照插入的順序在磁盤(pán)上存儲數據，如下：

注：左邊為行號(row number)，從0開(kāi)始。因為元組的大小固定，所以MyISAM可以很容易的從表的開(kāi)始位置找到某一字節的位置。
據些建立的primary key的索引結構大致如下：

注：MyISAM不支持聚簇索引，索引中每一個(gè)葉子節點(diǎn)僅僅包含行號(row number)，且葉子節點(diǎn)按照col1的順序存儲。
來(lái)看看col2的索引結構：

實(shí)際上，在MyISAM中，primary key和其它索引沒(méi)有什么區別。Primary key僅僅只是一個(gè)叫做PRIMARY的唯一，非空的索引而已。

(2)   InnoDB的數據布局
InnoDB按聚簇索引的形式存儲數據，所以它的數據布局有著(zhù)很大的不同。它存儲表的結構大致如下：

注：聚簇索引中的每個(gè)葉子節點(diǎn)包含primary key的值，事務(wù)ID和回滾指針(rollback pointer)——用于事務(wù)和MVCC，和余下的列(如col2)。

相對于MyISAM，二級索引與聚簇索引有很大的不同。InnoDB的二級索引的葉子包含primary key的值，而不是行指針(row pointers)，這減小了移動(dòng)數據或者數據頁(yè)面分裂時(shí)維護二級索引的開(kāi)銷(xiāo)，因為InnoDB不需要更新索引的行指針。其結構大致如下：

聚簇索引和非聚簇索引表的對比：

3.1.2、按primary key的順序插入行(InnoDB)

如果你用InnoDB，而且不需要特殊的聚簇索引，一個(gè)好的做法就是使用代理主鍵(surrogate key)——獨立于你的應用中的數據。最簡(jiǎn)單的做法就是使用一個(gè)AUTO_INCREMENT的列，這會(huì )保證記錄按照順序插入，而且能提高使用 primary key進(jìn)行連接的查詢(xún)的性能。應該盡量避免隨機的聚簇主鍵，例如，字符串主鍵就是一個(gè)不好的選擇，它使得插入操作變得隨機。

3.2、覆蓋索引(Covering Indexes)
如果索引包含滿(mǎn)足查詢(xún)的所有數據，就稱(chēng)為覆蓋索引。覆蓋索引是一種非常強大的工具，能大大提高查詢(xún)性能。只需要讀取索引而不用讀取數據有以下一些優(yōu)點(diǎn)：
(1)索引項通常比記錄要小，所以MySQL訪(fǎng)問(wèn)更少的數據；
(2)索引都按值的大小順序存儲，相對于隨機訪(fǎng)問(wèn)記錄，需要更少的I/O；
(3)大多數據引擎能更好的緩存索引。比如MyISAM只緩存索引。
(4)覆蓋索引對于InnoDB表尤其有用，因為InnoDB使用聚集索引組織數據，如果二級索引中包含查詢(xún)所需的數據，就不再需要在聚集索引中查找了。
覆蓋索引不能是任何索引，只有B-TREE索引存儲相應的值。而且不同的存儲引擎實(shí)現覆蓋索引的方式都不同，并不是所有存儲引擎都支持覆蓋索引(Memory和Falcon就不支持)。
對于索引覆蓋查詢(xún)(index-covered query)，使用EXPLAIN時(shí)，可以在Extra一列中看到“Using index”。例如，在sakila的inventory表中，有一個(gè)組合索引(store_id,film_id)，對于只需要訪(fǎng)問(wèn)這兩列的查詢(xún)，MySQL就可以使用索引，如下：

mysql> EXPLAIN SELECT store_id, film_id FROM sakila.inventory\G

*************************** 1. row ***************************

           id: 1

select_type: SIMPLE

        table: inventory

         type: index

possible_keys: NULL

          key: idx_store_id_film_id

      key_len: 3

          ref: NULL

         rows: 5007

        Extra: Using index

1 row in set (0.17 sec)

在大多數引擎中，只有當查詢(xún)語(yǔ)句所訪(fǎng)問(wèn)的列是索引的一部分時(shí)，索引才會(huì )覆蓋。但是，InnoDB不限于此，InnoDB的二級索引在葉子節點(diǎn)中存儲了 primary key的值。因此，sakila.actor表使用InnoDB，而且對于是last_name上有索引，所以，索引能覆蓋那些訪(fǎng)問(wèn)actor_id的查詢(xún)，如：

mysql> EXPLAIN SELECT actor_id, last_name

    -> FROM sakila.actor WHERE last_name = 'HOPPER'\G

*************************** 1. row ***************************

           id: 1

select_type: SIMPLE

        table: actor

         type: ref

possible_keys: idx_actor_last_name

          key: idx_actor_last_name

      key_len: 137

          ref: const

         rows: 2

        Extra: Using where; Using index

3.3、利用索引進(jìn)行排序
MySQL 中，有兩種方式生成有序結果集：一是使用filesort，二是按索引順序掃描。利用索引進(jìn)行排序操作是非?？斓?，而且可以利用同一索引同時(shí)進(jìn)行查找和排序操作。當索引的順序與ORDER BY中的列順序相同且所有的列是同一方向(全部升序或者全部降序)時(shí)，可以使用索引來(lái)排序。如果查詢(xún)是連接多個(gè)表，僅當ORDER BY中的所有列都是第一個(gè)表的列時(shí)才會(huì )使用索引。其它情況都會(huì )使用filesort。

create table actor(

actor_id int unsigned NOT NULL AUTO_INCREMENT,

name      varchar(16) NOT NULL DEFAULT '',

password        varchar(16) NOT NULL DEFAULT '',

PRIMARY KEY(actor_id),

KEY     (name)

) ENGINE=InnoDB

insert into actor(name,password) values('cat01','1234567');

insert into actor(name,password) values('cat02','1234567');

insert into actor(name,password) values('ddddd','1234567');

insert into actor(name,password) values('aaaaa','1234567');

mysql> explain select actor_id from actor order by actor_id \G

*************************** 1. row ***************************

           id: 1

select_type: SIMPLE

        table: actor

         type: index

possible_keys: NULL

          key: PRIMARY

      key_len: 4

          ref: NULL

         rows: 4

        Extra: Using index

1 row in set (0.00 sec)

mysql> explain select actor_id from actor order by password \G

*************************** 1. row ***************************

           id: 1

select_type: SIMPLE

        table: actor

         type: ALL

possible_keys: NULL

          key: NULL

      key_len: NULL

          ref: NULL

         rows: 4

        Extra: Using filesort

1 row in set (0.00 sec)

mysql> explain select actor_id from actor order by name \G

*************************** 1. row ***************************

           id: 1

select_type: SIMPLE

        table: actor

         type: index

possible_keys: NULL

          key: name

      key_len: 18

          ref: NULL

         rows: 4

        Extra: Using index

1 row in set (0.00 sec)

當 MySQL不能使用索引進(jìn)行排序時(shí)，就會(huì )利用自己的排序算法(快速排序算法)在內存(sort buffer)中對數據進(jìn)行排序，如果內存裝載不下，它會(huì )將磁盤(pán)上的數據進(jìn)行分塊，再對各個(gè)數據塊進(jìn)行排序，然后將各個(gè)塊合并成有序的結果集（實(shí)際上就是外排序）。對于filesort，MySQL有兩種排序算法。
(1)兩遍掃描算法(Two passes)
實(shí)現方式是先將須要排序的字段和可以直接定位到相關(guān)行數據的指針信息取出，然后在設定的內存（通過(guò)參數sort_buffer_size設定）中進(jìn)行排序，完成排序之后再次通過(guò)行指針信息取出所需的Columns。
注：該算法是4.1之前采用的算法，它需要兩次訪(fǎng)問(wèn)數據，尤其是第二次讀取操作會(huì )導致大量的隨機I/O操作。另一方面，內存開(kāi)銷(xiāo)較小。
(3)   一次掃描算法(single pass)
該算法一次性將所需的Columns全部取出，在內存中排序后直接將結果輸出。
注：從 MySQL 4.1 版本開(kāi)始使用該算法。它減少了I/O的次數，效率較高，但是內存開(kāi)銷(xiāo)也較大。如果我們將并不需要的Columns也取出來(lái)，就會(huì )極大地浪費排序過(guò)程所需要的內存。在 MySQL 4.1 之后的版本中，可以通過(guò)設置 max_length_for_sort_data 參數來(lái)控制 MySQL 選擇第一種排序算法還是第二種。當取出的所有大字段總大小大于 max_length_for_sort_data 的設置時(shí)，MySQL 就會(huì )選擇使用第一種排序算法，反之，則會(huì )選擇第二種。為了盡可能地提高排序性能，我們自然更希望使用第二種排序算法，所以在 Query 中僅僅取出需要的 Columns 是非常有必要的。

當對連接操作進(jìn)行排序時(shí)，如果ORDER BY僅僅引用第一個(gè)表的列，MySQL對該表進(jìn)行filesort操作，然后進(jìn)行連接處理，此時(shí)，EXPLAIN輸出“Using filesort”；否則，MySQL必須將查詢(xún)的結果集生成一個(gè)臨時(shí)表，在連接完成之后進(jìn)行filesort操作，此時(shí)，EXPLAIN輸出 “Using temporary;Using filesort”。

3.4、索引與加鎖
索引對于InnoDB非常重要，因為它可以讓查詢(xún)鎖更少的元組。這點(diǎn)十分重要，因為MySQL 5.0中，InnoDB直到事務(wù)提交時(shí)才會(huì )解鎖。有兩個(gè)方面的原因：首先，即使InnoDB行級鎖的開(kāi)銷(xiāo)非常高效，內存開(kāi)銷(xiāo)也較小，但不管怎么樣，還是存在開(kāi)銷(xiāo)。其次，對不需要的元組的加鎖，會(huì )增加鎖的開(kāi)銷(xiāo)，降低并發(fā)性。
InnoDB僅對需要訪(fǎng)問(wèn)的元組加鎖，而索引能夠減少I(mǎi)nnoDB訪(fǎng)問(wèn)的元組數。但是，只有在存儲引擎層過(guò)濾掉那些不需要的數據才能達到這種目的。一旦索引不允許InnoDB那樣做（即達不到過(guò)濾的目的），MySQL服務(wù)器只能對 InnoDB返回的數據進(jìn)行WHERE操作，此時(shí)，已經(jīng)無(wú)法避免對那些元組加鎖了：InnoDB已經(jīng)鎖住那些元組，服務(wù)器無(wú)法解鎖了。
來(lái)看個(gè)例子：

create table actor(

actor_id int unsigned NOT NULL AUTO_INCREMENT,

name      varchar(16) NOT NULL DEFAULT '',

password        varchar(16) NOT NULL DEFAULT '',

PRIMARY KEY(actor_id),

KEY     (name)

) ENGINE=InnoDB

insert into actor(name,password) values('cat01','1234567');

insert into actor(name,password) values('cat02','1234567');

insert into actor(name,password) values('ddddd','1234567');

insert into actor(name,password) values('aaaaa','1234567');

SET AUTOCOMMIT=0;

BEGIN;

SELECT actor_id FROM actor WHERE actor_id < 4

AND actor_id <> 1 FOR UPDATE;

該查詢(xún)僅僅返回2---3的數據，實(shí)際已經(jīng)對1---3的數據加上排它鎖了。InnoDB鎖住元組1是因為MySQL的查詢(xún)計劃僅使用索引進(jìn)行范圍查詢(xún)（而沒(méi)有進(jìn)行過(guò)濾操作，WHERE中第二個(gè)條件已經(jīng)無(wú)法使用索引了）：

mysql> EXPLAIN SELECT actor_id FROM test.actor

    -> WHERE actor_id < 4 AND actor_id <> 1 FOR UPDATE \G

*************************** 1. row ***************************

           id: 1

select_type: SIMPLE

        table: actor

         type: index

possible_keys: PRIMARY

          key: PRIMARY

      key_len: 4

          ref: NULL

         rows: 4

        Extra: Using where; Using index

1 row in set (0.00 sec)

mysql>

表明存儲引擎從索引的起始處開(kāi)始，獲取所有的行，直到actor_id<4為假，服務(wù)器無(wú)法告訴InnoDB去掉元組1。
為了證明row 1已經(jīng)被鎖住，我們另外建一個(gè)連接，執行如下操作：

SET AUTOCOMMIT=0;

BEGIN;

SELECT actor_id FROM actor WHERE actor_id = 1 FOR UPDATE;

該查詢(xún)會(huì )被掛起，直到第一個(gè)連接的事務(wù)提交釋放鎖時(shí)，才會(huì )執行（這種行為對于基于語(yǔ)句的復制(statement-based replication)是必要的）。
如上所示，當使用索引時(shí)，InnoDB會(huì )鎖住它不需要的元組。更糟糕的是，如果查詢(xún)不能使用索引，MySQL會(huì )進(jìn)行全表掃描，并鎖住每一個(gè)元組，不管是否真正需要。

本站僅提供存儲服務(wù)，所有內容均由用戶(hù)發(fā)布，如發(fā)現有害或侵權內容，請點(diǎn)擊舉報。

欧美性猛交XXXX免费看蜜桃,成人网18免费韩国,亚洲国产成人精品区综合,欧美日韩一区二区三区高清不卡,亚洲综合一区二区精品久久