教你編寫高性能的 mysql 語法 --- PHP5研究室
在應用系統開發初期,由于開發數據庫數據比較少,對于查詢SQL語句,複雜視圖的的編寫等體會不出SQL語句各種寫法的性能優劣,但是如果將應用系統提交實際應用後,隨著數據庫中數據的增加,系統的響應速度就成爲目前系統需要解决的最主要的問題之一。系統優化中一個很重要的方面就是SQL語句的優化。對于海量數據,劣質SQL語句和優質SQL語句之間的速度差別可以達到上百倍,可見對于一個系統不是簡單地能實現其功能就可,而是要寫出高質量的 SQL語句,提高系統的可用性。
在多數情况下,Oracle 使用索引來更快地搜尋資料表,優化器主要根據定義的索引來提高性能。但是,如果在 SQL 語句的 where 子句中寫的 SQL 程式碼不合理,就會造成優化器删去索引而使用全表掃描,一般就這種SQL語句就是所謂的劣質SQL語句。在編寫 SQL 語句時我們應清楚優化器根據何種原則來删除索引,這有助于寫出高性能的SQL語句。
SQL 語句編寫注意問題
下面就某些 SQL 語句的 where子句編寫中需要注意的問題作詳細介紹。在這些where子句中,即使某些列存在索引,但是由于編寫了劣質的 SQL,系統在運行該 SQL 語句時也不能使用該索引,而同樣使用全表掃描,這就造成了響應速度的極大降低。
1. IS NULL 與 IS NOT NULL
null 無法做索引,任何包含 null 值的列都將不會被包含在索引中。即使索引有多列這樣的情况下,只要這些列中有一列含有null,該列就會從索引中排除。也就是說如果某列存在空值,即使對該列建索引也不會提高性能。
任何在 where 子句中使用 is null 或 is not null 的語句優化器是不允許使用索引的。
2. 聯接列
對于有聯接的列,即使最後的聯接值爲一個靜態值,優化器是不會使用索引的。我們一起來看一個例子,假定有一個職員表(employee),對於一個職員的姓和名分成兩列存放(FIRST_NAME 和 LAST_NAME),現在要查詢一個叫比爾.克林頓(Bill Cliton)的職員。
下面是一個使用聯接查詢的SQL語句,
select * from employss
where
first_name ||''|| last_name ='Beill Cliton'
上面這條語句完全可以查詢出是否有Bill Cliton這個員工,但是這裏需要注意,系統優化器對基于last_name創建的索引沒有使用。
當采用下面這種SQL語句的編寫,Oracle系統就可以采用基于last_name創建的索引。
Select * from employee
where
first_name ='Beill' and last_name ='Cliton'
遇到下面這種情况又如何處理呢?如果一個變量(name)中存放著Bill Cliton這個員工的姓名,對于這種情况我們又如何避免全程遍曆,使用索引呢?可以使用一個函數,將變量name中的姓和名分開就可以了,但是有一點需要注意,這個函數是不能作用在索引列上。下麵是SQL查詢語法:
select * from employee
where
first_name = SUBSTR('&&name',1,INSTR('&&name',' ')-1)
and
last_name = SUBSTR('&&name',INSTR('&&name’,' ')+1)
3. 帶通配符(%)的like語句
同樣以上面的例子來看這種情况。目前的需求是這樣的,要求在職工表中查詢名字中包含cliton的人。可以采用如下的查詢SQL語句:
select * from employee where last_name like '%cliton%'
這裏由于通配符(%)在搜尋詞首出現,所以Oracle系統不使用last_name的索引。在很多情况下可能無法避免這種情况,但是一定要心中有底,通配符如此使用會降低查詢速度。然而當通配符出現在字符串其他位置時,優化器就能利用索引。在下面的查詢中索引得到了使用:
select * from employee where last_name like 'c%'
4. Order by語句
ORDER BY語句决定了Oracle如何將傳回的查詢結果排序。Order by語句對要排序的列沒有什麽特別的限制,也可以將函數加入列中(象聯接或者附加等)。任何在Order by語句的非索引項或者有計算表達式都將降低查詢速度。
仔細檢查order by語句以找出非索引項或者表達式,它們會降低性能。解决這個問題的辦法就是重寫order by語句以使用索引,也可以爲所使用的列建立另外一個索引,同時應絕對避免在order by子句中使用表達式。
5. NOT
我們在查詢時經常在where子句使用一些邏輯表達式,如大于、小于、等于以及不等于等等,也可以使用and(與)、or(或)以及not(非)。NOT可用來對任何邏輯運算符號取反。下面是一個NOT子句的例子:
... where not (status ='VALID')
如果要使用NOT,則應在取反的短語前面加上括號,幷在短語前面加上NOT運算符。NOT運算符包含在另外一個邏輯運算符中,這就是不等于(<>)運算符。換句話說,即使不在查詢where子句中顯式地加入NOT詞,NOT 仍在運算符中,見下例:
... where status <>'INVALID'
再看下面這個例子:
select * from employee where salary<>3000;
對這個查詢,可以改寫爲不使用NOT:
select * from employee where salary<3000 or salary>3000;
雖然這兩種查詢的結果一樣,但是第二種查詢方案會比第一種查詢方案更快些。第二種查詢允許Oracle對salary列使用索引,而第一種查詢則不能使用索引。
6. IN 和 EXISTS
有時候會將一列和一系列值相比較。最簡單的辦法就是在 where 子句中使用子查詢。在where子句中可以使用兩種格式的子查詢。
第一種格式是使用IN操作符:
... where column in(select * from ... where ...);
第二種格式是使用EXIST操作符:
... where exists (select 'X' from ...where ...);
我相信絕大多數人會使用第一種格式,因爲它比較容易編寫,而實際上第二種格式要遠比第一種格式的效率高。在Oracle中可以幾乎將所有的IN操作符子查詢改寫爲使用EXISTS的子查詢。
第二種格式中,子查詢以‘select 'X'’開始。運用EXISTS子句不管子查詢從表中抽取什麽數據它只查看where子句。這樣優化器就不必遍曆整個表而僅根據索引就可完成工作(這裏假定在where語句中使用的列存在索引)。相對于IN子句來說,EXISTS使用相連子查詢,構造起來要比 IN子查詢困難一些。
通過使用EXIST,Oracle系統會首先檢查主查詢,然後運行子查詢直到它找到第一個匹配項,這就節省了時間。Oracle系統在執行IN子查詢時,首先執行子查詢,幷將獲得的結果列表存放在在一個加了索引的臨時表中。在執行子查詢之前,系統先將主查詢挂起,待子查詢執行完畢,存放在臨時表中以後再執行主查詢。這也就是使用EXISTS比使用IN通常查詢速度快的原因。
同時應盡可能使用NOT EXISTS來代替NOT IN,儘管二者都使用了NOT(不能使用索引而降低速度),NOT EXISTS要比NOT IN查詢效率更高。
轉貼處
http://www.europa.idv.tw/FreeDoc ... ViewDoc&DID=169
-------------------------------------------------------------------------------------------
文章心得:
1. 大部分資料庫都有內建或 3-party 的效能分析工具可使用。
2. 此篇文章只講解效能低落的關鍵點--- "索引" 。事實上,目前台灣現存的資料庫,你可能看到沒有任何的索引、Foreigh key,任至浪費關聯式資料庫的功能,沒有正規化,甚至是所有的資料都建在一個大表裡。
|