表展示首先,查詢中涉及到的兩個表,一個user和一個order表,具體表的內容如下: user表:
order表:
in確定給定的值是否與子查詢或列表中的值相匹配。in在查詢的時候,首先查詢子查詢的表,然后將內表和外表做一個笛卡爾積,然后按照條件進行篩選。所以相對內表比較小的時候,in的速度較快。 具體sql語句如下: 1 SELECT 2 * 3 FROM 4 `user` 5 WHERE 6 `user`.id IN ( 7 SELECT 8 `order`.user_id 9 FROM10 `order`11 ) 這條語句很簡單,通過子查詢查到的user_id 的數據,去匹配user表中的id然后得到結果。該語句執(zhí)行結果如下:
它的執(zhí)行流程是什么樣子的呢?讓我們一起來看一下。 首先,在數據庫內部,查詢子查詢,執(zhí)行如下代碼: SELECT
`order`.user_id
FROM
`order` 執(zhí)行完畢后,得到結果如下:
此時,將查詢到的結果和原有的user表做一個笛卡爾積,結果如下:
此時,再根據我們的user.id IN order.user_id的條件,將結果進行篩選(既比較id列和user_id 列的值是否相等,將不相等的刪除)。最后,得到兩條符合條件的數據。 exists指定一個子查詢,檢測行的存在。遍歷循環(huán)外表,然后看外表中的記錄有沒有和內表的數據一樣的。匹配上就將結果放入結果集中。 具體sql語句如下: 1 SELECT 2 `user`.* 3 FROM 4 `user` 5 WHERE 6 EXISTS ( 7 SELECT 8 `order`.user_id 9 FROM10 `order`11 WHERE12 `user`.id = `order`.user_id13 ) 這條sql語句的執(zhí)行結果和上面的in的執(zhí)行結果是一樣的。
但是,不一樣的是它們的執(zhí)行流程完全不一樣: 使用exists關鍵字進行查詢的時候,首先,我們先查詢的不是子查詢的內容,而是查我們的主查詢的表,也就是說,我們先執(zhí)行的sql語句是: SELECT `user`.* FROM `user` 得到的結果如下:
然后,根據表的每一條記錄,執(zhí)行以下語句,依次去判斷where后面的條件是否成立: EXISTS ( SELECT
`order`.user_id
FROM
`order` WHERE
`user`.id = `order`.user_id
) 如果成立則返回true不成立則返回false。如果返回的是true的話,則該行結果保留,如果返回的是false的話,則刪除該行,最后將得到的結果返回。 區(qū)別及應用場景in 和 exists的區(qū)別: 如果子查詢得出的結果集記錄較少,主查詢中的表較大且又有索引時應該用in, 反之如果外層的主查詢記錄較少,子查詢中的表大,又有索引時使用exists。其實我們區(qū)分in和exists主要是造成了驅動順序的改變(這是性能變化的關鍵),如果是exists,那么以外層表為驅動表,先被訪問,如果是IN,那么先執(zhí)行子查詢,所以我們會以驅動表的快速返回為目標,那么就會考慮到索引及結果集的關系了 ,另外IN時不對NULL進行處理。 in 是把外表和內表作hash 連接,而exists是對外表作loop循環(huán),每次loop循環(huán)再對內表進行查詢。一直以來認為exists比in效率高的說法是不準確的。 not in 和not exists如果查詢語句使用了not in 那么內外表都進行全表掃描,沒有用到索引;而not extsts 的子查詢依然能用到表上的索引。所以無論那個表大,用not exists都比not in要快。 |
|