鍍金池/ 問答/數(shù)據(jù)庫/ 怎么not in 還不如 not exists ?

怎么not in 還不如 not exists ?

not in 不到1秒就執(zhí)行完了,
not exists 執(zhí)行較長,都沒耐心等。
這是什么情況?

msyql數(shù)據(jù)庫,兩張表,一個(gè)30萬條數(shù)據(jù),一個(gè)25萬條數(shù)據(jù):
doctor 醫(yī)生基本信息表,主鍵did
doctor_intro 醫(yī)生額外信息表(有text類型的字段)

not in:

SELECT
    count( * ) 
FROM
    doctor d 
WHERE
    d.did NOT IN ( SELECT did FROM doctor_intro );

not exists:

SELECT
    count( * ) 
FROM
    doctor d 
WHERE
    NOT EXISTS ( SELECT 1 FROM doctor_intro di WHERE di.did = d.did );
回答
編輯回答
憶往昔

not exists效率本來就不高啊...

暫時(shí)先不考慮數(shù)據(jù)庫自動(dòng)進(jìn)行的編譯優(yōu)化這點(diǎn),假設(shè)兩個(gè)實(shí)現(xiàn)用最樸素的實(shí)現(xiàn)方式

not exists本質(zhì)上就是循環(huán)執(zhí)行doctor數(shù)據(jù)量次數(shù)的select 1 xxx語句,篩選出執(zhí)行查詢沒有結(jié)果的數(shù)據(jù),在這里就是30w或者20w次的select,即便都有索引select起來很快也架不住循環(huán)次數(shù)多啊

not in一般是先把in里的語句查出來,然后對(duì)結(jié)果和doctor做一個(gè)join關(guān)聯(lián)出匹配的上(in)或者匹配不上(not in)的數(shù)據(jù),就算沒有優(yōu)化查詢次數(shù)也依然比not exists少很多

而且如果not in的子查詢有建索引,還可以直接自動(dòng)優(yōu)化成一個(gè)join語句做兩張表的關(guān)聯(lián)以進(jìn)行索引之間的對(duì)比,也不用先把select子查詢計(jì)算出來再對(duì)比,類似
select count(*) from docker d,doctor_intro di where d.did = di.did and d.did is not null and di.did is null(sql隨便寫的,也沒實(shí)際執(zhí)行,可能是錯(cuò)誤的,大概可以理解意思就行)
這樣一來的話速度就更快了,因?yàn)閳?zhí)行時(shí)可以直接對(duì)比索引文件里的數(shù)據(jù)是否關(guān)聯(lián)的上,把關(guān)聯(lián)不上的數(shù)量取出來就完成了,可以省略掉先查出 SELECT did FROM doctor_intro 這步了

具體上mysql我目前很少用,內(nèi)部做了哪些優(yōu)化也不清楚,我上面說的是建立在沒有優(yōu)化的基礎(chǔ)上,實(shí)際上涉及到sql編譯優(yōu)化后問題就復(fù)雜了很多,我目前也是還沒學(xué)完屬于基本不懂的狀態(tài),這方面就不多說什么了

2017年11月5日 07:56
編輯回答
尛曖昧

使用 in 比 not exists 或 or 效率要高一些。
MySQL語句優(yōu)化參考:MySQL語句優(yōu)化方法

2017年9月1日 13:03