鍍金池/ 問(wèn)答/數(shù)據(jù)庫(kù)/ mongodb查詢一個(gè)文檔與一個(gè)字段的差別

mongodb查詢一個(gè)文檔與一個(gè)字段的差別

  1. mongodb集群復(fù)制集分片部署環(huán)境中. 中有一個(gè)collection device, device有2個(gè)索引a,b
  2. 有一條查詢, 兩種寫法
// 耗時(shí)很穩(wěn)定1ms. 根據(jù)索引a查詢b字段的內(nèi)容(b也是索引,返回結(jié)果為1條,內(nèi)容在45字符左右)
db.getCollection('device').find({'a':'value'},{'b':1});
// 不穩(wěn)2~2000ms都有可能, 根據(jù)索引a查詢整個(gè)文檔(返回結(jié)果為1條,內(nèi)容在600字符左右)
db.getCollection('device').find({'a':'value'});

問(wèn)題1: 求科普下整個(gè)查詢的流程?
問(wèn)題2: 同樣走索引,返回文檔也都是一條,只有返回內(nèi)容大小有一些差異,但結(jié)果卻天差地別.這其中的原理又是什么?

問(wèn)題補(bǔ)充:

@Mongoing中文社區(qū) 大神,非常感謝你的回答. 本次提問(wèn)其實(shí)是 mongodb走了索引,依舊是慢查詢,請(qǐng)看執(zhí)行計(jì)劃 問(wèn)題的續(xù)集(你在這個(gè)問(wèn)題里也有回答. 叩謝).

上個(gè)問(wèn)題的解決方式是將第2個(gè)查詢語(yǔ)句改成第1個(gè)查詢語(yǔ)句的方式,在我項(xiàng)目里面的到很好的效果.
所以非常想知道這兩個(gè)查詢直接的聯(lián)系與不同點(diǎn),以及整個(gè)查詢的流程.
另外,能不能推薦幾本好的mongodb的書(中文版的最好.英文不太好).羨慕你很專業(yè),感覺(jué)有知識(shí)真的好酷.

回答
編輯回答
默念

不知道你說(shuō)的查詢流程是指什么?我理解你想看到的是執(zhí)行計(jì)劃

db.getCollection('device').find({'a':'value'},{'b':1}).explain(true);
db.getCollection('device').find({'a':'value'}).explain(true);

可以確定的是這兩條查詢的查詢計(jì)劃幾乎是一樣的。第二條少一個(gè)project stage,但通常這都不會(huì)造成這么大的影響。影響你查詢時(shí)間的很可能不是查詢本身,而是運(yùn)行這些查詢時(shí)服務(wù)器的資源狀況。直白地說(shuō),可能有其他消耗很大的查詢的執(zhí)行影響到這條查詢。

對(duì)補(bǔ)充問(wèn)題的答復(fù)

這兩個(gè)查詢確實(shí)本質(zhì)上沒(méi)有太大的差別,有些場(chǎng)景可能造成性能差異,但不至于太大。

再次補(bǔ)充

不管你是取一個(gè)字段還是整個(gè)文檔,磁盤上讀出來(lái)的都是整個(gè)文檔。因?yàn)槲臋n是沒(méi)有結(jié)構(gòu)的,不整個(gè)讀出來(lái)分析你怎么知道里面有哪些字段?所以想直接讀出某個(gè)字段的內(nèi)容在現(xiàn)階段的WiredTiger引擎中是做不到的(但是確實(shí)在roadmap中)。我也考慮過(guò)covered query的可能性,但是你的寫法明顯也是做不到的,除非是:

db.getCollection('device').find({'a':'value'},{'b':1, _id: 0})

才有可能跳過(guò)FETCH階段。

2018年3月5日 05:35