鍍金池/ 問答/Linux  數(shù)據(jù)庫/ 一個數(shù)據(jù)庫設計的難題

一個數(shù)據(jù)庫設計的難題

問題比較復雜,盡可能簡化描述

比如一個存儲文章的數(shù)據(jù)表,數(shù)據(jù)存儲用的是mongodb

1、有不確定列,比如點擊率、內(nèi)容、標題、回復、用戶uid,利的數(shù)目不確定,可能十幾個,也可能上百個??赡茉黾?,也可能減少,是動態(tài)的。

2、每個列存儲的數(shù)目不確定,比如回復這個字段,可能有上百萬,也有可能只有1個。

3、每個字段需要能存儲版本。比如內(nèi)容這個字段,可能存在多個版本,版本1、版本2、版本3。版本數(shù)目多少不確定。

我是這樣設計的

1、數(shù)據(jù)表:data。存儲文章的基本信息。比如文章添加時間,文章發(fā)布狀態(tài)等。
2、字段表:field。存儲具體的字段內(nèi)容,比如回復、內(nèi)容、標題。
3、還有一個數(shù)據(jù)表:version。存儲版本。每個版本的具體內(nèi)容依然存儲在 field 里面

目前的問題:

1、存儲是沒問題的。比如我查詢一篇文章的回復、內(nèi)容,都能查詢。
2、性能有問題。比如分頁,一頁列出25條。每條需要在列表列出一些數(shù)據(jù)給用戶。比如標題、內(nèi)容、時間等等。大概7個字段。加起來就是:25*7=174個查詢,查詢花費了10秒左右。
如果解決這個問題,可能需要把這些數(shù)據(jù)提前寫入一份放到data表。也就是反范式。比如這樣:

field:{
    title:'標題',
    content:'內(nèi)容',
}

存放這么一些冗余數(shù)據(jù)到data表里面。

3、搜索的問題。感覺還是存在一些功能的局限和性能問題。

目前整體來說,感覺設計很復雜,代碼寫得很累,問題層出不窮。
不知道數(shù)據(jù)庫設計問題還是說mongodb不適合存儲這樣的數(shù)據(jù)。
如果是你,你會怎么設計這個數(shù)據(jù)庫呢

回答
編輯回答
詆毀你

1.有不確定列--->這個是沒有必要的,必須的列應該相對固定的,如果不固定,從幾十個到幾百個,你呈現(xiàn)數(shù)據(jù)的時候怎樣呈現(xiàn)?
你都不確定有哪些列,你前端頁面怎么寫?
真要有一些可有可無的字段,你可以統(tǒng)一把它存在一個字段或另一個表中。

2.比如回復這個字段,可能有上百萬-->回復的內(nèi)容不可能和存文章的表是同一個吧?
回復當然是需要獨立的一個表。
當一個字段需要存多個結果時,一般這個字段的內(nèi)容會獨立到另一個表中。

3.雖然 mongodb 沒有像關系型數(shù)據(jù)庫那么多限制,但基本的設計我覺得還是得按關系型數(shù)據(jù)庫來。
你把所有東西都放到一個表中,你批量查詢的時候是應該比較快的,但你想精確查找的時候可能很麻煩,還有就是寫入也可能很麻煩。
比如回復,如果你回復的內(nèi)容是存在文章表中的“回復”字段的話,每次添加一條回復的時候,你得把原數(shù)據(jù)先查出來,再把回復數(shù)據(jù)的內(nèi)容拿出來,還需要循環(huán)一遍看回復的內(nèi)容有沒有重復。

2017年3月6日 09:36