文章目錄一、關(guān)系數(shù)據(jù)庫設(shè)計理論1、設(shè)計一個合適的關(guān)系數(shù)據(jù)庫系統(tǒng)的關(guān)鍵是關(guān)系數(shù)據(jù)庫模式的設(shè)計,即應(yīng)構(gòu)造幾個關(guān)系模式, 每個模式有哪些屬性,怎樣將這些相互關(guān)聯(lián)的關(guān)系模式組建成一個適合的關(guān)系模型,關(guān)系數(shù)據(jù)庫 的設(shè)計必須在關(guān)系數(shù)據(jù)庫設(shè)計理論的指導(dǎo)下進(jìn)行。 【例1】設(shè)計一個學(xué)生課程數(shù)據(jù)庫,其關(guān)系模式SDSC(Sno, Sname, Age, Dept,DeptHead, Cno,Grade),各屬性含義為學(xué)號、姓名、年齡、系、系主任姓名;課程號、成績。根據(jù)實際情況, 這些屬性語義規(guī)定為: 由于存在上述問題,SDSC不是一個好的關(guān)系模式。為了克服這些異常,將S關(guān)系分解為學(xué)生關(guān)系S (Sno, Sname, Age, Dept),系關(guān)系D(Dept,DeptHead),選課關(guān)系SC(Sno, Cno,Grade),這三個關(guān)系模式的實例如表2、表3、表4所示。 二、規(guī)范化規(guī)范化的基本思想是盡量減小數(shù)據(jù)冗余,消除數(shù)據(jù)依賴中不合適的部分,解決插入異常、刪除異常和更新異常等問題,這就要求設(shè)計出的關(guān)系模式要滿足一定條件。在關(guān)系數(shù)據(jù)庫的規(guī)范化過程中,為不同程度的規(guī)范化要求設(shè)立的不同標(biāo)準(zhǔn)或準(zhǔn)則稱為范式。滿足最低要求的稱為第一范式,簡稱1NF,在第一范式基礎(chǔ)上滿足進(jìn)一步要求的成為第二范式2NF,以此類推。 1、第一范式(1NF)所謂第一范式(1NF)是指在關(guān)系模型中,對于添加的一個規(guī)范要求,所有的域都應(yīng)該是原子性的,即數(shù)據(jù)庫表的每一列都是不可分割的原子數(shù)據(jù)項,而不能是集合,數(shù)組,記錄等非原子數(shù)據(jù)項。即實體中的某個屬性有多個值時,必須拆分為不同的屬性。在符合第一范式(1NF)表中的每個域值只能是實體的一個屬性或一個屬性的一部分。簡而言之,第一范式就是無重復(fù)的域 2、第二范式(2NF)在1NF的基礎(chǔ)上,非碼屬性必須完全依賴于候選碼(在1NF基礎(chǔ)上消除非主屬性對主碼的部分函數(shù)依賴) 第二范式(2NF)是在第一范式(1NF)的基礎(chǔ)上建立起來的,即滿足第二范式(2NF)必須先滿足第一范式(1NF)。第二范式(2NF)要求數(shù)據(jù)庫表中的每個實例或記錄必須可以被唯一地區(qū)分。選取一個能區(qū)分每個實體的屬性或?qū)傩越M,作為實體的唯一標(biāo)識。 例如在員工表中的身份證號碼即可實現(xiàn)每個一員工的區(qū)分,該身份證號碼即為候選鍵,任何一個候選鍵都可以被選作主鍵。在找不到候選鍵時,可額外增加屬性以實現(xiàn)區(qū)分,如果在員工關(guān)系中,沒有對其身份證號進(jìn)行存儲,而姓名可能會在數(shù)據(jù)庫運行的某個時間重復(fù),無法區(qū)分出實體時,設(shè)計辟如ID等不重復(fù)的編號以實現(xiàn)區(qū)分,被添加的編號或ID選作主鍵。(該主鍵的添加是在ER設(shè)計時添加,不是建庫時隨意添加) 第二范式(2NF)要求實體的屬性完全依賴于主關(guān)鍵字。所謂完全依賴是指不能存在僅依賴主關(guān)鍵字一部分的屬性,如果存在,那么這個屬性和主關(guān)鍵字的這一部分應(yīng)該分離出來形成一個新的實體,新實體與原實體之間是一對多的關(guān)系。為實現(xiàn)區(qū)分通常需要為表加上一個列,以存儲各個實例的唯一標(biāo)識。簡而言之,第二范式就是在第一范式的基礎(chǔ)上屬性完全依賴于主鍵。 3、第三范式(3NF)在2NF基礎(chǔ)上,任何非主屬性不依賴于其它非主屬性(在2NF基礎(chǔ)上消除傳遞依賴) 例如,存在一個部門信息表,其中每個部門有部門編號(dept_id)、部門名稱、部門簡介等信息。那么在員工信息表中列出部門編號后就不能再將部門名稱、部門簡介等與部門有關(guān)的信息再加入員工信息表中。如果不存在部門信息表,則根據(jù)第三范式(3NF)也應(yīng)該構(gòu)建它,否則就會有大量的數(shù)據(jù)冗余。簡而言之,第三范式就是屬性不依賴于其它非主屬性,也就是在滿足2NF的基礎(chǔ)上,任何非主屬性不得傳遞依賴于主屬性。 4、巴斯-科德范式(BCNF)Boyce-Codd Normal Form(巴斯-科德范式),在3NF基礎(chǔ)上,任何非主屬性不能對主鍵子集依賴(在3NF基礎(chǔ)上消除對主碼子集的依賴) 【目的原則】規(guī)范化目的是使結(jié)構(gòu)更合理,消除存儲異常,使數(shù)據(jù)冗余盡量小。便于插入、刪除和更新。遵從概念單一化“一事一地”原則,即一個關(guān)系模式描述一個實體或?qū)嶓w間的一種聯(lián)系。規(guī)范的實質(zhì)就是概念的單一化。 【反范式(了解)】規(guī)范化的優(yōu)點是明顯的,它避免了大量的數(shù)據(jù)冗余,節(jié)省了存儲空間,保持了數(shù)據(jù)的一致性。當(dāng)一個庫里的數(shù)據(jù)經(jīng)常發(fā)生變化時,達(dá)到3NF的庫可以使用戶不必在超過兩個以上的地方更改同 一個值。那么是不是只要把所有的表都規(guī)范為3NF后,數(shù)據(jù)庫的設(shè)計就是最優(yōu)的呢?這可不一定。范式越高意味著表的劃分更細(xì),一個數(shù)據(jù)庫中需要的表也就越多,用戶不得不將原本相關(guān)聯(lián)的數(shù)據(jù)分?jǐn)偟蕉鄠€表中。當(dāng)用戶同時需要這些數(shù)據(jù)時只能采用連接表的形式將數(shù)據(jù)重新合并在一起。同時把多個表聯(lián)接在一起的花費是巨大的,尤其是當(dāng)需要連接的兩張或者多張表數(shù)據(jù)非常龐大的時候,表連接操作幾乎是一個噩夢,這嚴(yán)重地降低了系統(tǒng)運行性能。 |
|