第四范式
此条目翻译自英语维基百科,需要相关领域的编者协助校对翻译。 |
第四正规化(4NF)是资料库正规化中所使用的一种正规形式,是BC范式之后的另一层次的规范化。第二范式、第三范式、BC范式关注于属性集合之间的函数依赖;而第四范式关注更一般形式称作多值依赖。
Ronald Fagin于1977年提出。 数据库的一个表遵从第四范式,当且仅当对于任意一个非平凡的多值依赖X Y, X是一个超键。[1]
多值依赖
关系数据库的一个表中的列头分为不相交的三组:X, Y, Z。在一行的特定上下文中,称上述列组的数据值为x, y, z。多值依赖X Y,意味着如果选择表中的任何值x(记作xc),从而确定该表中所有的xcyz列表,如果xc关联着同一个y的值,不论z的任何取值。实质上,z的存在不提供任何信息能约束到y的可能值。也可以表述为,定义域的每一个值,都能确定值域中的一个值的集合。
平凡多值依赖 X Y是或者Y是X的子集,或者X与Y一起形成了该关系的整个属性集合。
函数依赖是多值依赖的特例。函数依赖X → Y,那么每个x确定了确切一个y值,而不能是多个。
例子
考虑下述例子:
Restaurant(餐厅) | Pizza Variety(披萨口味) | Delivery Area(配货地区) |
---|---|---|
A1 Pizza | Thick Crust | Springfield |
A1 Pizza | Thick Crust | Shelbyville |
A1 Pizza | Thick Crust | Capital City |
A1 Pizza | Stuffed Crust | Springfield |
A1 Pizza | Stuffed Crust | Shelbyville |
A1 Pizza | Stuffed Crust | Capital City |
Elite Pizza | Thin Crust | Capital City |
Elite Pizza | Stuffed Crust | Capital City |
Vincenzo's Pizza | Thick Crust | Springfield |
Vincenzo's Pizza | Thick Crust | Shelbyville |
Vincenzo's Pizza | Thin Crust | Springfield |
Vincenzo's Pizza | Thin Crust | Shelbyville |
每一行指出一家饭店能提供一种披萨与一个配货地区。
该表没有非键属性,因为它仅有的键是{Restaurant, Pizza Variety, Delivery Area}。因此,它满足到BC范式为止的所有范式。如果假设,饭店提供的披萨种类与配货地区无关。也即饭店为所有的供货地区提供它能制作的所有披萨类型。那么,这个表不满足第四范式。因为这个表在{Restaurant}属性(它不是超键)上提供了两个非平凡的多值依赖:
- {Restaurant} {Pizza Variety}
- {Restaurant} {Delivery Area}
这些在一个非超键上的非平凡多值依赖说明了饭店提供的披萨的多样性独立于饭店的供货地区。这导致了该表中的数据冗余:例如,A1 Pizza供货 Stuffed Crust就重复了3遍;如果A1 Pizza开始生产Cheese Crust pizzas那么向表中增加多行,A1 Pizza的每个供货地区都需要一行。这就可能在给A1 Pizza的每个供货地区增加一行Cheese Crust披萨时,遗漏了一个供货地区,从而导致不满足于多值依赖{Restaurant} {Pizza Variety}。
为了避免上述的错误发生,需要把披萨的多样性与供货地区放置在不同的表中,产生了两张满足第四范式的表:
Restaurant | Pizza Variety |
---|---|
A1 Pizza | Thick Crust |
A1 Pizza | Stuffed Crust |
Elite Pizza | Thin Crust |
Elite Pizza | Stuffed Crust |
Vincenzo's Pizza | Thick Crust |
Vincenzo's Pizza | Thin Crust |
Restaurant | Delivery Area |
---|---|
A1 Pizza | Springfield |
A1 Pizza | Shelbyville |
A1 Pizza | Capital City |
Elite Pizza | Capital City |
Vincenzo's Pizza | Springfield |
Vincenzo's Pizza | Shelbyville |
如果披萨的种类随着供货地区不同而变化,那么最初的三列的表就满足第四范式。
Ronald Fagin证明总是能够满足第四范式。[2] Rissanen's theorem总是适用于多值依赖。
参见
参考文献
- ^ "A relation schema R* is in fourth normal form (4NF) if, whenever a nontrivial multivalued dependency X Y holds for R*, then so does the functional dependency X → A for every column name A of R*. Intuitively all dependencies are the result of keys." Fagin, Ronald. Multivalued Dependencies and a New Normal Form for Relational Databases (PDF). ACM Transactions on Database Systems. September 1977, 2 (1): 267. doi:10.1145/320557.320571. (原始内容 (PDF)存档于2007-11-29).
- ^ Fagin, p. 268
进一步阅读
- Date, C. J. (1999), An Introduction to Database Systems (8th ed.). Addison-Wesley Longman. ISBN 0-321-19784-4.
- Kent, W. (1983) A Simple Guide to Five Normal Forms in Relational Database Theory (页面存档备份,存于互联网档案馆), Communications of the ACM, vol. 26, pp. 120–125