热门问题
时间线
聊天
视角

第四范式

来自维基百科,自由的百科全书

Remove ads

第四范式(4NF)是数据库范式中所使用的一种正规形式,是BC范式之后的另一层次的规范化。第二范式、第三范式、BC范式关注于属性集合之间的函数依赖;而第四范式关注更一般形式称作多值依赖

Ronald Fagin英语Ronald Fagin于1977年提出。 数据库的一个表遵从第四范式,当且仅当对于任意一个非平凡的多值依赖X Y, X是一个超键[1]

多值依赖

关系数据库的一个表中的列头分为不相交的三组:X, Y, Z。在一行的特定上下文中,称上述列组的数据值为x, y, z多值依赖X Y,意味着如果选择表中的任何值x(记作xc),从而确定该表中所有的xcyz列表,如果xc关联着同一个y的值,不论z的任何取值。实质上,z的存在不提供任何信息能约束到y的可能值。也可以表述为,定义域的每一个值,都能确定值域中的一个值的集合。

平凡多值依赖 X Y是或者YX的子集,或者XY一起形成了该关系的整个属性集合。

函数依赖是多值依赖的特例。函数依赖XY,那么每个x确定了确切一个y值,而不能是多个。

Remove ads

例子

考虑下述例子:

更多信息 Restaurant(餐厅), Pizza Variety(披萨口味) ...

每一行指出一家饭店能提供一种披萨与一个配货地区。

该表没有非键属性,因为它仅有的键是{Restaurant, Pizza Variety, Delivery Area}。因此,它满足到BC范式为止的所有范式。如果假设,饭店提供的披萨种类与配货地区无关。也即饭店为所有的供货地区提供它能制作的所有披萨类型。那么,这个表不满足第四范式。因为这个表在{Restaurant}属性(它不是超键)上提供了两个非平凡的多值依赖:

  • {Restaurant} {Pizza Variety}
  • {Restaurant} {Delivery Area}

这些在一个非超键上的非平凡多值依赖说明了饭店提供的披萨的多样性独立于饭店的供货地区。这导致了该表中的数据冗余:例如,A1 Pizza供货 Stuffed Crust就重复了3遍;如果A1 Pizza开始生产Cheese Crust pizzas那么向表中增加多行,A1 Pizza的每个供货地区都需要一行。这就可能在给A1 Pizza的每个供货地区增加一行Cheese Crust披萨时,遗漏了一个供货地区,从而导致不满足于多值依赖{Restaurant} {Pizza Variety}。

为了避免上述的错误发生,需要把披萨的多样性与供货地区放置在不同的表中,产生了两张满足第四范式的表:

更多信息 Restaurant, Pizza Variety ...
更多信息 Restaurant, Delivery Area ...

如果披萨的种类随着供货地区不同而变化,那么最初的三列的表就满足第四范式。

Ronald Fagin证明总是能够满足第四范式。[2]Rissanen's theorem英语Rissanen's theorem总是适用于多值依赖

Remove ads

参见

参考文献

扩展阅读

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads