发者在设计阶段要考虑许多因素——如何正规化数据、如何创建易于使用的界面等等。但无疑地,开发者最重要的一个目标就是保证数据的准确性。本文讨论了如何通过“引用完整性”来防止数据库产生不正确的数据,以及如何防止丢失数据。
谁需要它?
解决了正规化、主键和关系问题后,一些人可能会忽视引用完整性。假定你负责维护一个重要数据库,其中存储着产品和订单数据。同时,假定你为主键使用了自然数据,并在某天更新了一位特定用户的主键值。不久,客户气冲冲地打来电话,因为发票出错,或是因为承诺的时间并没有发货。另外,也可能是因为客户获得了订单,但一直没有拿到发票。错误可能要等到系统审计时才会发现——而且即便在审计时,也有可能检测不到任何错误。
到底发生了什么?当你更改客户的主键值时,你实际忽略了为那个客户的相关记录更新外键值。换言之,你创建了“孤儿”——也就是不和主键值匹配的外键记录。在这种情况下,系统没办法将订单的细节与客户对应起来。
没有引用完整性的保障,就可能输入不匹配的外键值。关系模型不允许这些“孤儿”记录。尽管你的数据库系统可能允许创建“孤儿”,但开发者必须主动地防止它们。要防止“孤儿”,最简单的办法就是实现引用完整性。
什么是引用完整性?
关系模型强制引用完整性。你必须启用系统的引用完整性特性来满足关系规则。虽然在表和表之间启用引用完整性是一个简单的操作,但你必须理解这样做(和不这样做)的后果。从技术上说,完整性规则负责维护关系(也因此维护着数据)。有3种类型的完整性:
Entity(实体)——必须不重复地标识每一条记录。
Referential(引用)——每个外键值都必须在相关的表中有一个匹配的主键值(或者为Null)。
Business(业务)——这些规则是业务特有的,与关系数据库理论无关。
如果禁用引用完整性,你在任何时候都可输入数据,只要数据不会违反其他表或字段属性的要求,例如验证规则和数据类型等。相反,引用完整性会强制规则,限制你在什么时候能修改、添加或删除数据。启用引用完整性后,除非在相关的表中存在一个匹配的主键值,否则不能输入一个新的外键值。如果相关的表中有一个匹配的外键值,就不能更改主键值。另外,如果在相关的表中有匹配的外键值,就不能删除一个主键值。在这种情况下删除主键记录会造成“孤儿”。
决定何时启用引用完整性
除非你有非常特别的理由,否则在每个数据库中都应启用引用完整性。但在启用引用完整性之前,必须满足几方面的条件:
要强制引用完整性的关系必须基于一个主键或者一个惟一性的索引。
不可在不同数据库的表之间强制引用完整性。所有表都必须在同一个数据库内。
关系必须基于数据类型相同的字段(有的系统允许在自动编号字段和一个编号字段之间建立关系)。
一个例子
只有亲身体验,才能完全掌握引用完整性。以一个书籍数据库为基础,使用你的系统在Books和Publishers表之间启用引用完整性。图A展示了Microsoft Access中的对话框和Relationships窗口(请查阅文档,了解如何在自己系统中启用引用完整性)。
图A
在Books和Publisher表之间启用引用完整性
在两个表之间启用了引用完整性之后,数据输入将受到更多的限制:
不可在Books.PublisherFK中输入新的外键值,除非首先在Publishers.Publisher中将新值作为主键值输入。
如果Books.PublisherFK中存在一个匹配的值(外键),那么不能在Publishers.Publisher中更改一个值(主键)。
Books.PublisherFK中存在一个匹配的值(外键),那么不能从Publishers.Publisher中删除一个值(主键)。
输入、删除和更改数据时,如果违反了引用完整性,会发生什么呢?下面以Microsoft Access为例来实际体验一下。首先打开Books表,然后输入Nee Nee's Truck的记录,如图B所示。保存记录时会产生一个错误,因为RabbitPress在Publishers表中不是一个主键值。必须先在Publishers表中为RabbitPress输入一条记录,否则引用完整性不认为RabbitPress是一个外键值。
图B
系统拒绝RabbitPress成为一个外键
接着试验一下修改主键值。请打开Publishers表,选择Apress记录(或者Que及Sybex),然后试着删除记录。这样也会出错,如图C所示。系统不允许你删除记录,因为Books表包含匹配的外键值。但可以删除O'Reilly的记录,因为Books表中没有任何记录将O'Reilly作为外键使用。
图C
不能删除Apress记录
如果将Apress修改成RabbitPress,会再次出现上述错误。记住,只要在相关的表中存在匹配的外键值,那么主键也是不能修改的。相反,O'Reilly就能修改成RabbitPress。
启用级联选项
强制了引用完整性后,如果必须更改或删除一个主键值,就可能遇到麻烦。为此,你可以在更改时暂时禁用引用完整性,或者启用一个级联选项(并非所有系统都支持级联选项,请查阅文档以确认)。
级联更新
启用一个级联更新选项后,就可在存在相匹配的外键值的前提下更改一个主键值。系统会相应地更新所有匹配的外键值。下面来看看Microsoft Access中的一个例子。如图D所示,打开Books和Publishers表之间的级联选项(参阅系统文档了解如何启用该选项)。
图D
启用级联更新选项
接着打开Publishers表,试验将Apress变成RabbitPress。这一次,系统将接受更改,而不是像图C那样报错。但是,幕后会发生很多事情。打开Books表并检查PublisherFK值。如图E所示,系统在接受RabbitPress后,将所有匹配的外键值从Apress变成了RabbitPress。这样一来,更改主键值时就不会产生“孤儿”。
图E
级联更新选项更改了所有匹配的外键值
如果系统不允许编辑“自动编号”数据类型,但一个主键要基于这样的一个字段,那么级联更新是没有用的。当然,由于不能更改主键值,所以也不会产生冲突。
级联删除
在相关的表中存在相匹配的外键值时,你可以删除一个主键。启用级联删除选项后,就能成功删除主键值。这时,系统会自动删除外键记录,以避免产生“孤儿”。
在下一个例子中,你必须启用级联删除选项(如图D所示)。接着,打开Publishers表并试着删除第一条记录(Apress)。系统可能显示如图F所示的一条警告消息。
图F
删除主键值时显示警告消息
最后打开Books表,查看从Publishers表删除Apress后的结果。匹配的外键(整条记录,而非仅仅是外键值)都被删除了,如图G所示。仔细观察,你会发现SQL: Access to SQL Server记录已经消失了。
图G
级联删除选项会删除匹配的外键记录
警告!
级联选项(尤其是级联删除选项)如果使用不当,可能产生破坏性的后果。为了保护数据,不要永久性地启用这两个选项。相反,只有在真正需要时,而且有十足的把握时,才暂时启用它们。用毕后则将其关闭。
结束语
关系数据库理论使许多人头痛,但只要理解了基本规则(尤其是在有了一些经验之后),就会发现它们其实很容易实现。最后,提醒你注意一个好设计的重要性。正确设计的关系数据库经得起时间和成长的考验。相反,设计欠佳的数据库很难使用和修改,甚至可能产生不正确的数据。不要随心所欲地设计,要一步一步地遵照设计过程进行操作。