问答题 阅读以下关于软件系统数据建模的说明。
[说明]
某软件公司成立项目组为某高校开发一套教职工信息管理系统。与教职工信息相关的数据需求和处理需求如下:
(1)数据需求:在教职工信息中能够存储学校所有在职的教工和职工信息,包括姓名、所属部门、出生年月、工资编号、工资额和缴税信息;部门信息中包括部门编号、部门名称、部门人数和办公地点信息。
(2)处理需求:能够根据编制内或外聘教职工的工资编号分别查询其相关信息;每个月的月底统一核发工资,要求系统能够以最快速度查询出教工或者职工所在部门名称、实发工资金额;由于学校人员相对稳定,所以数据变化及维护工作量很少。
项目组王工和李工针对上述应用需求分别给出了所设计的数据模型(如图2-1和图2-2所示)。王工遵循数据库设计过程,按照第三范式对数据进行优化和调整,所设计的数据模型简单且基本没有数据冗余;而李工设计的数据模型中存在大量数据冗余。
项目组经过分析和讨论,特别是针对数据处理中对数据访问效率的需求,最终选择了李工给出的数据模型设计方案。

问答题 请用300字以内的文字,说明什么是数据库建模中的反规范化技术,指出采用反规范化技术能获得哪些益处,可能带来哪些问题。
[*]
[*]
【正确答案】规范化设计后,数据库设计者希望牺牲部分规范化来提高性能,这种从规范化设计的回退方法叫做反规范化技术。反规范化设计允许保留或者新增一些冗余数据,从而减少数据查询中表连接的数目或简化计算过程,提高数据访问效率。
采用反规范化技术的益处:能够减少数据库查询时SQL连接的数目,从而减少磁盘I/O数据量,提高查询效率。
可能带来的问题:数据的重复存储,浪费了磁盘空间;为了保障数据的一致性,增加了数据维护的复杂性。
【答案解析】[解析] 本题主要考查考生对于软件系统数据建模的掌握情况。
此类题目要求考生认真阅读题目对现实问题的描述,根据数据模型设计方案选择的条件判断题目的考点。数据库设计是把现实的业务模型与需求转换为数据库模型的过程,是建立数据库应用系统的核心和关键。数据库设计的关键是如何使设计的数据库能够合理地存储用户的数据,方便用户进行数据处理。
数据库规范化理论是研究将一个不合理的关系模式转化为合理的关系模式的理论,通过不同的规范化级别优化数据存储。数据库规范化的优点是减少了数据冗余,节省了存储空间,相应的逻辑和物理的I/O次数减少,同时加快了增删改的速度;但是对完全规范化的数据库进行查询,通常需要更多的连接操作,从而影响了查询的效率。因此,有时为了提高某些查询或应用的性能而破坏规范化规则,即采用反规范化技术。
在实际应用中使用反规范化技术,要充分考虑数据的存储需求、常用表的大小、一些特殊的计算、数据的物理存储位置等。反规范化的好处是降低连接操作的需求,减少了外键和索引数目,可能会减少表的数目,从而减少磁盘I/O数据量,提高查询效率。
在决定进行反规范时,一定要权衡利弊,仔细分析应用的数据存取需求和实际的性能特点,好的索引和其他方法经常能够解决性能问题,而不必采用反规范这种方法。反规范化会带来数据的重复存储,浪费了磁盘空间;而且为了保障数据的一致性,增加了数据维护的复杂性。维护常用的方法是批处理、应用逻辑和触发器。
问答题 请简要叙述常见的反规范化技术有哪些。
【正确答案】常见的反规范化技术包括:
(1)增加冗余列:在多个表中保留相同的列,通过增加数据冗余减少或避免查询时的连接操作;
(2)增加派生列:在表中增加可以由本表或其他表中数据计算生成的列,减少查询时的连接操作并避免计算或使用集合函数;
(3)表水平分割:根据一列或多列数据的值,把数据放到多个独立的表中,主要用于表数据规模很大、表中数据相对独立或数据需要存放到多个介质上时使用;
(4)表垂直分割:对表进行分割,将主键与部分列放到一个表中,主键与其他列放到另一个表中,在查询时减少I/O次数。
【答案解析】[解析] 常用的反规范技术有增加冗余列、增加派生列和分割表,分割表包括水平分割和垂直分割两种形式。(1)增加冗余列是指在多个表中具有相同的列,它常用来在查询时避免连接操作。(2)增加派生列指增加的列来自其他表中的数据,由它们计算生成。它的作用是在查询时减少连接操作,避免使用集函数。(3)表水平分割根据一列或多列数据的值把数据行放到两个独立的表中。水平分割通常在下面的情况下使用:①表很大,分割后可以降低在查询时需要读的数据和索引的页数,同时也降低了索引的层数,提高查询速度。②表中的数据本来就有独立性,例如表中分别记录各个地区的数据或不同时期的数据,特别是有些数据常用,而另外一些数据不常用。③需要把数据存放到多个介质上。(4)表垂直分割把主码和一些列放到一个表,然后把主码和另外的列放到另一个表中。如果一个表中某些列常用,而另外一些列不常用,则可以采用垂直分割,另外垂直分割可以使得数据行变小,一个数据页就能存放更多的数据,在查询时就会减少I/O次数。其缺点是需要管理冗余列,查询所有数据需要join操作。
问答题 请分析李工是如何应用反规范化技术来满足教职工信息管理需求的。
【正确答案】在教职工信息管理系统的需求中,(1)能够根据编制内或外聘教职工的工资编号分别查询其相关信息;(2)数据查询要求有很高的处理效率。
李工所设计的数据模型中采用了三种反规范化技术:
(1)增加冗余列:增加“部门名称”列,消除了数据查询中“教职工信息”表和“部门信息”表之间的连接;
(2)增加派生列:增加“实发工资”列,消除了实发工资的计算过程;
(3)表水平分割:将教职工信息表分割为“编制内教职工信息”表和“外聘教职工信息”表,减少了数据查询的范围。
【答案解析】[解析] 教职工信息管理系统要求“能够根据编制内或外聘教职工的工资编号分别查询其相关信息”和“数据查询要求有很高的处理效率”,对比王工和李工所设计的数据模型可以发现,在后者所设计的数据模型中:增加“部门名称”列;增加“实发工资”列;将教职工信息表分割为“编制内教职工信息”表和“外聘教职工信息”表。通过分析,李工设计的数据模型分别使用了反规范化的增加冗余列、增加派生列和表水平分割三种技术。