问答题 随着传统的数据库技术的成熟和计算机网络技术的发展,分布式数据库系统的研究与开发受到人们越来越多的关注。分布式数据库支持数据独立性和分布透明性。用户不必关心数据的逻辑分区,不必关心数据物理位置分布的细节,也不必关心副本的一致性问题。
问答题 请用200字以内的文字叙述分布式数据库的主要特性和优缺点。
【正确答案】分布式数据库具有物理分布性、位置自治性与协作性,支持数据独立性、集中与自治相结合的控制、适度数据冗余度、分布的事务管理。 优点包括具有灵活的体系结构、分布式的管理和控制、系统的高可靠性和可用性、高扩展性、局部处理、响应速度快、经济性能优越。 缺点包括系统开销通信较大、复杂的存取结构、保持数据一致性算法复杂、数据的安全性和保密性要求高。
【答案解析】
问答题 在数据库中,某个业务表中的数据量很大,急速膨胀,在这样的情流下,为了保持高的数据响应速度,根据数据的______和______原则,可以对数据表进行分片设计。一般有两种分片方法:______和______。 请在空白处填写恰当的内容并请用200字以内的文字叙述数据表分片满足的条件并给出简要说明。
【正确答案】时间局部性;空间局部性;水平分片;垂直分片 数据表分片满足的条件如下: 完备性条件:必须把全局关系的所有数据映射到片段中,决不允许有属于全局关系的数据却未被映射到任何一个片段。 可重构条件:必须保证能够由同一个全局关系的各个片段来重建该全局关系。对于水平分片可用并操作重构全局关系;对于垂直分片可用连接操作重构全局关系。 不相交条件:要求一个全局关系被分割后所得的各个数据片段互不重叠(对垂直分片的主键除外)。
【答案解析】
问答题 分布式数据库中各局部数据库应满足集中式数据库的基本需求,除此以外还应保证数据库的全局数据______、并发操作的______和故障的全局______。 请在空白处填写恰当的内容并请用300字以内的文字简述保持数据一致性的方法。
【正确答案】一致性;可串行性;可恢复性 保持数据库一致性的方法,要点如下:数据副本的一致性、保证分布式事务的ACID属性、故障恢复的一致性。
【答案解析】[解析] 分布式数据库在逻辑上是一个统一的整体,在物理上则是分别存储在不同的物理节点上。分布式数据库具有以下几个特点: ①数据独立性与位置透明性。数据独立性是数据库方法追求的主要目标之一,分布透明性指用户不必关心数据的逻辑分区,不必关心数据物理位置分布的细节,也不必关心重复副本(冗余数据)的一致性问题,同时也不必关心局部场地上数据库支持哪种数据模型。分布透明性的优点是很明显的。有了分布透明性,用户的应用程序书写起来就如同数据没有分布一样。当数据从一个场地移到另一个场地时不必改写应用程序。当增加某些数据的副本时也不必改写应用程序。数据分布的信息由系统存储在数据字典中。用户对非本地数据的访问请求由系统根据数据字典予以解释、转换、传送。 ②集中和节点自治相结合。在集中式数据库中,为了保证数据库的安全性和完整性,对共享数据库的控制是集中的,并设有DBA负责监督和维护系统的正常运行。在分布式数据库中,数据的共享有两个层次:一是局部共享,即在局部数据库中存储局部场地上各用户的共享数据。这些数据是本场地用户常用的;二是全局共享,即在分布式数据库的各个场地也存储可供网中其他场地的用户共享的数据,支持系统中的全局应用。因此,相应的控制结构也具有两个层次:集中和自治。分布式数据库系统常常采用集中和自治相结合的控制结构,各局部的DBMS可以独立地管理局部数据库,具有自治的功能。同时,系统又设有集中控制机制,协调各局部DBMS的工作,执行全局应用。 ③支持全局数据库的一致性和和可恢复性。分布式数据库中各局部数据库应满足集中式数据库的一致性、可串行性和可恢复性。除此以外还应保证数据库的全局一致性、并行操作的可串行性和系统的全局可恢复性。这是因为全局应用要涉及两个以上节点的数据。因此,在分布式数据库系统中,一个业务可能由不同场地上的多个操作组成。这些操作要比集中式数据库复杂和困难得多,分布式数据库系统必须解决这些问题。 ④复制透明性。用户不用关心数据库在网络中各个节点的复制情况,被复制的数据的更新都由系统自动完成。在分布式数据库系统中,可以把一个场地的数据复制到其他场地存放,应用程序可以使用复制到本地的数据在本地完成分布式操作,避免通过网络传输数据,提高了系统的运行和查询效率。但是对于复制数据的更新操作,就要涉及对所有复制数据的更新。 ⑤易于扩展性。在大多数网络环境中,单个数据库服务器最终会不满足使用。如果服务器软件支持透明的水平扩展,那么就可以增加多个服务器来进一步分布数据和分担处理任务。 分布式数据库的主要优点如下: ①具有灵活的体系结构。 ②适应分布式的管理和控制机构。 ③经济性能优越。 ④系统的可靠性高、可用性好。 ⑤局部应用的响应速度快。 ⑥可扩展性好,易于集成现有系统。 分布式数据库的主要缺点如下: ①系统开销大,主要花在通信部分。 ②复杂的存取结构,原来在集中式系统中有效存取数据的技术,在分成式系统中都不再适用。 ③数据的安全生和保密性较难处理。 数据分片将数据库整体逻辑结构分解为合适的逻辑单位(片段),然后由分配模式来定义片段及其副本在各场地的物理分布,其主要目的是提高访问的局部性,有利于按照用户的需求组织数据的分布和控制数据的冗余度。 数据分片应遵循的准则如下: ①完整性。全局关系的所有数据都必须分配到各个片段中,不允许某些数据属于全局关系但不属于任何片段。 ②重构性。分裂后各个片段可以重构原来的全局关系。 ③不相交性。全局关系中的每个元组仅属于一个片段,不能在多个片段中重复出现。此规则不是必需的,因为在有冗余DDBS中数据可有多个副本。但片段中的部分元组重复将会使数据的更新操作变得复杂,为简化操作控制,片段间一般是不相交的。 分片的方式有多种,水平分片和垂直分片是两种基本的分片方式,混合分片和导出分片是较复杂的分片方式。 ①水平分片:把一个全局关系中的元组分裂成多个子集,每个子集为一个片段。分片条件由关系中的属性值表示。对于水平分片,重构全局关系可通过关系的并操作实现。 ②垂直分片:把一个全局关系按列分裂成多个子集,应满足不相交性(关键字除外)。对于垂直分片,重构全局关系可通过连接运算实现。 ③导出分片:它也是一种水平分片,但分片的限定条件不是该关系中的属性,而是由与该关系有联系的其他关系导出的。 ④混合分片:是在分片中采用水平分片、垂直分片和导出分片3种形式的混合。 问题3是3个填空题。这个问题在前面已经给出了答案:全局的一致性、可串行性和可恢复性。