问答题
阅读以下关于软件系统数据架构建模的说明,根据要求回答下面问题。
[说明]
RMO是一家运动服装制造销售公司,计划在5年的时间内将销售区域从华南地区扩展至全国范围。为了扩大信息技术对于未来业务发展的价值,公司邀请咨询顾问帮助他们制订战略信息系统规划。经过评审,咨询顾问给出的战略规划要点之一是建立客户关系支持系统CRSS。RMO公司决定由其技术部成立专门的项目组负责CRSS的开发和维护工作。
项目组在仔细调研和分析系统需求的基础上,确定了基于互联网的CRSS系统架构。但在确定系统数据架构时,张工认为应该采用集中式的数据架构,给出的理由是结构简单、易维护且开发及运行成本低;而刘工建议采用分布式的数据架构,并提出在开发中通过“局部数据库+缓存”的读写分离结构实现,具有较好的运行性能和可扩展性。
项目组经过集体讨论,考虑到公司的未来发展规划,最终采用了刘工的建议。
问答题
请用300字以内的文字,说明张工和刘工提出的数据架构的基本思想。
【正确答案】
【答案解析】(1)张工提出的集中式数据架构是由一个处理器、与它相关联的数据存储设备以及其他外围设备组成,它被物理地定义到单个位置。系统提供数据处理能力,用户可以在同样的站点上操作,也可以在地理位置隔开的其他站点上通过远程终端来操作。系统及其数据管理被某个或中心站点集中控制。
(2)刘工提出的分布式数据架构使用多个计算机系统上的多个局部数据库系统构成,数据可以在多个不同的局部数据库中进行传送,由不同的数据库管理系统软件进行管理,运行在多种不同的计算机上,支持多种不同的操作系统。这些机器位于(或分布在)不同的地理位置并通过多种通信网络连接在一起。企业数据可以分布在不同的计算机上,一个应用程序可以操作位于不同地理位置的机器上的数据
数据架构定义了信息系统中文件和数据库的分布结构。数据架构建模是以数据为中心,建模业务数据类型和结构,以及设计满足应用需求的数据库系统。传统集中式数据架构是以主机为中心,利用单个的数据库系统来实现数据的集中式存储,物理上所有的数据位于同一个位置。系统提供数据处理能力,用户可以在同样的站点上操作,也可以在地理位置隔开的其他站点上通过远程终端来操作。系统及其数据管理被某个站点或中心站点集中控制。单个数据库服务器结构的主要优点是简单、易维护开发及运行成本低。但由于所有的客户直接请求服务器,容易发生性能瓶颈,如果服务失败,单个服务器不能提供备份和恢复,所有依赖的应用程序都将不能工作。
在现代基于网络的分布式数据架构中,使用多个计算机系统,用户能够访问远程系统的数据,数据可以在多个不同的数据库中进行传送,由不同的数据库管理系统软件进行管理,运行在多种不同的计算机上,支持多种不同的操作系统。这些机器位于(或分布在)不同的地理位置并通过多种通信网络连接在一起。企业数据可以分布在不同的计算机上,一个应用程序可以操作位于不同地理位置的机器上的数据。多个数据库服务器结构的主要优点是系统的容错能力和对广域网容量的需求有所降低,可以采用多种策略提升整个系统的服务质量。由于多个数据库系统分布在不同的网络节点上,位于不同位置的数据之间需要同步和协作,因此系统结构复杂、运行成本高并且维护困难。
在实际应用系统的数据架构建模中,应根据不同的应用需求选择集中式或分布式的数据架构。由于RMO要扩展其销售区域,其潜在客户数量也会因此大幅度增加,因此良好的可扩展性是CRSS系统所必需的质量属性,并且因为其销售区域扩大后,系统中的数据会存储于不同的地理位置,所以采用分布式数据架构最为合理。
问答题
在刘工建议的基础上,为了避免CRSS系统的单点故障,请用200字以内的文字简要说明如何建立CRSS的数据库系统;对于数据的读取、添加、更改和删除操作分别如何实现。
【正确答案】
【答案解析】CRSS的分布式数据库系统需要由多个局部数据库系统、多个热备份数据库系统和多个数据缓存组成。局部数据库负责数据的写入,多个热备份数拥库系统用以解决单点故障的问题,数据缓存负责为应用提供所读取的数据。
(1)读取数据:应用访问缓存,如果命中则返回,否则从局部数据库系统中读取数据并将数据加载到缓存后返回。
(2)添加数据:采用延迟加载策略,应用将数据直接写入局部数据库。
(3)更改数据:应用更改局部数据库中的数据,将缓存中的数据标记为失效。
(4)删除数据:应用删除局部数据库中的数据,将缓存中的数据标记为失效。
依题意,刘工建议采用分布式的数据架构,并在开发中通过“局部数据库+缓存”的读写分离结构实现。通过缓存层来承载大量的读访问,例如广泛采用的Mencached,其自身往往不具备持久层存储的功能,通常和数据库一起组成分布式的数据架构,由数据库负责数据持久化存储和写入功能,缓存负责承载大量的并发访问,从而提高了系统的数据处理效率。要避免数据访问的单点故障,通常采用主数据库热备份的方式来实现。因此,该CRSS的分布式数据库系统需要由多个局部数据库系统、多个热备份数据库系统和多个数据缓存组成。局部数据库负责数据的写入,多个热备份数据库系统用以解决单点故障的问题,数据缓存负责为应用提供所读取的数据。
在读写分离结构中,读取数据时,应用访问缓存,若命中则返回,若没有命中所需数据,则从局部数据库中读取数据并将数据加载到缓存后返回。对于新增、修改和删除操作,需要采用延迟加载的策略。新增数据时,应用将数据直接写入局部数据库;修改和删除数据时,除了修改局部数据库中的内容,还需要将缓存中的数据标记为失效。
问答题
RMO公司的销售区域将在未来5年大面积扩展,其潜在客户数量也会因此大幅度增加,所以良好的可扩展性是CRSS系统所必需的质量属性。请分别说明在集中式和分布式数据架构下,可以采用哪些方法提升系统的可扩展性。
【正确答案】
【答案解析】集中式数据架构提升系统可扩展性的实现方式包括(但不限于):硬件扩容(增加CPU数量、内存容量和磁盘数量);硬件升级(更换高端主机或高速磁盘等)。
分布式数据架构提升系统可扩展性的实现方式包括(但不限于):数据复制、数据垂直切分和水平切分、缓存、全文搜索
在传统的集中式数据架构中,由于只有单个的数据库系统,因此要满足可扩展性的要求,通常是通过硬件的方式来实现,即通过向上扩展(Scale Up)提升系统的可扩展性。具体的实现方式包括(但不限于):硬件扩容(增加CPU数量、内存容量和磁盘数量);硬件升级(更换高端主机或高速磁盘等)。
在基于网络的分布式数据架构中,由多个数据库系统共同组成,可以通过更改和优化数据分布来满足系统可扩展性的要求,即通过向外扩展(Scale Out)提升系统的可扩展性。具体的实现方式包括(但不限于):数据复制、数据垂直切分和水平切分、缓存、全文搜索。