问答题 信息是每家企事业单位可持续发展的核心动力之一,信息的可靠存储是每个单位得以正常运作和发展壮大的根本所在。利用新的存储技术构建一个符合基于网络的、支持多应用服务系统、支持异构系统平台、满足大用户访问量的存储系统,是每个单位管理信息系统架构中的设计要点之一。
请围绕“分布式网络存储系统的规划与设计”论题,依次对以下3个方面进行论述。
1.概要叙述你参与管理和开发的大中型管理信息系统项目及你在其中所承担的主要工作。
2.简要叙述常见的网络化存储技术,详细论述你在该管理信息系统项目中针对特有的应用环境和需求采用了哪些分布式网络存储系统的设计技术、方法和步骤,采取这些技术和方法有何优点?
3.分析你采取上述技术和方法的效果如何,还有哪些需要进一步改进之处,以及如何进行改进。

【正确答案】1.简要介绍你亲身参与的、含有分布式网络化存储系统的大中型管理信息系统项目的基本情况,并说明你在其中担任的角色及主要完成了哪些项目的规划和设计工作。论文叙述自己参与设计和实施的信息系统项目应有一定的规模,自己在该项目中担任的主要工作应有一定的分量。
2.目前,信息系统的数据存储有多种方式,网络连接存储(NAS)、存储区域网络(SAN)和基于对象的存储系统(CAS)是属于网络化存储的主流网络存储技术。其中,NAS将存储设备通过标准的网络拓扑结构(如以太网),连接到一群计算机上,提供数据和文件服务。NAS服务器通常由存储硬件、操作系统,以及其上的文件系统等几个部分组成。这种专用存储服务器不同于传统的通用服务器,它去掉了通用服务器的大多数计算功能,而仅仅提供文件系统功能,从而降低了设备的成本。它以数据为中心,将存储设备与服务器分离,其存储设备在功能上完全独立于网络中的主服务器,客户机与存储设备之间的数据访问不再需要文件服务器的干预,同时它允许客户机与存储设备之间进行直接的数据访问,所以不仅响应速度快,而且数据传输速率很高。另外对服务器的要求降低,可大大降低服务器成本,这样就有利于高性能存储系统在更广的范围内普及应用。
SAN是通过专用高速网将一个或多个网络存储设备和服务器连接起来的专用存储系统。基于FC(光纤通道)协议的SAN通常位于服务器后端,采用光纤通道协议来传输数据,是为连接服务器、磁盘阵列和带库等存储设备而建立的高性能网络。FC SAN技术的最大特点是将存储设备从传统的以太网中分离了出来,成为独立的存储区域网络。SAN提供了良好的存储连接,服务器可以访问存储区域网上的任何存储设备;同时存储设备之间,以及存储设备同SAN交换机之间也可以进行通信。SAN以数据存储为中心,采用可伸缩的网络拓扑结构,通过具有高传输速率的光通道的直接连接,提供了SAN内部任意节点之间的多路可选择的数据交换,并且将数据存储管理集中在相对独立的存储区域网内。
基于IP的SAN允许用户在已有的以太网上创建存储网络,能够保存更多的数据,可在任何地点部署更多的信息。IP SAN采用10G以太网交换机代替传统的专用存储交换机,从而降低了成本,同时由于它采用的是传统的IP,因此传输距离不受限制。在IP存储领域中,iSCSI技术是其中较成熟的一个技术。iSCSI(Internet SCSI)是工作在TCP顶层的传输协议,完成IP网上SCSI I/O数据的封装。它实现了SCSI和TCP/IP的连接。iSCSI完全抛弃了光纤通道,基于主机的应用程序与网络存储设备是通过IP直接通信的。相对于FC SAN光纤基础结构的昂贵造价,iSCSI借助了成熟的以太网技术使得低成本的网络存储得以实现,因此iSCSI发展比较迅速,已成为IP存储的强有力代表。NAS与SAN存储技术的比较如表3—15所示。
表3-15 NAS与SAN的比较
比较项目 NAS SAN
协议集 TCP/IP FC相关协议集
操作系统 是和Cluster无关的,NAS设备有自己的OS 与Cluster密切相关,SAN中的存储设备没有OS
文件系统 基于File System 基于逻辑单元号(LUN)的
连接方式 通过RJ-45接口连接 由FC交换机组成的一个存储网络
存储数据结
数据是不排外的,同一个逻辑区域可以被多个服务器
读取和修改
数据是放在LUN上的,同一个区域需要Lock Manager来控制,不允
许同时读写
体系结构 主要作为散布在LAN中的各个分开的存储系统 主要是作为一个整体概念存在于企事业单位中的,可以看做是一个单
独的存储系统
应用场合 性价比较好,适合中小企事业单位的中央存储 性能优秀,但价格较高,适合大型企事业单位和关键应用的核心存储
系统
CAS系统为每一个保存对象及其元数据分配一个独特的地址,在数据的使用过程中无论该对象被使用多少次,也只保存一份原件,不会出现重复。CAS多用来存档参考型数据,比如说电子邮件、文件和应用程序等,它的最大特点是允许用户设置一定的数据管理策略,禁止任何人在指定的时间段内随意更改或删除文件。在对数据进行存储处理时传统的方法是把经常不用的数据存放到成本较低的存储介质上。这种方法占用空间大,存储期限短,而且搜索效率也不高。CAS采用了完全不同的方法,其特点是为每一个对象及其元数据分配一个独特的地址,不会出现重复。因此所有对象和元数据的存档和检索操作,都是在一个巨大的平面地址空间内进行的。CAS以内容为中心,可以满足对固定内容的数据存储需求。
3.网络存储技术目的都是为了扩大存储能力,提高存储性能。这些存储技术都能提供集中化的数据存储并有效存取文件,都支持多种操作系统并允许用户通过多个操作系统同时使用数据,都可以从应用服务器上分离存储并提供数据的高可用性,同时,都能通过集中存储管理来降低长期的运营成本。在实际应用中常常根据企事业单位的业务特点及要求进行选择,FC SAN和IP SAN适合用于存储数据库;NAS适合用于存储文件;CAS可以对固定内容进行存储,它可以像NAS一样存储应用程序。
在层次结构方面,本文所介绍的几种网络存储技术访问磁盘的I/O都需要跨过网络,只是网络的介质有所不同。另外FC SAN和IP SAN的文件系统驻留在本地,而NAS和CAS的文件系统驻留在远端。NAS和SAN具有强大的文件系统及数据管理功能,CAS则完全针对固定内容所设计,所以在存储网络搭建的时候不仅要根据业务要求进行选择,也要考虑到各种存储系统的层次特点。
在技术及性能方面,NAS是基于瘦服务器的,拥有自己的CPU和文件管理系统,由于它是通过网络接口直接连接到网络上的,因此设置简单,便于实施维护而且操作简单,但是由于NAS中每一个节点都有单独的存储设备,这些设备没有一个统一的平台进行管理,所以维护起来比较不容易。FC SAN采用了光纤连接,带宽高,传输速度快,可靠性高,而且它采用了专用的存储交换机,与基本通信网络物理隔开,保证了数据的安全性,并可以在完全不影响应用的情况下进行数据备份。SAN可以通过专用的管理软件来对整个网络中的存储设备进行统一集中的管理,可进一步实现远程管理和无人值守,但是SAN在设备复杂的情况下比较不容易操作。传统上的NAS及SAN存储技术都是基于文件数据(或数据块)且面向事务处理应用所设计的,CAS在技术上弥补了固定内容存储的空缺,它具有面向对象的存储特征,按照所存储内容的指纹寻址,具有良好的可搜索性、安全性、扩展性及可靠性。IP SAN技术继承了:FC SAN技术的优点,同时主要体现出其成本方面的优越性。总的来说,SAN具有高传输速度及高可靠性,适用于传送大量的数据并对网络性能要求较高的企事业单位级规模数据存储。NAS易操作及成本低的优势使得它比较适合应用于高效存取数据环境下的小数据量传输,如工作组和部门级别的存储,使用NAS作为中小企事业单位的存储方案可以充分发挥其性价比。CAS的内容寻址技术大大降低了应用软件操作和管理存储介质上所存储信息的物理地址的难度。CAS主要针对企事业单位的固定内容存储业务,它可以在企业级文档存储、E-mail服务等方面发挥重要作用。
4.说明你在该工程项目中,针对特有的应用环境和需求所采用的网络存储系统的设计技术、方法和步骤,以及它们对该工程项目后期的工作产生了哪些积极(或消极)的影响(效果和存在的问题)。论文最后可以进一步讨论你在该工程项目中获得的相关体会,以及在今后的工作过程中,如果碰到类似的开发项目你将如何应用这些经验或教训。对需要进一步改进的地方,应有具体的着眼点,不能泛泛而谈。同时,还要注意不可脱离实际提出过高的要求,要给出评价依据,评价要客观、适当。
【答案解析】