选择题 14.  下列属于分布式文件系统的是______。
【正确答案】 D
【答案解析】 分布式文件系统(Disttibuted File System,DFS)是指文件系统管理的物理存储资源不一定直接连接在本地结点上,而是通过计算机网络与网络中其他结点相连。它的设计基于C/S(Client/Server,客户端/服务器)模式,将存储资源管理放在Server(服务器)端,Client(客户)端负责用户访问操作以及与Servet交互,Server通过管理的存储资源中获取存储数据。与它对立的就是本地文件系统,本地文件系统是基于单主机、单操作系统管理本地存储资源。
   对于选项A,HBase全称是Hadoop Database,它是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,本质上是一个开源数据库,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。
   对于选项B,Spark是一个通用的并行计算框架,由UC Berkeley大学的Matei为主的小团队所开发。使用的语言是Scala,项目的Core(核心)部分的代码只有63个Scala文件,充分体现了精简之美。Spark要解决的问题是,在当前的分布式计算框架中不能有效处理的两类问题:iterative(迭代计算)和interactive(交互式)计算。
   对于选项C,MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。简单概括地说,MapReduce是将一个大作业拆分为多个小作业的框架(大作业和小作业本质应该是一样的,只是规模不同而已),用户需要做的就是决定拆成多少份,以及定义作业本身。
   对于选项D,KFS全称是Kosmos distributed File System,它是一个专门为数据密集型应用(搜索引擎、数据挖掘等)而设计的具有业内先进水平的存储系统,系统架构及功能服务类似于Google的GFS和Hadoop的HDFS分布式文件系统。它通过HTTP-WEB为上层应用系统(KASS文档管理系统及其他各种应用系统)提供底层文件服务,从而为企业快速搭建云文件服务平台。
   对于选项E,Hive是一个基于Hadoop的数据仓库工具,它可以将结构化的数据文件映射为一张数据库表,并提供简单的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行。
   由于文件系统的英文名称为File System,简写为FS,所以,带FS的一般表明它是文件系统,故分布式文件系统有KFS、NFS、AFS、GFS等。通过以上分析可知,选项D正确。