Hadoop中,与谷歌对应的三项分布式云计算技术包括()。
A.HDFS
B.MapReduce
C.BIGTABLE
D.HBase
A.HDFS
B.MapReduce
C.BIGTABLE
D.HBase
第1题
A.是一种通过网络实现文件在多台主机上进行分布式存储的文件系统
B.所有的分布式文件系统的设计都是采用“客户机/服务器”(Client/Server)模式
C.谷歌开发了分布式文件系统GFS
D.Hadoop分布式文件系统(HadoopDistributedFileSystem,HDFS)是针对GFS的开源实现
第2题
A.Hadoop是一个由Apache基金会开发的分布式系统开源架构
B.Hadoop的初始设计思想来源于Google发布的学术论文
C.Hadoop在当前衍生的一系列优秀的开源项目,包括Hbase,Hive等
D.Hadoop的两个核心部分是HDFS和MapReduce计算框架
第6题
A.利用MapReduce计算模型
B.基于Hadoop集群
C.实现了一批开源的挖掘方法
D.采用了DFS分布式文件系统
第7题
A.Spark引进了弹性分布式数据集RDD(ResilientDistributedDataset)的抽象,容错性高
B.Spark提供的数据集操作类型不仅限于Map和Reduce,大致分为:Transformations和Actions两大类
C.Spark程序由Python语言进行编写,不支持Java语言进行的程序编写
D.Spark把中间数据放到内存中,迭代运算效率高
第8题
A.系统内不适合多表复杂关联,需要在数据进入HADOOP前做好数据关联
B.适合非低延迟数据处理
C.集群支持分布式并行写入,并发写入速度快
D.大数据的关联能力弱
第9题
A.Pig:处理大规模数据的脚本语言
B.Tez:支持DAG作业的计算框架
C.Oozie:工作流和协作服务引擎
D.Kafka:分布式发布订阅消息系统
第10题
B.分布式消息服务Kafka
C.对象存储服务OBS
D.应用与数据集成平台ROMA Connect