下面关于MapReduce的描述中正确的是()。
A.MapReduce程序必须包含Mapper和Reducer
B.MapReduce程序的MapTask可以任意指定
C.MapReduce程序的ReduceTask可以任意指定
D.MapReduce程序的默认数据读取组件是TextInputFormat
A.MapReduce程序必须包含Mapper和Reducer
B.MapReduce程序的MapTask可以任意指定
C.MapReduce程序的ReduceTask可以任意指定
D.MapReduce程序的默认数据读取组件是TextInputFormat
第1题
A.Hive最终将数据存储在HDFS中
B.HiveSQL其本质是执行的MapReduce任务
C.Hive是Hadoop平台的数据仓库工具
D.Hive对HBase有强依赖
第2题
A.抽象层次低,需要手工编写代码来完成,使用上难以上手
B.只提供两个操作,Map和Reduce,表达力欠缺
C.处理逻辑隐藏在代码细节中,没有整体逻辑
D.中间结果也放在HDFS文件系统中
第4题
A.MapReduce采用“ 分而治之”策略
B.MapReduce设计的一个理念就是“ 计算向数据靠拢”
C.MapReduce框架采用了Master/Slave架构
D.MapReduce应用程序只能用Java来写
第5题
A.Hive支持所有标准SQL语法
B.Hive底层采用的计算引擎是MapReduce
C.Hive提供的HQL语法,与传统SQL很类似
D.HiveServer可采用MySQL存储元数据信息
第6题
A.写入数据的时候会写到不同机架的DataNode中
B.如果一个机架出问题,不会影响数据读写
C.MapReduce会根据机架获取离自己比较近的网络数据
D.机架感知是Hadoop默认配置,无需再做配置设置
第7题
A.分为Map和Reduce两个阶段
B.Map阶段由一系列Map任务组成
C.Reduce阶段由一系列Reduce任务组成
D.Map阶段与Reduce阶段没有任何依赖关系
第8题
A.MapReduce是一种计算方式,是用以进行大数据量计算的方法
B.Map对数据集上的独立元素进行指定操作
C.生成的中间结果不是键-值对形式输出
D.Reduce则对中间结果中相同“键”的所有“值”进行规约,以得到最终结果
第9题
A.加入了yarn解决了资源调度的问题
B.HDFS增强了NameNode的水平扩展及可用性
C.引入HBase列数据库代替传统关系型数据库
D.MapReduce拆分JobTracker为资源管理及任务生命周期管理两个独立的组件
第10题
A.Hadoop是一个由Apache基金会开发的分布式系统开源架构
B.Hadoop的初始设计思想来源于Google发布的学术论文
C.Hadoop在当前衍生的一系列优秀的开源项目,包括Hbase,Hive等
D.Hadoop的两个核心部分是HDFS和MapReduce计算框架
第11题
A.两者不可或缺,MapReduce是HBase可以正常运行的保证
B.两者不是强关联关系,没有MapReduce,HBase可以正常运行
C.MapReduce要通过HDFS来访问Hbase
D.它们之间没有任何关系