在spark中,以下关于dataframe描述,错误的是()
A.dataframe是指定列名称的dataset
B.dataframe提供详细的结构信息
C.dataframe不是面向对象的
D.dataframe在序列化与反序列化时,要对数据和数据结构进行序列化
A.dataframe是指定列名称的dataset
B.dataframe提供详细的结构信息
C.dataframe不是面向对象的
D.dataframe在序列化与反序列化时,要对数据和数据结构进行序列化
第4题
A.Flume
B.Zookeeper
C.HIVE
D.Spark
第6题
A.TGT全称为票据授权服务票据,主要由KDC服务器生成
B.TGT一次生成之后,可以无限期使用
C.TGT在客户端的存在方式可以是在内存中存储,也可以在本地以文件的形式存储
D.TGT中主要的信息有当前该票据的有效时长和授予该TGT的服务端IP以及分发给的客户端名称
第7题
B.Carbon使用轻量级压缩和重量级压缩的组合压缩算法压缩数据,可以减少60%-80%数据存储空间,大大节省硬件存储成本
C.Carbon是一种新型的ApacheHadoop本地文件格式,使用先进的列式存储.索引.压缩和编码技术,以提高计算效率,有助于加速超过PB数量级的数据查询,可用于更换的交互查询
D.Carbon也是一种将数据源与Spark集成的高性能分析引擎
第8题
A.SparkSQL
B.Hive
C.Spark
D.MapReduce