简要回答将数据仓库、OLAP、数据挖掘结合起来构成新的DSS架构的特点。
第1题
A.可以实现大型互联网企业的数据仓库和BI分析
B.提供了便捷的分析处理海量数据的手段,用户可以不必关心分布式计算细节,从而达到分析大数据的目的
C.可以支持实时OLAP分析
D.可以基于历史数据,进行用户特征和兴趣挖掘
第3题
A.数据集成是将数据由多个数据源合并成一个一致的数据存储(如数据仓库)
B.数据变换可以通过如聚集、删除冗余特征或聚类等方法来降低数据的规模
C.数据归约可以用来把数据压缩到较小的区间(如0.0-1.0),提高了涉及距离度量挖掘算法的准确率和效率
D.数据清理可以用来清除数据中的噪声,纠正不一致
第4题
B、在数据库中的数据有一些是不完整的(有些感兴趣的属性缺少属性值)、含噪声的(包含错误的属性值),并且是不一致的(同样的信息不同的表示方式),因此需要进行数据清理,将完整、正确、一致的数据信息存入数据仓库中
C、数据挖掘就是讲数据罗列在EXCEL中进行计算
D、数据挖掘过程不是一个反复循环的过程,一个步骤如果没有达到预期目标,可直接跳到下一步继续进行
第8题
B.数据仓库:具备百TB级数据支撑能力,可以高效处理百亿行多表连接查询,适用于操作数据库存储ODS(OpenrationalData Store)、数据仓库EDW(EnterpriseData Warehouse)、数据集市 DM(DataMart)
C.混合负载:基于海量数据查询统计分析能力与实务处理能力,行列混存技术同时满足联机事务处理OLTP与联机分析处理OLAP混合负载场景
D.大数据分析:支持结构化数据PB级分析能力,分布式并行数据库集群满足PB级结构化大数据的分析能力