一、选择题
1、数据仓库是随时间变化的,下面的描述不正确的是:
A、数据仓库随时间变化不断增加新的数据内容。
B、捕捉到的新数据会覆盖原来的快照。
C、数据仓库随时间变化不断删去旧的数据内容。
D、数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合。
: B
2、关于基本数据的元数据是指:
A、基本元数据包括与数据源、数据仓库、数据集市和应用程序等结构相关的信息。
B、基本元数据包括与企业相关的管理方面的数据和信息。
C、基本元数据包括日志文件和建立执行处理的时序调度信息。
D、基本元数据包括关于装载和更新处理、分析处理以及管理方面的信息。
答案: A
3、下面有关数据粒度的描述不正确的是:
A、粒度是指数据仓库小数据单元的详细程度和级别。
B、数据越详细,粒度就越小,级别也就越高。
C、数据综合度越高,粒度就越大,级别也就越高。
D、粒度的具体划分将直接影响数据仓库中的数据量以及查询质量。
答案: B
4、有关数据仓库的开发特点,不正确的描述是:
A、数据仓库开发要从数据出发。
B、数据仓库使用的需求在开发出去就要明确。
C、数据仓库的开发是一个不断循环的过程,是启发式的开发。
D、在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据的分析和处理更灵活,且没有固定的模式。
答案: B
5、RAID技术具有容错能力,能够满足对存储能力、性能和可靠性不断提高的要求。其实,实现原理是将数据写入多张磁盘中,如果—张磁盘发生故障,就从其他存放冗余数据的磁盘上访问数据。有关RAID不同级别的描述不正确的是:
A、在RAID 0这一级别上,数据
通过在多组驱动器的扇区上交错地分布着实现,没有奇偶校验,不提供任何冗余。
B、RAID 1称为镜像。在这一级别上,数据被冗余地写入成对的驱动器中,可以独立地从每个驱动器提取该数据。这种方法没有什么缺点,是备份时候经常用到的技术。
C、RAID 3数据记录在成组驱动器上,位交错,只有一个驱动器仍有奇偶校验信息。
D、RAID 5如果采用这一水平的技术,则数据记录在成组的驱动器上扇区交错地存放着,所有驱动器都有奇偶校验信息。
答案: B
6、有关数据仓库测试,下列说法不正确的是:
A、在完成数据仓库的实施阶段中,需要对数据仓库进行各种测试。测试工作中要包括单元测试和系统集成测试。
B、当数据仓库的每个单独组件完成后,就需要对它们进行单元测试。
C、系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回归测试。
D、在测试之前没必要制定详细的测试
。
答案: D
7、OLAP技术的核心是:
A、在线性
B、对用户的快速响应
C、互操作性
D、多维分析
答案: D
8、关于OLAP的特性,下面正确的是:
①快速性②可分析性③多维性④信息性⑤共享性
A、①、②、③
B、②、③、④
C、①、②、③、④
D、①、②、③、④、⑤
答案: D
9、关于OLAP和OLTP的区别的描述,不正确的是:
A、OLAP主要是关于如何理解聚集的大量不同的数据。它与OLAP应用程序不同。
B、与OLAP应用程序不同,OLTP应用程序包含大量相对简单的事务。
C、OLAP的特点在于事务量大,但事务内容比较简单且重复率高。
D、OLAP是以数据仓库为基础的,其最终数据来源与OLTP一样均来自底层的数据库系统,两者面对的用户是相同的。
答案: D
10、OLAM技术一般简称为“数据联机分析挖掘”,下面说法正确的是:
A、OLAP和OLAM都基于客户机/服务器模式,只有后者有与用户的交互性。
B、由于OLAM的立方体和用于OLAP的立方体有本质的区别。
C、基于Web的OLAM是Web技术与OLAM技术的结合。
D、OLAM服务器通过用户图形接口接收用户的分析指令,在元数据的指导下,对超级立方体作一定的操作。
答案: D
11、数据仓库的数据具有四个基本特征,下列不正确的是:
A、面向主题的。
B、集成的。
C、不可更新的。
D、不随时间变化的。
答案: D
12、下列是关于OLAP的描述,不正确的是:
A、一个多维数组可以表示为:(维1,维2,……,维n)
B、维的一个取值称为该维的一个维成员
C、OLAP是联机分析处理
D、OLAP是以数据仓库进行分析决策的基础
答案: A
13、关于OLAP和OLTP的说法,下列不正确的是:
A、OLTP事务量大,但事务内容比较简单且重复率高
B、OLAP的最终数据来源与OLTP不一样
C、OLTP面对的是决策人员和高层管理人员
D、OLTP以应用为核心,是应用驱动的
答案: B
14、关于数据仓库元数据的描述,下列不正确的是:
A、元数据描述了数据的结构、内容、码、索引等项内容。
B、元数据内容在设计数据仓库时确定后,就不应该再改变。
C、元数据包含对数据转换的描述。
D、元数据是有效管理数据仓库的重要前提。
答案: B
15、下列描述不正确的是:
A、模型辅助决策系统一般可以使用若干个模型来解决同一问题。
B、人机交互系统是决策支持系统的一个组成部分。
C、决策支持系统包含模型库和模型库管理系统。
D、智能决策支持系统包含知识库系统。
答案: A
16、决策支持系统可以用不同的方法进行构造,下列的说法不正确的是
A、可以用生命周期法和原型法构造决策支持系统。
B、原型法是一个迭代过程。
C、原型法中不存在对用户的反馈。
D、SDLC即是系统开发的生命周期法
答案: C
17、数据清洗是数据转移的一种基本类型,它不能通过下列的那种方法来完成:
A、范围检验
B、枚举清单
C、相关检验
D、删除不合格的数据
答案: D
18、下列不是数据转移的基本类型的是:
A、简单转移
B、清洗
C、集成
D、继承
答案: D
19、开展数据挖掘的基本目的是:
A、建立数据仓库。
B、帮助用户作决策。
C、从大量数据中提取有用信息。
D、对数据进行统计和分析。
答案: C
20、产生数据挖掘的根本原因是:
A、数据统计分析。
B、技术的发展。
C、商业推动。
D、数据仓库的产生。
答案: A
21、()是通过数据库中的一些属性来预测另一个属性,它在验证用户提出的假设的过程中
提取信息。
A、文本数据挖掘
B、发现驱动的数据挖掘
C、验证驱动的数据挖掘
D、Web数据挖掘
答案: C
22、对于在数据仓库中设计、使用OLAP的用户来说,下面不属于OLAP的衡量
的是:
A、解释性批处理提取。
B、弹性报告和一致性能报告。
C、对物理层的自动调整。
D、体系结构。
答案: D
23、对MOLAP和ROLAP的比较,不正确的说法是:
A、MOLAP的查询能力一般较好,而在ROLAP中进行查询,往往很难预料查询结果。
B、MOLAP所需要的数据加载时间比较长,而ROLAP的加载时间要比MOLAP短。
C、ROLAP比MOLAP的查询速度都要快很多。
D、MOLAP在分析过程中的精度较高,具有分析的优势。
答案: C
24、关于OLAP服务器及其工具,说法正确的是:
A、只有Oracle提供了OLAP功能。
B、评价OLAP服务器的标准不包括全局结构视图。
C、OLAP的服务引擎都应满足分析模型及应用在功能、规模和技术特征上的要求。
D、对OLAP服务器的管理能力没有特别的要求。
答案: C
25、数据挖掘工具按照使用方式分类,可以分为:
A、分为基于神经网络的工具,基于规则和决策树的工具,基于模糊逻辑的工具和综合性数据挖掘工具等。
B、分成决策方案生成工具,商业分析工具和研究分析工具三类。
C、分成专用型数据挖掘工具和通用型数据挖掘工具两大。
D、分成基于神经网络的工具和研究分析工具。
答案: B
二、填空题
1、数据仓库(
必考)是_____、______、______、______有组织的数据集合,支持管理的决策过程。答案:面向主题、集成的、时变的、非易失的
2、一般来说,可将数据仓库的开发和应用过程细分为_____、______、______、______。答案:设想阶段、规划和成长阶段、控制阶段和稳定阶段
3、_____是对现实世界进行抽象的工具,需要将现实世界的事物及其有关特征转换为信息世界的数据,才能对信息进行处理与管理,这就需要依靠_____作为这种转换的桥梁。这种转换经历了从现实到_____,从_____到_____,最后从_____到物理模型的转换。
答案:数据模型、数据模型、概念模型、概念模型、逻辑模型、逻辑模型
4、元数据(简答题必考)是关于数据、_____和应用程序的结构和意义的描述信息,其主要目标是_____。其范围可以是某个特别的数据库管理系统中从现实世界的概念上的一般概括,到_____。
答案:操纵数据的进程、提供数据资源的全面指南、详细的物理说明
5、按对象级别对元数据进行分类,可以从三个抽象级别上来认识:_____、逻辑级和_____。答案:概念级、物理级
6、数据库系统的特点主要体现在下面几个方面:_____、数据的共享性、_____和_____。答案:数据的结构化、数据的独立性、数据统一由DBMS管理和控制。
7、依据数据仓库数据量大但是操作单一的特点,可以采取一些技术来进行数据仓库的物理数据模型设计,如:合并表、_____、引入冗余、_____、建立广义索引等等。
答案:建立数据序列、表的物理分割、生成导出数据
8、数据仓库的接口技术包含多技术接口技术、_____和数据的高效率加载技术。
答案:语言接口技术
9、数据仓库中数据的组织方式与数据库不同,通常采用_____分级的方式进行组织。—般包括早期细节数据、_____、轻度综合数据、_____以及_____五部分。
答案:当前细节数据、高度综合数据、元数据
10、数据仓库的需求分析根据不同领域可以划分为_____、设计的需求、_____和最终用户的需求等方面。
答案:业主(投资者)的需求、开发者的需求
11、数据仓库虽然是从数据库发展而来的,但两者存在大的差异,从数据存储内容看,数据库只存放_____,而数据仓库则存放_____,数据库中的数据的目标是面向_____,而数据仓库则面向_____。
答案:当前值、历史值、业务操作人员、高层管理人员
12、数据库内的数据是_____的,只要有业务发生,数据就会更新,而数据仓库则是_____的历史数据,只能定期添加、刷新。
答案:动态变化、静态
13、数据仓库主要是供决策分析用的,所涉及的数据操作主要是_____,一般情况并不进行_____
答案:数据查询、修改操作
14、数据仓库创建后,首先从_____中抽取所需要的数据到数据准备区,在数据准备区中经过_____的净化处理,再加载到数据仓库数据库中,最后根据用户的需求将数据发布到_____。答案:数据源、数据、数据集市/知识挖掘库中
15、“主题”在数据仓库中由一系列_____实现的。一个主题之下表的划分可按_____、数据所属时间段进行划分。主题在数据仓库中可用_____方式进行存储,如果主题存量大为提高处理效率可采用_____方式进行存储。
答案:列表、数据的综合、多维数据库、关系数据库
三、简答题
1、什么是数据挖掘(Data Mining)? (简答题必考)
答案:数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。挖掘的数据源必须是真实的、大量的、含噪声的;发现的是用户感兴趣的知识;发现的知识要可接受、可理解、可运用;并不要求发现放之四海皆准的知识,仅支持特定的发现问题。
2、数据挖掘研究内容是什么?
答案:主要研究内容包括基础理论、发现算法、数据仓库、可视化技术、定性定量互换模
型、知识表示方法、发现知识的维护和再利用、半结构化和非结构化数据中的知识发现以及网上数据挖掘等。
3、数据挖掘提取出的知识主要由哪些类型?
答案:数据挖掘所发现的知识最常见的有以下四类:广义知识(Generalization),关联知识(Association),分类知识(Classification&Clustering),预测型知识(Prediction),偏差型知识(Deviation)。
4、什么是专家系统?
答案:专家系统是一个智能计算机程序系统,其内部含有大量的某一个领域专家水平的知识与以验,能够利用人类专家的知识和解决问题的方法来处理领域问题,专家系统是一种模拟人类专家解决领域问题的计算机程序系统。
5、简述数据仓库的组成。
答案:数据仓库管理部分的组成包括:
①定义部件。这一部件用于定义和建立数据仓库系统,
●设计和定义数据仓库的数据库。
●定义数据来源。
●确定数据源向数据仓库复制数据的转换、清理规则。
②数据获取部件。依据数据定义部件定义的规则从数据源中指数据抽取到数据仓库中,完成清洗、变换和集成工作,将数据装载到数据仓库中,定期清理数据仓库,消除数据仓库与源数据库的不一致,清除失效数据等。一般情况下可以通过一些通用工具完成,但是由于数据源中的数据类型、格式非常复杂,因此有些情况下需要编制特定的工具完成数据获取工作。
③管理部件。主要包括对数据仓库中数据的维护、安全、备份、恢复、日志等工作。这些工作需要借助数据库管理系统的功能实现。
④元数据管理,也可称为信息目录管理。它主要完成元数据的管理、存储以及对整个数据仓库数据的检测和管理,由以下部分组成:
●技术元数据。技术元数据由关于数据源、目标、转换规则、清理规则以及数据源与数据仓库之间的映射组成。
●业务目录。业务目录由数据仓库管理员生成,由数据来源、当前值、预定义的查询等方面组成,是针对具体应用数据的元数据管理。
(2)数据仓库工具集
数据仓库工具集主要由一些分析工具组成,主要包括检索查询工具、多维数据的OLAP分析工具、统计分析以及数据挖掘工具等(严格地说,数据挖掘工具只是数据仓库支持辅助决策的一种方法,数据挖掘列以从数据仓库中挖掘知识、规律,也可以从数据库或者一些平面文件中挖掘,但是从支持辅助决策的角度来看,将它归为数据仓库系统的一部分)。
OLTP与OLAP 的主要区别有以下几点:(简答题必考)
(1)、所面向的用户和系统:OLTP是面向客户的,由职员或客户进行事务处理或者查询处理。
OLAp是向向市场的,由经理、主管和分析人员进行数据分析和决策的。
(2)、数据内容:OLTP系统管理当前数据,这些数据通常很琐碎,难以用于决策。OLAP 系统管理大量历史数据,提供汇总和聚集机制,并在不同的粒度级别上存储和管理信息,这些特点使得数据适合于决策分析。
(3)、数据库设计:通常,OLTP采用ER模型和面向应用的数据库设计,而OLAP系统通常采用星型模式或雪花模式和面向主题的数据库设计。
(4)、视图:OLTP系统主要关注一个企业或部门的当前数据,而不涉及历史数据或不同组织的数据。与之相反,OLAP系统常常跨越一个企业的数据库模式的多个版本,OLAP系统也处理来自不同组织的信息,由多个数据源集成的信息。
(5)、访问模式:OLTP系统的访问主要由短的原子事务组成,这种系统需要并发控制和恢复机制。而OLAP系统的访问大部份是只读操作,其中大部份是复杂查询。
(6)、度量:OLTP专注于日常时实操作,所以以事务吞吐量为度量,OLAP以查询吞吐量和响应时间来度量。