为了正常的体验网站,请在浏览器设置里面开启Javascript功能!
首页 > 自考互联网数据库小抄

自考互联网数据库小抄

2017-10-15 26页 doc 51KB 197阅读

用户头像

is_196623

暂无简介

举报
自考互联网数据库小抄自考互联网数据库小抄 名词解释 1数据模型:数据模型是数据库系统的数学形式框架,是用来描述数据的一组概念和定义,包括数据的静态特征,数据的动态特征,数据的完整性约束。 2数据结构:数据结构是所研究的对象类型的集合。这些对象是数据库的组成成分,它们包括两类,一类是与数据类型、内容、性质有关的对象,一类是与数据之间联系有关的对象。3笛卡尔积::给定一组域D1,D2,```Dn,这些域中可以有相同的。D1,D2,...Dn的笛卡尔积为 D1×D2ׄ×Dn={(d1,d2,...dn)|di?Di,i=1m,2,„n}其中每一...
自考互联网数据库小抄
自考互联网数据库小抄 名词解释 1数据模型:数据模型是数据库系统的数学形式框架,是用来描述数据的一组概念和定义,包括数据的静态特征,数据的动态特征,数据的完整性约束。 2数据结构:数据结构是所研究的对象类型的集合。这些对象是数据库的组成成分,它们包括两类,一类是与数据类型、内容、性质有关的对象,一类是与数据之间联系有关的对象。3笛卡尔积::给定一组域D1,D2,```Dn,这些域中可以有相同的。D1,D2,...Dn的笛卡尔积为 D1×D2ׄ×Dn={(d1,d2,...dn)|di?Di,i=1m,2,„n}其中每一个元素(d1,d2„dn)叫作一个n元组(n-tuple)或简称元组(Tuple)。笛卡尔积可表示为一个二维表。表中的每行对应一个元组,表中的每列对应一个域。 4关系:D1×D2ׄ×Dn上的关系,表示为R(D1,D2,„Dn).这里R表示关系的名字n是关系的目或度。关系是笛卡尔积的在限子集,所以关系也是一个二维表,表的每行对应一个元组,表的列对应一个域。关系可以是一个无限集合。 5基本表:基本表是本身独立存在的表,在SQL中一个关系对应一个表。一些基本表对应一个存储文件,一个表可以带若干索引,索引存放在存储文件中。 6视图:视图是从基本表或其他视图中导出的表,它本身不独立存储在数据库中,也就是说数据库中只存放视图的定义而不存放视图对应的数据,这些数据仍存放在导出视图的基本表中,因此视图是一个虚表。 7多值依赖:设R(U)是一个属性的一个关系模式,X,Y和Z是U的子集,并且Z=U-X-Y,多值依赖X??Y成立当且仅当对R的任一关系r,r在(X,Z)上的每个值对应一组Y的值,这组值仅仅决定于X的值而与Z值无关。若X??Y,而Z= , 则称X??Y为平凡的多值依赖,否则称X??Y为非平凡的多值依赖。 8主码~设K为关系式R中的属性或属性组合。若K U,则K称为R的一个候选码。若关系式R有多个候选码,则选定其中的一个做为主码。 9数据库的安全性:数据库的安全性主要是指保护数据库,防止由于非法使用数据库造成数据泄漏、更改或破坏。数据库管理系统提供的主要保护数据安全的手段是对用户存取数据库的数据进行严格的控制。用户存取数据库数据的控制,正常情况下由DBA利用数据库管理系统提供的用户管理和授权机制来完成。 10审计:审计是事后监视的措施,积跟踪数据库的访问活动,以发现数据库的非法访问,达到安全防范的目的。 11数据字典:数据字典的系统中各类数据描述的集合,是进行详细的数据收集和数据分析所获得的主要成果。数据字典通常包括数据项、数据结构、数据流、数据存储和处理过程 五个部分。其中数据项是数据的最小组成单位,若干个数据项可以组成一个数据结构,数据字典通过对数据项和数据结构的定义来描述数据流、数据存储的逻辑内容。 12数据库的物理设计:数据库在物理设备上的存储结构与存取方法称为数据库的物理结构,它依赖于给定的计算机系统。为一个给定的逻辑数据模型选取一个最适合应用环境的物理结构的过程,就是数据库的物理设计。 13CGI:公共网关接口CGI是WWW技术中最重要的技术之一,有着不可替代的重要地位。CGI是外部应用程序(CGI)程序与Web服务器之间的接口,是在CGI程序和Web服务器之间传递信息的规程。 14脚本:脚本是一种能够完成某些特殊功能的小“程序段”。这些小的“程序段”并不是像一般程序那样被编译,而是在程序运行过程中被逐行地解释。 15分布式环境:计算机分布式意味着在分布式环境中的每一个节点都是一个小的计算机单元。 16JDBC:JDBC是一套API的集合,该集合设置了许多允许Java程序连接数据库的框架。JDBC操作在某些方面看起来和ODBC一样。区别是ODBC不能在Java程序中直接实现,原因是ODBC是用C语言写的。然而JDBC提供了JDBC/ODBC之间的桥梁。 17ASP:Active Server Pages是服务器端脚本环境,内含与IIS3.0和4.o之中,可以通过结合HTML网页、ASP指令和ActiveX控件建立动态、交互且高效的Web服务器应用程序,消除了,某些创建Web应用程序的不确定性,不必再担心客户机一端安装的浏览器类型。 18ADO:Active Data Object(ADO)是一项容易使用并且可扩展的将数据库访问添加到Web页的技术。可以使用ADO编写紧凑简明的脚本以便连接到 Open Database Connectivity)兼容的数据库和OLE DB兼容的数据源。 ODBC( 19角色:角色是一组权限的集合。有了角色的概念,安全管理机制可以把表或其他数据库对象上的一些权限进行组合,将它们赋给一个角色。需要时只需将该角色授予一个用户或一组用户,这样可以降低安全性机制的负担和成本。 20Sybace数据库中ACA:Sybace为OLTP、数据仓库和小应用平台三类主要应用提供了定制好的多种多样的产品选件。这就是Adaptive Server Enterprise12.0的适应性组件体系结构. 21面向对象程序设计方法;是一种支持模块化设计和软件重用的实际可行的编程方法。它把程序设计的主要活动集中在建立对象和对象之间的联系(或通信)上,从而完成所需要的计算。一个面向对象的程序就是相互联系的对象集合。 22多媒体数据库:是多媒体技术与数据库技术相结合产生的一种新型的数据库。是指数据库中的信息不仅涉及各种数字、字符等格式化的表达方式,而且还包括多媒体的非格式化的表达方式,数据管理要涉及各种复杂对象的处理。 23分布式数据库系统:是由一组数据组成的,这组数据分布在计算机网络的不同计算机上,网络中的每个结点具有独立处理的能力(称为场地自治),可以执行局部应用。同时每个结点也能通过网络通信系统执行全局应用。 24分布式数据库管理系统:简称DDBMS是建立、管理和维护数据库的一组软件,由四部分组成:局部场地上的数据库管理系统(LDBMS);全局数据库管理系统(GDBMS);全局数据字典(GDD);通信管理(CM) 25数据仓库:在支持管理的决策生成过程中,一个面向主的、集成的、时变的、非易失的数据集合。 26上卷(roll-up)操作:上卷操作就是由细粒度分组的聚集推算出粗粒度分组的过程。 简答题 1数据库技术经历了哪几个发展阶段, 数据库技术随着计算机硬件和软件技术的发展经历了:人工管理阶段 文件系统阶段 数据库管理阶段 2数据库技术在人工管理阶段的特点是哪些 ?数据不保存。因为计算机主要应用于科学计算,一般不需要将数据长期保存,只是在计算某一具体实例时将数据输入,用完就撤走,不仅对用户数据如此处理,对系统软件有时也是这样。 ?数据需要由应用程序自己进行管理。应用程序不仅要规定数据的逻辑结构,而且还要设计物理结构,包括存储结构,存取方法,输入和输出方式等。因此程序中存取数据的子程序随着存储的改变而改变,即数据不具有独立性,这样不仅必须花费许多精力在数据的物理布置上,而且数据在存储上有一些改变,就必须修改程序。 ?这一时期基本上没有文件概念,数据的组织方式必须由程序员自行设计 ?数据不共享。一组数据对应一个程序,数据是面向应用的。即使两个应用程序涉及某些相同的数据,也必须各自定义,无法互相利用,互相参照,所以程序与程序之间有大量冗余数据。 3关系数据库系统与非关系数据库系统的区别 关系系统只有“表”这一种数据结构;而非关系数据库系统还有其他数据结构,对这些数据结构有其他的操作。 4关系模型由哪几部分构成, 关系模型由关系数据结构、关系操作集合和关系完整性约束三部分组成。 ?单一的数据结构-关系:关系模型的数据结构非常单一。在关系模型中,现实世界的实体以及实体间的各种联系均用关系来表示,在用户看来,关系,模型中的逻辑结构是一张二维表。 ?关系操作:关系操作采用集合操作方式,即操作的对象和结构都是集合。关系模型给出了 关系操作能力,但不对RDBMS语言给出具体的语法要求。 ?关系的三类完整性约束:关系模型提供了丰富的完整性控制机制,允许定义三类完整性约束:实体完整性、参照完整性和用户定义的完整性。其中实体完整性和参照完整性是关系模型必须满足的完整性约束条件,应该有关系系统自动支持。用户定义的完整性是应用领域需要遵循的约束条件,体现了具体领域中的语义约束。 5简述SQL语言的特征 SQL语言集数据查询、数据操纵、数据定义和数据控制功能于一体,充分体现了关系数据语言的特点和优点。其主要特点: ?综合统一:SQL语言则集数据定义语言(DDL)、数据操纵语言(DML)、数据控制语言(DCL)的功能于一体,语言风格统一,可以独立完成数据库生命周期中的全部活动,包括定义关系模式、录入数据以及建立数据库等一系列操作要求。 ?高度非过程化:非关系数据模型的数据操纵语言是面向过程的语言,用其完成某项请求,必须指定存取路径。而用SQL语言进行数据操作,用户只需要指出“做什么”,而不必指明“怎么做”,因此用户无需了解存取路径。 ?面向集合的操作方式:非关系数据模型采用的是面向记录的操作方式,任何一个操作其对象都是一条记录,而SQL语言采用集合操作方式,不仅查找结果可以是元组的集合,而且一次插入、删除、更新操作的对象也可以是原则的集合。 ?以同一种语法结构提供两种使用方式:SQL语言既是自含式语言,又是嵌入式语言。作为自含式语言,它能够独立地用于联机交互的使用方式,用户可以在终端键盘上直接键入SQL命令对数据库进行操作。 ?语言简洁,易学易用:SQL语言功能极强,但由于设计巧妙,语言十分简洁,完成数据定义、数据操纵、数据控制的核心功能只用了9个动词:CREATE、DROP、ALTER、SELECT、INSERT、 UPDATE、DELETE、GRANT、REVOKE、SQL语言语法简单,接近口语,因此容易学习,容易使用。 6简述视图的基本特征 视图是关系数据库系统提供给用户以多种角度观察数据库中数据的重要机制。 视图是从一个或几个基本表(或视图)导出的表,它与基本的表不同,是一个虚表。数据库中只存放视图的定义,而不存放视图对应的数据,这些数据仍存放在原来的基本表中。基本表中的数据发生变化,从视图中查询出的数据也就随之改变了。 视图一经定义,就可以和基本表一样被查询、被删除,也可以在一个视图之上再定义新的试图,但对视图的更新(增、删、改)操作则有一定的限制。 7简述关系模式规范化时应遵循的一般原则 ?关系模式进行无损连接分解。关系模式分解过程中数据不能丢失或增加,必须把全局关系模式中的所有数据无损地分解到各个子关系模式中,以保证数据的完整性。 ?合理选择规范化程度。考了到存取效率,低级模式造成的冗余度很大,既浪费了存储空间,又影响了数据的一致性,因此希望一个子模式的属性越来越好,即去高级范式;若考虑到查询效率,低级范式又比高级范式好,此时连接运算的代价较小,这是一对矛盾,所以应根据情况,合理选择规范化程度。 ?正确性与可实现性原则。 8简述关系模式规范化的基本步骤。 ?对1NF关系进行投影,消除原关系中非主属性对码的函数依赖,将1NF关系转换为若干个2NF关系。 ?对2NF关系进行投影,消除原关系中非主属性对码的传递函数依赖,从而产生一组3NF关系。 ?对3NF关系进行投影,消除原关系中主属性对码的部分函数依赖和传递函数依赖(也就是说,使决定属性都成为投影的候选码),得到一组BCNF关系。 以上三步也可以合并为一步:对原关系进行投影,消除决定属性不是候选码的任何函数依赖。 ?对BCNF关系进行投影,消除原关系中非平凡且非函数依赖的多值依赖,从而产生一组4NF关系。 ?对4NF关系进行投影,消除原关系中不是由候选所蕴含的连接依赖,即可得到一组5NF关系。 9简要列举数据库被破坏的可能性和数据管理系统提供的可预防和补救措施。 数据库的被破坏主要有以下几个方面: ?系统的软、硬件故障,造成数据被破坏。 ?数据库的并发操作引起数据的不一致性。 ?自然的或人为的破坏。 ?对数据库数据的更新操作有误。 针对上述问题,数据库管理系统提供相应的功能: ?数据库恢复:在系统失效后的数据库恢复,配合定时备份数据库,使数据库不丢失数据。 ?并发控制:保证多用户能共享数据库,并维护数据的一致性。 ?安全性保护:防止对数据库的非法使用,避免数据的泄露、篡改或破坏。 ?完整性保护:保证数据的正确性和一致性。 10简述事务的特性 事务具有四个特性:原子性,一致性,隔离性和持久性 ?原子性:事务是数据库的逻辑单位,事务中包括的诸操作要么都做,要么都不做。 ?一致性:即必须保证在数据库状态发生变化时数据库的一致性,在事务作用于数据库过程中,数据应始终满足完整性约束。 ?隔离性:事务并发执行时相对独立性,这是事务并发控制的目标,一个事务的执行不被其他事务干扰。 ?持续性:指一个事物一旦提交,它对数据库中数据的改变就应该是永久的。 11简要叙述数据库设计的几个阶段。 1需求分析阶段:进行数据库设计首先必须准确了解与分析用户需求。需求分析是整个设计过程的基础,是最困难、最耗费时间的一步。需求分析的结果是否准确地反映了用户的实际需求,将要直接影响到后面各个阶段的设计,并影响设计结果是否合理和实用。 2概念结构设计阶段:概念结构设计是整个数据库设计的关键,它通过对用户需求进行综合、归纳与抽象,形成了独立于具体DBMS的概念模型。 3逻辑结构设计阶段:逻辑结构设计是将概念结构转换为某个DBMS所支持的数据模型,并对其进行优化。 4数据库物理设计阶段 是为逻辑数据模型选取一个最适合应用环境的物理结构。 5数据库实施阶段:在数据库实施阶段,设计人员运用DBMS提供的数据语言及其宿主语言,根据逻辑设计和物理设计的结果建立数据库,编制与调 试应用程序,组织数据入库,并进行试运行。 6数据库运行和维护阶段:数据库应用系统经过试运行后即可投入正式运行。在数据库系统运行过程中必须不断地对其进行评价、调整与修改。 12简述需求分析的任务 需求分析的任务是通过详细调查现实世界要处理的对象,充分了解系统工作概况,明确用户的各种需求,然后在此基础上确定系统的功能。新系统必须充分考虑今后可能的扩充和改变,不能仅仅按当前应用需求来设计数据库。 调查的重点是“数据”和“处理”,通过调查、收集与分析,获得用户对数据库的如下要求:1信息要求,指用户需要从数据库中获得信息的内容与性质。由信息要求可以导出数据要求,即在数据库中需要存储哪些数据。 2处理要求,指用户要完成什么处理功能,对处理的响应时间有什么要求,处理方式是批处理还是联机处理。 3安全性与完整性要求。 13简述CGI的特点 CGI的主要优点是它的简单性、语言无关性、Web服务器无关性以及广泛的可接受性 虽然CGI提供了一种与数据库连接的简单方法,但它也存在一些局限性: 1瓶颈问题,客户机和数据库服务器之间的通信必须通过Web服务器,当有大量的用户访问时,Web服务器会“超载”。 2缺乏效率和事务支持,CGI应用程序不能由多个客户机请求提供共享,降低了性能,增加了等待时间。 3CGI应用程序不持久,服务器必须每次访问CGI程序建立新的进程或线程,每次请求时数据库连接都必须重新打开,开销很大。 4CGI程序安全性问题。 14简述利用CGI访问数据库的工作流程 1浏览器将URL的第一部分解码并连接到服务器2浏览器将URL的其余部分提供给服务器3服务器从URL提取路径和文件名4服务器识别出URL指向一个CGI程序,而并非一个静态文件 5服务器准备环境变量,并执行这个CGI程序 6CGI程序执行,一般首先读取环境变量或STDN文件,得到参数。7CGI程序向STDOUT写MIME及别的http header信息,说明将传输给客户的内容等;8CGI程序向STDOUT发送其输出的其余部分,然后终止。9服务器发送STDOUT中的数据到浏览器,结束CGI程序并断开与浏览器的连接,10浏览器显示来自服务器的输出信息。 15简述JDBC提供的连接数据库的几种方法 1与数据源直接通信:使用JDBC和数据库已制定的协议时,可使用一个驱动程序直接与数据源通信。既可以建立自己的驱动程序,也可找一个公用的。 2通过JDBC驱动程序的通信:可连接到一个高标准的驱动程序上,该驱动程序依次与另一个可与数据源通信的专用驱动程序通信。 3与ODBC数据源通信:一个公开可用的专用驱动程序是JDBC/ODBC桥梁驱动程序,它是Javasoft公司开发的,允许应用程序与ODBC数据源相连。 16简述JDBC的功能和特点。 JDBC的基本功能包括:1建立于数据库的连接2发送SQL语句 3处理结果 JDBC是低级的API,是高级API的基础:JDBC是一种低级的接口,它直接调用SQL命令,但又可以作为构造高级接口和工具的基础。在执行时,高级API将首先被成如JDBC这样的低级接口。 JDBC与ODBC及其他API的比较:?Java不能直接使用ODBC,因为ODBC使用C语言接口,如果让Java来调用本机C代码,将会在安全、属性、健壮性、应用的可移植性等方面带来困难。2不希望把ODBC API逐字地翻译成Java API,例如ODBC使用了大量易于出错的指针,而Java取消了这种不安全的指针。 17简述ASP的主要特点 1使用VBScript、Jscript等简单易懂的脚本语言,结合HTML代码,即可快速地完成网站的应用程序,2无须编译,容易编写,在服务器端直接执行。3使用普遍的文本编辑器即可进行编辑设计。4与浏览器无关,用户端只要使用可执行HTML码的浏览器,即可浏览ASP所设计的网页内容。5ASP的源程序不会被传到客户浏览器,因而可以避免所写的源程序被他人剽窃,从而提高了程序的安全性。6可使用服务器端的脚本来产生客户端的脚本。 18列出并简要说明ADO中所有重要的接口 1Connection(连接)——Connection接口表示正在使用的数据源和ADO接口之间的连接。任何与数据源有交互连接的ADO都可能导致一个或多个从数据源返回的错误。因此Connection接口包含了产生所有错误的接口 2Error(错误集)——这个接口表示一个由数据源返回的错误,相对于Connection的错误集,Error则会更具体,可以利用一个Error来判断出错的准确原因。 3Command(命令)——这个接口表示一个能被数据提供者处理的命令。Commend接口可以返回一个Recirdset记录集或执行一个操作(如查询、修改、 删除或插入),任何时候查询或存储过程能接收的数据都能通过Parameter接口传给它。 4Parameter(参数)——这个接口表示传给Command的参数。例如,如果Command对象表示一个存储过程,就接受一个限制操作记录个数的参数,这时一个Parameter对象就被创建,在Command对象执行前被加在Parameter集中中。 5Recordser(游标)——这是个最复杂、功能最强大的接口。在Request接口中,含有包含数据的游标。实际上,这个对象在使用ADO的应用程序中完成多种操作。 6Field(字段)——Field接口表示Recordser对象中的某一列数据,这个接口允许改变数据,同时返回游标对象的一些关于数据本身的属性和参数。 19数据库管理系统对关系模型的支持分为哪几个阶段, 第一阶段(20世纪70年代)的RDBMS仅支持关系数据结构和基本的关系操作(选择、投影、连接)。 第二阶段的产品大都符合甚至超过SQL标准。因此对关系操作的支持比较完备,但是对数据完整性的支持仍较差。大部分系统没有主码、外码的概念,因此不支持实体完整性和参照完整性。有的系统具有触发器功能,用户可以利用触发器机制实现所需要的完整性约束 第三阶段(90年代)的产品则加强了对完整性和安全性的支持。完整性控制在核心层实现,克服了在工具层的完整性检查可能存在“旁路”的根本弊病。 20数据库管理系统在运行环境上的发展分为哪几个阶段, 第一阶段在大型机和中、小型机上的RDBMS一般为多用户系统,用户通过主机的终端并发地存取数据库、共享数据资源,微机上的RDBMS早期均为单用户的。 第二阶段的产品向两个方向发展,一个方向是提高RDBMS的可移植性,使之能在多种硬件和平台操作系统环境下运行;另一个方向是数据库联网,向分布式系统发展,支持多种网络协议。 第三阶段的产品则是网络环境下分布式数据库和客户/服务器结构的数据库系统的推出,这一阶段的RDBMS追求开放性,开放系统应满足可移植性、可连接性和可伸缩性。 21简述对象-关系数据库系统具有的特点, 1扩充数据类型:对象—关系数据库系统允许用户在关系数据库系统中扩充数据类型,即允许用户根据应用需求自己定义数据类型、函数和操作符。 2支持复杂对象:能够在SQL中支持复杂对象。复杂对象是指由多种基本数据类型或用户自定义的数据类型构成的对象。 3支持继承的概念:能够支持子类、超类的概念,支持继承的概念包括属性数据的继承和函数及过程的继承;支持单继承与多重继承;支持函数重载。 4提供通用的规则系统:能够提供强大而通用的规则系统。规则在DBMS及其应用中是十分重要的,在传统的RDBMS中用触发器来保证数据库数据的完整性。触发器可以看成规则的一种形式。 22简述并行数据库系统实现的目标 1高性能:并行数据库系统通过将数据库管理技术与并行处理技术有机结合,发挥多处理机结构的优势,从而提供比相应的大型机系统要高得多的性能价格比和可用性。 2高可用性:并行数据库系统可通过数据复制来增强数据库的可用性,这样,当一个磁盘损坏时,该盘上的数据在其他词磁盘的副本仍可供使用,且无需额外开销。数据复制还应与数据划分技术相结合以保证当磁盘损坏时系统仍能并行访问数据。 3可扩充性:这里,数据库系统的可扩充性指系统通过增加处理和存储能力而平滑地扩展性能的能力。 23简述分布式数据库系统的特点: 1数据的独立性。在分布式数据库系统中,数据独立性不仅包括数据的逻辑独立性和物理独立性,还有数据分布独立性亦称分布独立性亦称分布透明性。 2集中与自治相结合的数据结构。数据库是多个用户共享的资源。在分布式数据库系统中,数据的共享有两个层次:局部共享,即在局部数据库中存储局部场地上各用户的共享数据,这些数据都是本场地用户常用的。全局共享:即在分布式数据库系统的各个场地也存储供其他场地的用户共享的数据,支持系统的全局应用。 3适当增加数据冗余度。在集中式数据库系统中,尽量减少冗余度是系统的设计目标之一。而在分布式数据库系统中却希望增加冗余数据,在不同的场地存储同一数据的多个副本 4全局的一致性、可串行性和可恢复性。分布式数据库系统中各个数据库应满足集中式数据库的一致性、并发事务的可串行性和可恢复性。 24简述数据分布的大致方式: 1划分式,在这种数据分布方式中,数据按照其用途和来源,分布在各个结点上,彼此之间没有任何重复。这相当于把整个数据看成一个集合,划分成若干个不相关的子集,分布到各个结点上。 2全重复式,在这种数据分布方式中,每个结点拥有全部数据的一个副本。对于只读事务,可以做到完全地访问。但对于更新操作,需访问每个结点。这种数据分布方式,对于只读为主的应用,是颇为适用的。 3部分重复式前两种数据分布方式代表两个极端,部分重复分布方式是两者的折衷。在这种数据分布方式中,根据需要,有些数据只分布到某个结点上,有些数据重复分布到多个结点上。 25简述数据仓库的基本操作 1基本聚集函数:由于聚集函数的计算很费时间,在数据仓库中常常把这些计算结果当作实视图保存起来,一次计算可供多次使用。SQL提供五种聚集函数:SUM,COUNT,AVG,MAX和MIN. 2立方体操作:事实表是个多维表,每个元组可用多维空间的一个点或单元表示,数据立方体可以推广到任意维,设维数为k,则k维超立方体可表示2个实现图。在此立方体的基础上,可以进行切片、切换操作,即以某一个维度为基准,对立方体进行切割的操作。3上卷和下探操作:在计算聚集函数时,分组的粒度有粗细之分。由细粒度分组的聚集函数可以推算出其相关的粗粒度分组的聚集函数,反之则不可行。 26简述OLAP数据组织模式 1MD-OLAP的综合数据组织模式 MD-OLAP以多维数据库为核心。多维数据库概而言之就是以多维方式来组织数据,以多维方式来显示数据。多维数据库可以直观地表现现实世界中的“一对多”和“多对多”关系,不仅多维概念表达清晰,占用存储少,更重要的是它有着高速的综合速度。 2ROLAP的综合数据组织模式。ROLAP以关系数据库为核心,用关系数据库中的二维表来组织数据,表达多维概念,其数据组织采用星型模式。数据仓库中的每个主题对应于一个星型模式结构,由一个事实表和若干个维表组成。事实表中的每条记录含有指向每个维表的指针,通过这个指针,将多维数据联系起来。 互联网数据库 ?1 1.数据库技术是随着数据管理的需要而产生的。数据处理的的核心是数据管理。数据管理指的是对数据的分类、组织、编码、储存、检索和维护。 2.数据管理技术共经历了三个阶段: 人工管理阶段、文件系统阶段、数据库系统阶段 3. 人工管理阶段: 数据不保存、数据需要由应用程序自己进行管理、 基本上没有文件概念、数据不共享 4.文件系统阶段: 数据可以长期保存、文件系统管理数据、 文件已经多样化、数据的存取基本上以记录为单位。 缺点有:数据共享性差,数据冗余度大;数据和程序缺乏独立性 5.数据库管理阶段: (1)数据结构化。 (2)数据共享性高、冗余度小、易扩充。 (3)数据独立性高。 (4)统一的数据管理和控制:数据的安全性保护、数据的完整性控制、数据库恢复和并发控制。 (5)数据的最小存取单位是数据项。 DB:数据库(Database),DB是统一管理的相关数据的集合。 DBMS:数据库管理系统(Database Management System),DBMS是位于用户与操作系统之间 的一层数据管理软件,为用户或应用程序提供访问DB的方法,包括DB的建立、查询、更新及各种数据控制。DBMS总是基于某种数据模型,可以分为层次型、网状型、关系型、面向对象型DBMS。 DBS:数据库系统(Database System),DBS是实现有组织地、动态地存储大量关联数据,方便多用户访问的计算机软件、硬件和数据资源组成的系统,即采用了数据库技术的计算机系统。 数据库技术:是一门研究数据库结构、存储、管理和使用的软件学科。 第一代数据库系统,即层次数据库系统和网状数据库系统 第二代数据库系统,即关系数据库系统 第三代数据库系统,即面向对象数据库系统 数据库学科的研究范围:数据库管理系统软件的研制; 数据库设计; 数据库理论 数据模型是现实世界数据特征的抽象。是数据库系统的核心和基础。 数据模型应满足三方面要求:一是能比较真实地模拟现实世界;二是容易为人所理解;三是便于在计算机上实现。 根据模型应用目的分为:?概念模型,也称信息模型,它是按用户的观点对数据和信息建模。?数据模型,主要包括层次模型、网状模型、关系模型和面向对象数据模型,它是按计算机系统的观点对数据建模。 数据模型三个要素: ?数据结构 描述系统的静态特性 ?数据操作 描述系统的动态特性 ?数据的约束条件 是一组完整性规则的集合 概念模型 数据描述的三个领域:现实世界、信息世界和机器世界 数据描述的两种形式:物理描述和逻辑描述。前者是指数据在存储设备上的存取方式,后者是指程序员或用户以用以操作的数据形式。 两个实体型之间的联系可以分为三类: 一对一联系(1?1);一对多联系(1?n);多对多联系(m?n) E-R图提供了表示实体型、属性和联系的方法。实体-联系方法(E-R方法)是抽象和描述现实世界的有力工具。 实体型:用矩形表示,矩形框内写明实体名。 属性:用椭圆形表示,并用无向边将其与相应的实体连接起来。 联系:用菱形表示,菱形框内写明联系名,并用无向边分别志有关实体连接起来,同时在无向边旁标上联系的类型(1?1,1?n或m?n)。 数据模型 数据模型: 层次模型、网状模型、关系模型和面向对象数据模型。 其中层次模型和网状模型统称为非关系模型。 层次模型:用树型结构表示实体间联系的数据模型 层次模型有以下两个限制: ?只有一个结点没有双亲结点,称之为根结点; ?根以外的其他结点有且只有一个双亲结点。 层次数据模型可以直接表示一对多(包括一对一)的联系; 层次模型表示多对多联系,必须首先将其分解成一对多联系。分解方法有两种:冗余结点法和虚拟结点法。 网状模型:用有向图结构表示实体类型及实体间联系的数据模型。 (1)允许一个以上的结点无双亲;(2)一个结点可以有多于一个的双亲。 关系模型:是由若干个关系模式组成的集合,其主要特征是用二维表格结构表达实体集,用外键表示实体间联系。 关系模型要求关系必须是规范化的,即要求关系模式必须满足一定的规范条件,这些规范条件中最基本的一条就是,关系的每一个分量必须是一个不可分的数据项,也就是说,不允许表中还有表。 数据系统的三级模式结构:外模式(物理模式)、模式(逻辑模式)和内模式 两级映象: 外模式/模式映象 一般在外模式中描述。 模式/内模式映象 一般在内模式中描述。 两层映象保证了数据库系统中的数据能够具有较高的逻辑独立性和物理独立性。 数据库管理系统的功能: ?数据定义 ?数据操纵 ?数据库运行管理 ?数据组织、存储和管理 ?数据库的建立和维护 ?数据通信接口 数据库管理系统组成: ?数据定义语言及其翻译处理程序 ?数据操纵语言及其编译(或解释)程序 ?数据库运行控制程序 ?实用程序 一个设计优良的DBMS: ?友好的用户界面 ?比较完备的功能 ?较高的运行效率 ?清晰的系统结构和开放性 ?2 关系数据库系统与非关系数据库系统的区别是,关系系统只有"表"这一种数据结构;而非关系数据库系统还有其他数据结构,对这些数据结构有其他的操作。 关系模型的组成:关系数据结构、关系操作集合、关系完整性约束 关系数据语言 关系代数语言 例如ISBL 元组关系演算语言 例如ALPHA,QUEL 关系演算语言 域关系演算语言 例如QBE 具有关系代数和关系演算双重特点的语言 例如SQL 关系的三类完整性约束:实体完整性、参照完整性和用户定义的完整性 实体完整性规则:要求关系中组成主键的属性上不能有空值。 参照完整性规则:要求不引用不存在的实体。 用户定义完整性规则:由具体应用环境决定,系统提供定义和检验这类完整性的机制。 关系数据语言的共同特点是:语言具有完备的表达能力,是非过程化的集合操作语言,功能强,能够嵌入高级语言中使用。 基本关系具有以下六条性质: ?列是同质的(Homogeneous),即每一列中的分量同一类型的数据,来自同一个域。?不同的列可出自同一个域,称其中的每列为一个属性,不同的属性要给予不同的属性名。 ?列的顺序无所谓,即列的次序可以任意交换。 ?任意两个元组不能完全相同。 ?行的顺序无所谓,即行的次序可以任意交换。 ?分量必须取原子值,即每一个分量都必须是不可分的数据项。 关系模型要求关系必须是规范化的,即要求关系模式必须满足一定的规范条件。这些规范条件中最基本的一条就是,关系的每一个分量必须是一个不可分的数据项。 关系是关系模式在某一个时刻的状态或内容。关系模式是静态的,稳定的,而关系是动态的、随时间不断变化的,因为关系操作在不断地更新着数据库中的数据。但在实际当中,人们常常把关系模式和关系都称为关系。 实体完整性规则说明如下: (1)实体完整性规则是针对基本关系而言的。一个基本表通常对应现实世界的一 个实体集。例如学生关系对应于学生的集合。 (2)现实世界中的实体是可区分的,即它们具有某种唯一性标识。 (3)相应地,关系模型中以主码作为唯一性标识。 (4)主码中的属性即主属性不能取空值。所谓空值就是"不知道"或"无意义"的值。 关系可以有三种类型:基本关系(通常又称为基本表或基表)、查询表和视图表 元组变量主要有两方面的用途: ?简化关系名。 ?操作条件中使用量词时必须用元组变量。 ?3 SQL语言集数据查询、数据操纵、数据定义和数据控制功能于一体。 特点包括:?综合统一、?高度非过程化、?面向集合的操作方式、?以同一种语法结构提供两种使用方式、?语言简洁,易学易用。 定义和合理地使用视图能带来的好处为: ?、视图能够简化用户的操作 ?、视图使用户能以多种角度看待同一数据 ?、视图对重构数据库提供了一定程度的逻辑独立性 ?、视图能够对机密数据提供安全保护 视图更新操作规则的限制: 如果视图是从多个基本表使用联接操作导出的,则不允许更新。 如果导出的视图使用了分组和聚合操作,也不允许更新。 如果视图是从单个基本表使用选择和投影操作导出的,并且包括了基本表的主键或某个候选键,则可以执行操作。 SQL中数据控制功能包括事务管理功能和数据保护功能,即数据库的恢复、并发控制;数据库的安全性和完整性。 ?4 关系模式规范化时一般应遵循以下原则: (1)关系模式进行无损连接分解。 (2)合理选择规范化程度。 (3)正确性与可实现性原则。 关系模式规范化的基本步骤如图所示。 ?对1NF关系进行投影,消除原关系中非主属性对码的函数依赖,将1NF关系转换为若干个2NF关系。 ?对2NF关系进行投影,消除原关系中非主属性对码的传递函数依赖,从而产生一组3NF关系。 ?对3NF关系进行投影,消除原关系中主属性对码的部分函数依赖和传递函数依赖(也就是说,使决定属性都成为投影的候选码),得到一组BCNF关系。 消除决定属性集非码的非平凡函数依赖 1NF 消除非主属性对码的部分函数依赖 2NF 消除非主属性对码的传递函数依赖 3NF 消除主属性对码的部分和传递函数依赖 BCNF消除非平凡且非函数依赖的多值依赖 4NF 消除不是由候选码所蕴含的连接依赖 5NF 以上三步也可以合并为一步:对原关系进行投影,消除决定属性不是候选码的任何函数依赖。 ?对BCNF关系进行投影,消除原关系中非平凡且非函数依赖的多值依赖,从而产生一组4NF关系。 ?对4NF关系进行投影,消除原关系中不是由候选码所蕴含的连接依赖,即可得到一组5NF关系。 5NF是最终范式。 关系模式分解的三个定义(判断对关系模式的一个分解是否与原关系模式等价可以有三种不同的标准): (1)分解具有"无损连接性"。 (2)分解要"保持函数依赖"。 (3)分解既要"保持函数依赖",又要具有"无损连接性"。 BCNF的关系模式都具有如下3个性质: ?所有非主属性都完全函数依赖于每个候选码。 ?所有主属性都完全函数依赖于每个不包含它的候选码。 ?没有任何属性完全函数依赖于非码的任何一组属性。 ?5 数据库的被破坏主要有以下几个方面: (1)系统的软、硬件故障,造成数据被破坏。 (2)数据库的并发操作引起数据的不一致性。 (3)自然的或人为的破坏。 (4)对数据库数据的更新操作有误。 针对上述问题,数据库管理系统提供相应的功能: (1)数据库恢复:在系统失效后的数据库恢复,配合定时备份数据库,使数据库不丢失数据。 (2)并发控制:保证多用户能共享数据库,并维护数据的一致性。 (3)安全性保护:防止对数据库的非法使用,以避免数据的泄露、纂改或破坏。 (4)完整性保护:保证数据的正确性和一致性。 数据库安全控制的一般方法: ?用户标识和鉴定;?存取控制;?定义视图;?审计;?数据加密。 数据库的安全性主要是指保护数据库,防止由于非法使用数据库造成数据泄露、更改或破坏。数据库的完整性:数据的正确性、一致性和相容性。 数据的完整性与安全性是数据库保护的两个不同的方面。安全性是防止用户非法使用数据库。完整性则是防止合法用户使用数据库时向数据库中加入不合语义的数据。 事务:并发控制的单位,是用户定义的一组数据库操作序列。 特征:原子性、一致性、隔离性、持久性。 并发控制的主要技术是采用封锁机制。封锁就是事务T可以向系统发出请求,对某个数据对象(最常用的是记录)加锁。于是事务T对这个数据对象就有一定的控制。基本的封锁类型有两种:排它锁(X锁)和共享锁(S锁)。 和操作系统一样,封锁的方法可能引起活锁和死锁。 活锁是指当若干事务要对同一数据项加锁时,造成一些事务的永远等待,得不到控制权的现 象;死锁是指两个以上事务集合中的每个事务都在等待加锁当前已被另一事务加锁的数据项,从而造成相互等待的现象。 数据库中解决死锁的常用方法有: 1、要求每个事务一次就将所有要使用的数据全部加锁,否则就不能执行。 2、采用按序加锁法。 3、不采取任何措施来预防死锁的发生,而是周期性的检查系统中是否有死锁。 两段锁协议是指所有事务必须分两个阶段对数据库项加锁和解锁。 两段锁协议规定所有的事务应遵守下列规则: 1、在对任何数据进行读、写操作之前,事务首先要获得对该数据的封锁,而且 2、在释放一个封锁之后,事务再获得任何其他封锁。 所谓“两段”锁含义是:事务分为两个阶段。第一阶段是获得封锁,也称为扩展阶段。在该阶段,事务可以申请获得任何数据项上的任何类型的锁,但是不能释放任何锁。第二阶段是释放封锁,也称为收缩阶段。在该阶段,事务可以释放任何数据项上的任何类型的锁,但是不能再申请任何锁。 数据库系统故障可分为:事务内部的故障、系统故障、介质故障、计算机病毒。 转储:静态转储(转储期间不允许对数据库进行任何存取、修改活动) 动态转储(转储期间允许对数据进行存取或修改) 海量转储(每次转储全部数据库) 增量转储(每次只转储上次转储后更新过的数据) 日志文件是用来记录对数据库每一次更新活动的文件。在转储中必须建立日志文件,后援副本和日志文件综合起来才能有效地恢复数据库。 利用日志文件恢复事务的过程: ?从头扫描日志文件,找出哪些事务在故障发生时已经结束,哪些事务尚未结束; ?对尚未结束的事务进行撤销处理,对已经结束的事务进行重做处理。 ?硬件故障;病毒破坏:当数据库本身被破坏时,可重装转储数据库的后备副本,然后运行日志文件,执行事务恢复,这样就可以重建数据库。 ?发生事务故障;系统故障:当数据库本身没被破坏,但内容已经不可靠时,可利用日志文件恢复事务,从而使数据库回到某一正确状态,这时不必重装后备副本。
/
本文档为【自考互联网数据库小抄】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索