0052《数据库原理与应用》2018年6月期末考试指导
发布时间:2023-11-16 11:11:25浏览次数:110052《数据库原理与应用》2018 年 6 月期末考试指导一、考试说明(一)考试说明满分为 100 分,考试时间为 90 分钟,考试形式为闭卷。(二)包含的题型及各题型相应的答题技巧1. 单项选择题(每题 2 分,共 20 分)答题技巧:联系题目及选项,选出最佳答案。2.简答题(每题 8 分,共 24 分)答题技巧:写出自己的主要观点,然后围绕此观点逐一展开说明,一般来说,最好从几个方面谈对某一问题的认识和看法。3. 设计题(共 21 分)答题技巧:根据题目要求运用 查询语言作答。4. 应用题(共 35 分)答题技巧:在注意题目细节的基础上,联系基本概念作答。二、重要知识点第一章:绪论1.基本概念数据库:是数据的集合,它具有一定的组织形式并存放于统一的存储介质上,它是多种应用数据的集成,并可被多个应用所共享。数据库处于数据库系统的核心位置。数据库特点:.数据完整性、数据冗余很高、数据独立性高数据库管理系统(DBMS):数据库管理系统是一种负责数据库的定义、建立、操纵、管理和维护的系统软件。数据库系统:是一个以对海量的、具有复杂数据结构的、可以持久保存的、可供多用户共享的数据进行统一管理为目标的计算机应用系统。数据控制语言:DCL。数据描述语言:DDL。管理信息系统:MIS。在数据库方式下,信息处理中占据中心位置的是数据。数据操纵语言及其翻译:DBMS(数据库管理系统)提供了数据操纵语言(DML)实现对数据库的检索、插入、修改、删除等操作。DML 分为宿主型 DML 和自含型 DML 两类。宿主型 DML 本身不能独立使用,必须嵌入主语言中,例如,嵌入 C,COBOL,FORTRAN 等高级语言中。自含型DML 是交互式命令语言,语法简单,可以独立使用。数据库管理系统的功能包括:数据定义、数据操纵、数据库运行管理、数据组织存储和管理、数据库建立和维护、数据通讯。数据库系统提供给用户的接口是数据库语言。SQL 语言是关系型数据库系统典型的数据库语言,它是结构化查询语言。2.数据与程序的物理独立性当数据库的存储结构改变了(例如选用了另一种存储结构),由数据库管理员对模式/内模式映象作相应改变,可以使模式保持不变,从而应用程序也不必改变。保证了程序与数据的物理独立性,简称数据的物理独立性。映像是抽象层次之间的联系和转换。
5. 主动数据库主动数据库(Active Data Base)是相对于传统数据库的被动性而言的。许多实际的应用领域,如计算机集成制造系统、管理信息系统、办公室自动化系统中常常希望数据库系统在紧急情况下能根据数据库的当前状态,主动适时地做出反应,执行某些操作,向用户提供有关信息。传统数据库系统是被动的系统,它只能被动地按照用户给出的明确请求执行相应的数据库操作,很难充分适应这些应用的主动要求,因此在传统数据库基础上,结合人工智能技术和面向对象技术提出了主动数据库。6. 数据挖掘是从大型数据库或数据仓库中发现并提取隐藏在内的信息的技术。7.数据库恢复技术主要有数据转储和登记日志文件。三、重点习题(一)单项选择题1、在关系模型中,关系的“元数”(arity)是指( )A、行数 B、元组个数 C、关系个数 D、列数2、关系代数表达式的优化策略中,首先要做的是( )A、对文件进行预处理 B、尽早执行选择运算 C、执行笛卡儿积运算 D、投影运算3、如何构造出一个合适的数据逻辑结构是( )主要解决的问题。A、关系数据库优化 B、数据字典 C、关系数据库规范化理论 D、关系数据库查询4、关系模式分解的无损联接和保持函数依赖两个特性之间的联系是( )A、前者成立蕴涵后者成立 B、后者成立蕴涵前者成立C、同时成立,或者同时不成立 D、没有必然的联系5、如果事务 T 获得了数据项 Q 上的排它锁,则 T 对 Q ( )A、只能读不能写 B、只能写不能读 C、既可读又可写 D、不能读不能写(二) 简答题1、在关系模型中,如何表示数据和数据之间的联系?2、两个函数信赖集 F 和 G 等价的充分必要条件是什么?3、简述 SQL 语言的组成。(三)设计题 现有关系数据库如下:学生(学号,姓名,性别,专业,奖学金) 课程(课程号,名称,学分)学习(学号,课程号,分数)用关系代数表达式实现下列 1、2 小题:1、检索“数据库原理”课程成绩高于 90 分的所有学生的学号、姓名、专业和分数;2、检索不学课程号为“C135”课程的学生信息,包括学号,姓名和专业;用 SQL 语言实现下列 3—5 小题:3、为数学专业学生奖学金增加 50 元;4、从学生表中删除成绩出现过 0 分的所有学生信息;5、定义“英语”专业学生所学课程的信息视图 AAA,包括学号、姓名、课程号和分数。(四)应用题现有某个应用,涉及到两个实体集,相关的属性为:实体集 R(A#,A1,A2,A3),其中 A#为码实体集 S(B#,B1,B2),其中 B#为码从实体集 R 到 S 存在多对一的联系,联系属性是 D1。
、如果将上述应用的数据库设计为一个关系模式,如下:,指出该关系模式的码。、如果将上述应用的数据库设计为三个关系模式,如下: ,关系模式 是否一定满足第 范式?为什么?四、重点练习题参考答案(答案仅供参考)(一)单项选择题、、、、、(二)简答题、 二维表既可以表示实体,也可以表示联系,两个二维表之间,相同的属性或属性组就表示了两个实体之间的联系,一张二维表,可以同时与多张二维表建立联系。、 中每个 在 中,并且 中每个 也在 中。、 分为四个部分:数据定义、数据操纵、数据控制、嵌入式 语言的使用规定。(三)设计题【答题要点】、 学号,姓名,专业,分数 分数∧名称数据库原理学生∞学习∞课程、 学号,姓名,专业学生 学号,姓名,专业 课程号学生∞学习、 ! 学生 ! 奖学金奖学金"#!!专业$数学’、!! !%&学生 "#!!学号 '(!! 学号 %&学习"#!!分数、! !)'!"学号,姓名,课程号,分数 !! 学号,姓名,课程号,分数 %&学生,学习 "#!!学生*学号 学习*学号 (专业$英语’(四)应用题、码是 +++、不一定。 因为 中有两个非主属性 和 ,有可能存在函数依赖 ,,则出现传递依赖 ,、,。说明:本考试指导只适用于 - 学期 . 月期末考试使用,包括正考和重修。指导中的章节知识点涵盖考试所有内容,给出的习题为考试类型题,习题答案要点只作为参考,详见课程讲义或课程 //0。在复习中有任何问题请到课程答疑区咨询。祝大家考试顺利!
3.关系模式(1)关系模型的基本结构与操作关系模型的基本结构是由行和列组成的二维表格。关系模型上的数据操纵,其操作对象与操作结果都是关系。关系模型向用户提供了四种类型的操纵功能:查询、插入、删除与修改,它们又可以被划分成五种基本操作:属性指定,元组选择,关系的合并,元组插入,元组删除。选择运算指从给定的关系中选择出若干满足条件的元组组成新的关系。(2)关系数据的逻辑结构是二维表。4.关系数据库的特点: 数据结构简单 用户使用方便 功能强 数据独立性高 理论基础深5.数据库系统的三级模式结构数据库系统的三级模式结构是指数据库系统是由外模式、模式和内模式三级构成。数据库系统中三级模式结构定义存放在数据字典中。DBMS 提供内模式描述语言{内模式 DDL,或者存储模式 DDL}来严格地定义内模式。数据库系统的三级模式是对数据的三个抽象级别.它把数据的具体组织留给 DHMS 管理,使用户能逻辑地抽象地处理数据,而不必关心数据在计算机中的具体表示方式与存储方式。为了能够在内部实现这三个抽象层次的联系和转换,数据库管理系统在这三级模式之间提供了两层映象:外模式/模式映象:模式/内模式映象6. 码(Key)有的属性是起关键作用,有这个属性可以区分一个实体与另一个实体,假如我知道一个人的身份证好就可以知道这个人是谁,因为身份证号是唯一的,同样年龄是十九岁的,我们不能区分,因为十九岁的有很多。只有身份证号,工作证号唯一能够区分和标识实体的,这样的属性它叫码。7. OLAP 是联机分析处理的英文缩写。8. 当应用程序向数据库管理系统提出查询数据的请求后,从响应用户要求到在屏幕上显示出数据,将数据从物理设备送到系统缓冲区是由操作系统完成的。第二章:关系数据库1.关系数据库(1)关系模型的组成 关系模型由以下三部分组成:关系数据结构、关系操作集合、关系完整性约束。 (2)单一的数据结构:关系 (3)关系操作 关系操作的特点:集合操作方式,也即操作的对象和结果都是集合。 2.常用关系操作:(1)查询操作,包括: 集合运算:并、差、交 传统的集合运算是二目运算,包括并、差、交、广义笛卡尔积四种运算。专门的关系运算:广义笛卡尔积、选择、投影、连接、除 选择:从给定的关系中选择出若干满足条件的元组组成新的关系。连接:从两个关系的笛卡尔积中选取属性间满足一定条件的元组。
(2)增加、删除、修改操作 3.关系的三类完整性约束(1)实体完整性;(2)参照完整性;(3)用户定义的完整性。实体完整性规则:若属性 A 是基本关系 R 的主属性,则属性 A 不能取空值。所谓的参照完整性是指两个表取值时,一个表要参照另一个表的信息来完成本表的数据任务。关系的参照完整性意即与另一个表相关的某属性除了取空值外,必须取等于另一个表中某个元组的主码值。4.关系代数与关系演算表示方法的区别关系代数是使用数学中的集合论来表示关系模型,其中,关系用元组的集合来表示,关系模型上的数据操纵用集合上的运算来表示。而关系演算则使用数理逻辑中的一阶谓词逻辑来表示关系模型,其中,关系用谓词来表示,关系模型上的数据操纵用一阶谓词公式来表示。5.关系和表的区别关系是笛卡尔积的有限子集,所以关系也是一个二维表,表的每行对应一个元组,表的每列对应一个域.由于域可以相同,为了加以区分,必须对每列起一个名字,称为属性(attribute )。n 目关系必有 n 个属性。 若关系 中的 某一 属性 组 的 值 能 唯 一地 标识 一个 元组 , 则 称 该 属性 组 为 候 选码(Candidate key)。 6.关系数据库中的基本概念域:是一组具有相同数据类型的值的集合,笛卡尔积的有限子集称作对应域上的关系。元组:二维表的行称为关系的元组,列中的元素为该属性值的分量,关系中元组的个数称为基数。域(Domain)值的集合,即:可能取值的范围。域中数据个数称为域的基数。如 {男、女}(性别域,基数 2) {已婚、未婚、离异、丧偶}(婚姻状况域,基数是 4)在关系模型中,关系的“元数”(arity)是指列数。7.若一个关系有多个候选码,则选定其中一个为主码。主码的诸属性称为主属性(Prime attribute )。不包含在任何侯选码中的属性称为非码属性(Non-key attribute )。在最简单的情况下,候选码只包含一个属性。在最极端的情况下,关系模式的所有属性组是这个关系模式的候选码,称为全码( All-key)。8.关系的逻辑结构是二维表,对关系最基本的限制就是:表的每一个分量都必须是不能再分的基本数据项。9.关系可以有三种类型:基本关系(通常又称为基本表或基表》、查询表和视图表。基本表是实际存在的表,它是实际存储数据的逻辑表示。查询表是查询结果对应的表。视图表是由基本表或其他视图表导出的表,是虚表,不对应实际存储的数据。10. 关系模式在数据库中要区分型和值,是在数据库逻辑结构设计阶段产生的。关系数据库中,关系模式是型,关系是值。关系模式是对关系的描述,那么一个关系需要描述哪些方面呢?二维表既可以表示实体,也可以表示联系,两个二维表之间,相同的属性或属性组就表示了两个实体之间的联系,一张二维表,可以同时与多张二维表建立联系。 首先,应该知道,关系实质上是一张二维表,表的每一行为一个元组,每一列为一个属性。一个元组就是该关系所涉及的属性集的笛卡尔积的一个元素。关系是元组的集合,因此关系模式必须指出这个元组集合的结构,即它由哪些属性构成,这些属性来自嘛些域,以及属性与域之间的映象关系。
关系模式是在数据库逻辑结构设计阶段产生的,逻辑设计的主要工作就是将 E-R 图转换成关系模式。11. 建立数据视图就是从一个或多个基本表中抽取出某些属性,组成一个虚表。第三章:关系数据库标准语言SQL1.基表:关系数据库中的关系在 SQL 中又称为基表。视图:由若干张表(包括基表与视图)经映像语句构筑而成的表被称为视图。SQL 中的视图提高了数据库系统的安全性。基表与视图都采用二维表格结构,都统称为表。2.SQL 的功能包括:数据定义、数据操纵、数据控制、与主语言的接口四个部分。 SQL 定义基本表包括下面三个语句:数据定义、数据操作、数据控制。3.SQL 的数据操纵功能包括数据的查询、增加、修改、和删除等。其中查询功能包括:(1)单表查询(2)带有集函数并对结果分组的查询(3)连接查询和嵌套查询①连接查询前面的查询都是针对一个表进行的。若一个查询同时涉及两个以上的表,则称之为连接查询,连接查询是关系数据库中最主要的查询,包括等值连接、自然连接、非等值连接查询、自身连接查询、外连接查询和复合条件连接查询。②嵌套查询在 SQL 语言中,一个 SELECT-FROM-WHERE 语句称为一个查询块。将一个查询块嵌套在另一个查询块的 WHERE 子句或 HAVING 短语的条件中的查询称为嵌套查询。(4)集合查询SELECT 语句的查询结果是元组的集合,所以多个 SELECT 语句的结果可进行集合操作。集合操作主要包括并操作 UNION、交操作 INTERSECT 和差操作 MINUS.4.事务:用户为完成一次任务所进行的一系列操作(一段用户程序)或为完成某种任务在机器上单独执行的一个程序.事务具有:原子性、一致性、隔离性、持续性。5.游标 主变量:SQL 语句中使用的主语言程序变量。 SQL 语言与主语言具有不同的数据处理方式。SQL 语言是面向集合的,一条 SQL 语句原则上可以产生或处理多条记录。而主语言是面向记录的,一组主变量一次只能存放一条记录。游标的操作:定义游标:为查询开辟一个缓冲区EXEC SQL DECLARE C1 CURSOR FOR打开游标:把查询结果放到缓冲区并把游标指向第一条记录 EXCEC SQL OPEN C1推进游标:把游标指向的记录数据存进主变量,游标向下(后前、上)推进一条(或多条)记录。EXEL SQL FETCH C1 INTO:学号,:姓名,:性别关闭游标:释放缓冲区及其他使用游标时占用的资源。EXEL SQL CLOSE C16. 建立与删除索引建立索引是加快查询速度的有效手段。用户可以根据应用环境的需要,在基本表上建立一个或多个索引,以提供多种存取路径,加快查找速度。一般说来,建立与删除索引由数据库管理员 DBA 或表的属主(即建立表的人)负责完成。系统在存取数据时会自动选择合适的索引作为存取路径,用户不必也不能选择索引。
1).建立索引在 SQL 语言中,建立索引使用 CREATE INDEX 语句,其一般格式为: CREATP[UNIQUE]〔CLUSTER〕[IDEX<索引名> ON<表名>(<列名>[<次序习],<列名>[<次序>]…):其中,<表名>是要建索引的基本表的名字。索引可以建立在该表的一列或多列上,各列名之间用逗号分隔。每个<列名>后面还可以用<次序>指定索引值的排列次序,可选ASC(升序)或 DESC(降序),缺省值为 ASC UNIQUE 表明此索引的每一个索引值只对应唯一的数据记录。 CLUSTER 表示要建立的索引是聚簇索引。所谓聚簇索引是指索引项的顺序与表中记录的物理顺序一致的索引组织。例如,执行下面的 CREATEINDEX 语句: CREATE CLUSTER INDEX Stusname ON Student(sname)将会在 Student 表的Sname(姓名)列上建立一个聚簇索引,而且 Student 表中的记录将按照 Sname 值的升序存放。7. 存储过程优点: 提高运行速度; 降低网络通信量; 间接实现安全控制。8. 在 SQL/CLI 中,将宿主程序与数据库交互的有关信息记录在运行时数据结果中的是环境记录、连接记录、语句记录、描述记录。9. 如果指定 DISTINCT 短语,则表示在计算时要取消指定列中的重复值,如果不指定 DISTINCT 短语或指定 ALL 短语(ALL 为缺省值),则表示不取消重复值。10. SQL 语言分为四个部分: 数据定义、数据操纵、数据控制、嵌入式 SQL 语言的使用规定。第四章:关系数据库设计原理1.数据库范式:关系模式即关系的描述。第一范式: 所有的属性都是不可分割的原子单位。第二范式: 如果关系模式 R(U,F)中的所有非主属性都完全依赖于任意一个候选关键字,则称关系 R 是属于第二范式。第三范式: 如果关系模式 R(U,F)中的所有非主属性对任何候选关键字都不存在传递信赖,则称关系 R 是属于第三范式的BC 范式:(BCNF) 如果关系模式 R(U,F)的所有属性(包括主属性和非主属性)都不传递依赖于 R 的任何候选关键字,那么称关系 R 是属于 BCNF 的。第四范式(4NF):第四范式禁止主键列和非主键列一对多关系不受约束。第五范式(5NF): 第五范式将表分割成尽可能小的块,为了排除在表中所有的冗余。2.数据依赖一个关系通常是由赋予它的元组语义来确定的。元组语义实质上是一个目谓词(n 是属性集中属性的个数)。凡使该 n 目谓词为真的笛卡尔积中的元素(或者说凡符合元组语义的那部分元素)的全体就构成了该关系模式的关系。现实世界的许多已有事实限定了关系模式所有可能的关系必须满足一定的完整性约束条件。这些约束或者通过对属性取值范围的限定,或者通过属性值间的相互关连(主要体现于值的相等与否)反映出来。后者称为数据依赖,它是数据模式设计的关键。关系模式应当刻划这些完整性约束条件,于是一个关系模式应当是一个五元组。 R(U, D, dom F)这里: ① 关系名 R,它是符号化的元组语义; ② 一组属性 U:
③ 属性组 U 中属性所来自的域 D; ④ 属性到域的映 dom: ⑤ 属性组 U 上的一组数据依赖 F. 由于③ ④一对模式设计关系不大,因此在本章中把关系模式看作是一个三元组: R(U, D, dom ,F) 当且仅当 U 上的一个关系,满足 F 时,r 称为关系模式 R ( U, F)的一个关系。 关系,作为一张二维表,对它有一个最起码的要求:每一个分量必须是不可分的数据项。满足了这个条件的关系模式就属于第一范式(1NF)。3. 函数依赖数据依赖是通过一个关系中属性间值的相等与否体现出来的数据间的相互关系.它是现实世界属性间相互联系的抽象,是数据内在的性质,是语义的体现。现在人们已经提出了许多种类型的数据依赖,其中最重要的是函数依赖(Function Dependency,简称 FD)和多值依赖(Multivalued Dependency,简称 MVD)多值依赖:MVD 对于一个属性值,另一个属性是多个值与其对应。而多值属性之间无关。 除了函数依赖、多值依赖,专家学者定义了连接依赖、和域/关键字依赖。4. 模式分解的优点之一是能消除数据冗余和操作异常现象。5. SUM (列名)、MAX (列名)、AVG (列名)这些聚合函数均忽略空值(null)。第五章:数据库保护活锁:如果事务 T1 封锁了数据 A,事务 T2 又请求封锁 A,于是 T2 等待.T3 也请求封锁 A,当 T:释放了 A 上的封锁之后系统首先批准了 T3 的请求,T2 仍然等待。然后 T4 又请求封锁 A,当几释放了 A 上的封锁之后系统又批准了 T4 的请求…...T:有可能永远等待,这就是活锁的情形死锁:如果事务 T1 封锁了数据 A1,T2 封锁了数据 A2,然后 T1 又请求封锁 A2,因T2 已封锁了 A2,于是 T1 等待 T2 释放凡上的锁.接着 T2 又申请封锁 R1 因 T1 己封锁了R1,T2 也只能等待 T1 释放 R2 上的锁。这样就出现了 T:在等待 T2,而 T2 又在等待 T1的局面,T1 和 T2 两个事务永远不能结束,形成死锁。保证并行操作可串行性的调度策略是让并行执行的所有事务均遵守两段锁协议。1.数据库保护:从计算机软件角度出发来保护数据库系统中数据,使之不至于受到非法访问或破坏,这称为数据库保护。常见的数据库保护措施有:安全性保护,完整性保护,并发控制和故障恢复。2.数据库的安全性保护是指防止非法使用数据库。包括防止非法用户使用数据库和合法用户非法使用数据库。常见的保护措施有: 使用权的鉴别。 使用范围限制。 存取控制权鉴别。3.数据库完整性:数据库的完整性保护是指对数据库中数据的正确性和一致性的维护。常见的完整性保护措施有:完整性约束(包括实体完整性,引用完整性和用户自定义完整性约束),触发器,并发控制和故障恢复(包括转储与日志)。ACCESS 在设计表时有:字段名称、数据类型、字段大小、格式、有效性规则、有效性文本、是否必填字段、是否允许空字符串等。在 ACCESS 中,如果想在数据库的某字段中输入电子邮件地址,则应将字段定义成超级链接。ACCESS 数据库具有设置用户口令、给用户授权、和数据加密的安全措施。Access 数据库中数据导入的功能是将其他数据库如 SQL SERVER 或其他软件如
EXCELL 中数据传输到 ACCESS 数据库中。4.在数据库系统中常用的是两种类型的封锁:排它锁(又称 X 封锁或 X 锁)和共享锁(又称 S 封锁或 S 锁)。排它锁又称为写锁。若事务 T 对数据对象 A 加上 x 锁,则只允许 T 读取和修改 A,其他任何事务都不能再对 A 加任何类型的锁,直到 T 释放 A 上的锁。这就保证了其他事务在 T 释放 A 上的锁之前不能再读取和修改 A。只有当某数据对象没有被加上任何类型的封锁时,用户才能在该数据对象上施加 X 封锁。只有当某数据对象被加上 S 封锁或没有任何类型的封锁时,用户才能在该数据对象上施加 S 封锁。通过采用适当级别的封锁协议就可以避免常见的数据不一致性现象:5.预防死锁的两种方法在数据库中,产生死锁的原因是两个或多个事务都己封锁了一些数据对象,然后又都请求对已为其他事务封锁的数据对象加锁,从而出现死等待。防止死锁的发生其实就是要破坏产生死锁的条件。预防死锁通常有两种方法:① 一次封锁法 ②顺序封锁法可见,在操作系统中广为采用的预防死锁的策略并不很适合数据库的特点,因此DBMS 在解决死锁的问题上普便采用的是诊断并解除死锁的方法。6.数据库镜像的用途用途:时实、自动保证镜像数据库与主数据库一致,保证主数据库和备份数据库处于联机状态。随着磁盘容量越来越大,价格越来越便宜,为避免磁盘介质出现故障影响数据库的可用性,许多数据库管理系统提供了数据库镜像(Mirror)7.封锁粒度(Grannularity )封锁对象的大小称为封锁粒度(Grannularity )。封锁对象可以是逻辑单元,也可以是物理单元。以关系数据库为例,封锁对象可以是这样一些逻辑单元:属性值、属性值的集合、元组、关系、索引项、整个索引直至整个数据库。也可以是这样一些物理单元 :页(数据页或索引页)、块等。封锁粒度与系统的并发度和并发控制的开销密切相关。直观地看,封锁的粒度越大,数据库所能够封锁的数据单元就越少,并发度就越小,系统开销也越小;反之,封锁的粒度越小,并发度较高,但系统开销也就越大。8. 并发操作的调度数据库的并发操作通常会带来三个问题:丢失更新问题、读脏数据问题、不可重复读问题。定义多个事务的并发执行是正确的,当且仅当其结果与按某一次序串行地执行它们时的结果相同,我们称这种调度策略为可串行化(serializable )的调度。可串行性(Serializability)是并发事务正确性的准则。按这个准则规定,一个给定的并发调度,当且仅当它是可串行化的,才认为是正确调度。9.系统故障系统故障是指造成系统停止运转的任何事件,使得系统要重新启动.例如,特定类型的硬件错误(CPU 故障)、操作系统故障、DBMS 代码错误、突然停电等。10. 日志文件是用来记录事务对数据库的更新操作的文件。不同数据库系统采用的日志文件格式并不完全一样。概括起来日志文件主要有两种格式:以记录为单位的日志文件和以数据块为单位的日志文件。11. 恢复的技术恢复机制涉及的两个关键问题是:第一,如何建立冗余数据:第二,如何利用这些冗余数据实施数据库恢复。
1)数据转储建立冗余数据最常用的技术是数据转储和登录日志文件。通常在一个数据库系统中,这两种方法是一起使用的。数据转储是数据库恢复中采用的基本技术。所谓转储即 n$}定期地将整个数据库复制到磁带或另一个磁盘上保存起来的过程。这些备用的数据文本称为后备副本或后援副本。转储是十分耗费时间和资源的,不能频繁进行。DBA 应该根据数据库使用情况确定一个适当的转储周期。转储可分为静态转储和动态转储。2).登记日志文件日志文件是用来记录事务对数据库的更新操作的文件。不同数据库系统采用的日志文件格式并不完全一样。概括起来日志文件主要有两种格式:以记录为单位的日志文件和以数据块为单位的日志文件。12. 在数据库中,保证数据安全性的方法有:用户识别和鉴定、存取控制、定义视图、审计、和数据加密。13. 当数据库运行一段时间后,为了保证数据库存取空间的利用率和存取效率,应该对数据库再组织。第六章:数据库设计1.数据库设计的步骤需求分析阶段、概念结构设计阶段 、逻辑结构设计阶段 、数据库物理设计阶段 、数据库实施阶段 、数据库运行和维护阶段 2.概念设计即概念结构设计,就是将需求分析得到的用户需求抽象为信息结构即概念模型的过程就是概念结构设计,是数据库设计关键。 3.概念结构(概念模型) 概念结构是对现实世界的一种抽象,即对实际的人、物、事和概念进行人为处理,抽取人们关心的共同特性,忽略非本质的细节,并把这些特性用各种概念精确地加以描述,一般都以 E-R 模型为工具来描述概念结构。 4.概念结构设计的方法与步骤设计概念结构通常有四类方法: · 自顶向下、自底向上 、 逐步扩张 、混合策略 5.逻辑设计的基本方法: 数据库逻辑设计的主要工作是将从 EE-R 图转化成指RDBMS 中关系模式。它的主要内容有:命名与属性域的处理:关系模式中的命名可以用 EE-R 图中原有命名,也可另行命名,但是应尽量避免重名。非原子属性处理:EE-R 图中允许出现非原子属性,关系模式中应符合第一范式故不允许出现非原子属性。非原子属性主要有集合型和元组型。如出现此种情况可以进行转换,转换办法是集合属性纵向展开而元组属性横向展开。规范化:在逻辑设计中还需要对转换得到的关系做规范化验证,使每个关系至少满足第三范式。RDBMS:为满足 RDBMS 在性能、存储空间等方面的要求,以及适应 RDBMS 限制条件而做的修改,它们包含如下内容:• 减少联接运算的次数以改善性能。• 调整关系大小,使每个关系的数据量保持在合理水平,从而可以提高存取效率。• 尽量采用快照(snapshot)。6.数据字典数据字典是各类数据描述的集合,它是关于数据库中数据的描述,即元数据,而不是数据本身。数据字典通常包括数据项、数据结构、数据流、数据存储和处理过程五个部分
(至少应该包含每个字段的数据类型和在每个表内的主外键)。数据字典是在数据库设计的概念结构设计阶段产生的。7. 在对象联系图中,用双向箭头表示对象类型之间的超类与子类的联系。8. ODBC 技术为应用程序提供了一套 CLI 函数库和基于 DLL 的运行支持环境。9. 数据库逻辑设计的结果不是唯一的。为了进一步提高数据库应用系统的性能,还应该根据应用需要适当地修改、调整数据模型的结构,这就是数据模型的优化。关系数据模型的优化通常以规范化理论为指导。关系数据模型通常由数据结构、关系操作、完整性约束 部分组成。10.在传统的关系数据模型基础上,提供元组、数组、集合等数据类型以及处理新的数据类型操作的能力,这样形成的数据模型,称为“对象关系数据模型”。第七章:数据库技术新进展。1.并行粒度并行粒度指的是查询执行的并行程度,并行粒度可分为如下四种。不同用户事务间的并行性、同一事务内不同查询间的并行性、同一查询内不同操作间的并行性和同一操作内的并行性。(1)事务间(inter-Transaction)并行性(2)查询间(inter-Query)并行性(也就是事务内并行性)(3)操作间(inter-Operation)并行性(也就是查询内并行性)(4)操作内(intra-Operation)并行性2. 多媒体数据库媒体是信息的载体。多媒体是指多种媒体,如数字、正文、图形、图像和声音的有机集成,而不是简单的组合。其中数字、字符等称为格式化数据;文本、图形、图像、声音、视频等称为非格式化数据,非格式化数据具有数据量大、处理复杂等特点。多媒体数据库实现对格式化和非格式化的多媒体数据的存储、管理和查询,其主要特征有: (1)多媒体数据库应能够表示多种媒体的数据。 (2)多媒体数据库应能够协调处理各种媒体数据,正确识别各种媒体数据之间在空间或时间上的关联。(3)多媒体数据库应提供比传统数据管理系统更强的适合非格式化数据查询的搜索功能。多媒体数据库应提供特种事务处理与版本管理能力.3. 数据仓库数据仓库是信息领域中近年来迅速发展起来的数据库新技术。数据仓库的建立能充分利用已有的数据资源,把数据转换为信息,从中挖掘出知识,提炼成智慧,最终创造出效益.所以,越来越多的企业开始认识到数据仓库应用所带来的好处。操作型处理也叫事务处理,是指对数据库联机的日常操作,通常是对一个或一组记录的查询和修改,主要是为企业的特定应用服务的,人们关心的是响应时间,数据的安全性和完整性。4. 分布式数据库的特点分布式数据库应具有以下特点: (1)数据的物理分布性。共享的集中式数据库系统。(2)数据的逻辑整体性。(3)数据的分布独立性(也称分布透明性)。(4)场地自治和协调。(5)数据的冗余及冗余透明性。