WHERE SC.C#=C.C#))
要从语义上分解:(1)选择课程的课程号与课程名,不存在不选这门课的同学。 其中,“不选这门课的同学”可以表示为:
或者
SELECT * FROM S
WHERE NOT EXISTS
(SELECT * FROM SC WHERE S.S#=C.S#
AND SC.C#=C.C# )
SELECT * FROM S WHERE S# NOT IN (SELECT * FROM SC WHERE SC.C#=C.C#)
(7)检索选修课程包含LIU老师所授课的学生学号。 SELECT DISTINCT S# FROM SC WHERE C# IN (SELECT C# FROM C
WHERE TEACHER='LIU'))
3.3 设有两个基本表R(A,B,C)和S(D,E,F),试用SQL查询语句表达下列关系代数表达式:
(1)πA(R) (2)σB='17'(R) (3)R×S (4))πA,F(σC=D(R×S))
(1)SELECT A FROM R
(2)SELECT * FROM R WHERE B='17' (3)SELECT A,B,C,D,E,F FROM R,S
(4)SELECT A,F FROM R,S WHERE R.C=S.D
3.4 3.4 设有两个基本表R(A,B,C)和S(A,B,C)试用SQL查询语句表达下列关系代数表达式:
(1)R∪S (2)R∩S (3)R-S (4)πA,B(R)πB,C(S)
(1)SELECT A,B,C FROM R UNION SELECT A,B,C
21
FROM S
(2)SELECT A,B,C FROM R INTERSECT SELECT A,B,C FROM S
(3)SELECT A,B,C FROM R
WHERE NOT EXISTS (SELECT A,B,C FROM S
WHERE R.A=S.A AND R.B=S.B AND R.C=S.C)
(4)SELECT R.A,R.B,S.C FROM R,S WHERE R.B=S.B
3.5 试叙述SQL语言的关系代数特点和元组演算特点。
(P61-62)
3.6 试用SQL查询语句表达下列对教学数据库中三个基本表S、SC、C的查询:
(1)统计有学生选修的课程门数。
SELECT COUNT(DISTINCT C#) FROM SC
(2)求选修C4课程的学生的平均年龄。 SELECT AVG(AGE) FROM S WHERE S# IN (SELECT S# FROM SC WHERE C#='C4') 或者,
SELECT AVG(AGE) FROM S,SC
22
WHERE S.S#=SC.S# AND C#='004'
(3)求LIU老师所授课程的每门课程的学生平均成绩。 SELECT CNAME,AVG(GRADE) FROM SC ,C
WHERE SC.C#=C.C# AND TEACHER='LIU' GROUP BY C#
(4)统计每门课程的学生选修人数(超过10人的课程才统计)。要求输出课程号和选修人数, 查询结果按人数降序排列,若人数相同,按课程号升序排列。 SELECT DISTINCT C#,COUNT(S#) FROM SC GROUP BY C#
HAVING COUNT(S#)>10 ORDER BY 2 DESC, C# ASC
(5)检索学号比WANG同学大,而年龄比他小的学生姓名。 SELECT X.SNAME FROM S AS X, S AS Y
WHERE Y.SNAME='WANG' AND X.S#>Y.S# AND X.AGE (6)检索姓名以WANG打头的所有学生的姓名和年龄。 SELECT SNAME,AGE FROM S WHERE SNAME LIKE 'WANG%' (7)在SC中检索成绩为空值的学生学号和课程号。 SELECT S#,C# FROM SC WHERE GRADE IS NULL (8)求年龄大于女同学平均年龄的男学生姓名和年龄。 SELECT SNAME,AGE FROM S AS X WHERE X.SEX='男' AND X.AGE>(SELECT AVG(AGE) FROM S AS Y WHERE Y.SEX='女') 23 (9)求年龄大于所有女同学年龄的男学生姓名和年龄。 SELECT SNAME,AGE FROM S AS X WHERE X.SEX='男' AND X.AGE>ALL (SELECT AGE FROM S AS Y WHERE Y.SEX='女') 3.7 试用SQL更新语句表达对教学数据库中三个基本表S、SC、C的各个更新操作: (1)往基本表S中插入一个学生元组(?S9?,?WU?,18)。 INSERT INTO S(S#,SNAME,AGE) VALUES('59','WU',18) (2)在基本表S中检索每一门课程成绩都大于等于80分的学生学号、姓名和性别,把检索到的值送往另一个已存在的基本表STUDENT(S#,SANME,SEX)。 INSERT INTO STUDENT(S#,SNAME,SEX) SELECT S#,SNAME,SEX FROM S WHERE NOT EXISTS (SELECT * FROM SC WHERE GRADE<80 AND S.S#=SC.S#) (3)在基本表SC中删除尚无成绩的选课元组。 DELETE FROM SC WHERE GRADE IS NULL (4)把WANG同学的学习选课和成绩全部删去。 DELETE FROM SC WHERE S# IN (SELECT S# FROM S WHERE SNAME='WANG') (5)把选修MATHS课不及格的成绩全改为空值。 UPDATE SC SET GRADE=NULL WHERE GRADE<60 AND C# IN (SELECT C# FROM C WHERE CNAME='MATHS') (6)把低于总平均成绩的女同学成绩提高5%。 24 并 UPDATE SC SET GRADE=GRADE*1.05 WHERE GRADE<(SELECT AVG(GRADE) FROM SC) AND S# IN (SELECT S# FROM S WHERE SEX='F') (7)在基本表SC中修改C4课程的成绩,若成绩小于等于75分时提高5%, 若成绩大于75分时提高4%(用两个UPDATE语句实现)。 UPDATE SC SET GRADE=GRADE*1.05 WHERE C#='C4' AND GRADE<=75 UPDATE SC SET GRADE=GRADE*1.04 WHERE C#='C4' AND GRADE>75 3.8 在第1章例1.4中提到“仓库管理”关系模型有五个关系模式: 零件 PART(P#,PNAME,COLOR,WEIGHT) 项目 PROJECT(J#,JNAME,DATE) 供应商 SUPPLIER(S#,SNAME,SADDR) 供应 P_P(J#,P#,TOTOAL) 采购 P_S(P#,S#,QUANTITY) (1)试用SQL DDL语句定义上述五个基本表,并说明主键和外键。 CREATE TABLE PART (P# CHAR(4) NOT NULL,PNAME CHAR(12) NOT NULL, COLOR CHAR(10),WEIGHT REAL, PRIMARY KEY(P#)) CREATE TABLE PROJECT (J# CHAR(4) NOT NULL,JNAME CHAR(12) NOT NULL, DATE DATE, PRIMARY KEY(J#)) CREATE TABLE SUPLIER (S# CHAR(4) NOT NULL,SNAME CHAR(12),SADDR VARCHAR(20), PRIMARY KEY(S#)) CREATE TABLE P_P (J# CHAR(4),P# CHAR(4),TOTAL INTEGER, 25 数据库系统原理课后习题参考答案 数据库原理之数据库概论课后习题及答案 ................................................................................... 2 数据库原理之关系模型课后习题及答案 ..................................................................................... 11 数据库原理之关系数据库SQL语言课后习题及答案 ................................................................. 18 数据库原理之关系数据库的模式设计课后习题及答案 ............................................................. 28 数据库原理之数据库设计课后习题及答案 ................................................................................. 43 数据库原理之数据库保护课后习题及答案 ................................................................................. 48 数据库原理之分布式数据库系统课后习题及答案 ..................................................................... 62 1 数据库原理之数据库概论课后习题及答案 1.1 名词解释 (1) DB:即数据库(Database),是统一管理的相关数据的集合。 DB能为各种用户共享,具有最小冗余度,数据间联系密切,而又有较高的数据独立性。 (2) DBMS:即数据库管理系统(Database Management System),是位于用户与操作系统之间的一层数据管理软件, 为用户或应用程序提供访问DB的方法,包括DB的建立、查询、更新及各种数据控制。 DBMS总是基于某种数据模型,可以分为层次型、网状型、关系型、面向对象型DBMS。 (3) DBS:即数据库系统(Database System),是实现有组织地、动态地存储大量关联数据, 方便多用户访问的计算机软件、硬件和数据资源组成的系统,即采用了数据库技术的计算机系统。 (4) 1:1联系:如果实体集E1中的每个实体最多只能和实体集E2中的一个实体有联系,反之亦然, 那么实体集E1对E2的联系称为“一对一联系”,记为“1:1”。 (5) 1:N联系:如果实体集E1中每个实体与实体集E2中任意个(零个或多个)实体有联系, 而E2中每个实体至多和E1中的一个实体有联系,那么E1对E2的联系是“一对多联系”,记为“1:N”。 (6) M:N联系:如果实体集E1中每个实体与实体集E2中任意个(零个或多个)实体有联系, 反之亦然,那么E1对E2的联系是“多对多联系”,记为“M:N”。 (7) 数据模型:模型是对现实世界的抽象。在数据库技术中,表示实体类型及实体类型间联系的模型称为“数据模型”。 它可分为两种类型:概念数据模型和结构数据模型。 (6) 概念数据模型:是独门于计算机系统的模型,完全不涉及信息在系统中的表示, 只是用来描述某个特定组织所关心的信息结构。 (9) 结构数据模型:是直接面向数据库的逻辑结构,是现实世界的第二层抽象。 这类模型涉及到计算机系统和数据库管理系统,所以称为“结构数据模型”。 结构数据模型应包含:数据结构、数据操作、数据完整性约束三部分。它主要有:层次、网状、关系三种模型。 (10) 层次模型:用树型结构表示实体类型及实体间联系的数据模型。 2 (11) 网状模型:用有向图结构表示实体类型及实体间联系的数据模型。 (12) 关系模型:是目前最流行的数据库模型。其主要特征是用二维表格结构表达实体集,用外鍵表示实体间联系。 关系模型是由若干个关系模式组成的集合。 (13) 概念模式:是数据库中全部数据的整体逻辑结构的描述。它由若干个概念记录类型组成。 概念模式不仅要描述概念记录类型,还要描述记录间的联系、操作、数据的完整性、安全性等要求。 三级模式与二级映像 (14) 外模式:是用户与数据库系统的接口,是用户用到的那部分数据的描述。 (15) 内模式:是数据库在物理存储方面的描述,定义所有的内部记录类型、索引和文件的组成方式, 以及数据控制方面的细节。 (16) 模式/内模式映象:这个映象存在于概念级和内部级之间,用于定义概念模式和内模式间的对应性, 即概念记录和内部记录间的对应性。此映象一般在内模式中描述。 (17) 外模式/模式映象:这人映象存在于外部级和概念级之间,用于定义外模式和概念模式间的对应性, 即外部记录和内部记录间的对应性。此映象都是在外模式中描述。 (18) 数据独立性:在数据库技术中,数据独立性是指应用程序和数据之间相互独立,不受影响。 数据独立性分成物理数据独立性和逻辑数据独立性两级。 (19) 物理数据独立性:如果数据库的内模式要进行修改,即数据库的存储设备和存储方法有所变化, 那么模式/内模式映象也要进行相应的修改,使概念模式尽可能保持不变。也就是对模式的修改尽量不影响概念模式。 (20) 逻辑数据独立性:如果数据库的概念模式要进行修改(如增加记录类型或增加数据项), 那么外模式/模式映象也要进行相应的修改,使外模式尽可能保持不变。 也就是对概念模式的修改尽量不影响外模式和应用程序。 (21) 宿主语言:在数据库技术中,编写应用程序的语言仍然是一些高级程序设计语言, 这些语言称为宿主语言(host language),简称主语言。 (22) DDL:数据定义语言(Data Definition Language),用于定义数据库的三级结构,包括外模式、概念模式、内模式及其相互之间的映象,定义数据的完整性、安全控制等约束。 3 (23) DML:数据操纵语言(Data Manipulation Language),由DBMS提供,用于让用户或程序员使用,实现对数据库中数据的操作。 DML分成交互型DML和嵌入型DML两类。依据语言的级别,DML又可分成过程性DML和非过程性DML两种。 (24) 交互型DML:如果DML自成系统,可在终端上直接对数据库进行操作,这种DML称为交互型DML。 (25) 嵌入型DML:如果DML嵌入在主语言中使用,此时主语言是经过扩充能处理DML语句的语言,这种DML称为嵌入型DML。 (26) 过程性DML:用户编程时,不仅需要指出“做什么”(需要什么样的数据),还需要指出“怎么做”(怎么获得数据)。层状、网状的DML属于过程性语言。 (27) 非过程性DML:用户编程时,只需要指出“做什么”,不需要指出“怎么做”。 Notice:以上关于DML的各个概念单独出现时,首先要解释DML的含义。 (28) DD:数据字典(Data Dictionary),数据库系统中存放三级结构定义的数据库称为数据字典。 对数据库的操作都要通过访问DD才能实现。 (29) DD系统:管理DD的实用程序称为“DD系统”。 1.2 文件系统阶段的数据管理有些什么缺陷?试举例说明。 文件系统有三个缺陷: (1)数据冗余性(redundancy)。由于文件之间缺乏联系,造成每个应用程序都有对应的文件, 有可能同样的数据在多个文件中重复存储。 (2)数据不一致性(inconsistency)。这往往是由数据冗余造成的,在进行更新操作时,稍不谨慎, 就可能使同样的数据在不同的文件中不一样。 (3)数据联系弱(poor data relationship)。这是由文件之间相互独立,缺乏联系造成的。 1.3 数据库阶段的数据管理有些什么特点? (1) 采用复杂的数据模型表示数据结构 (2) 有较高的数据独立性(数据结构分成用户的逻辑结构、整体逻辑结构和物理结构三级) (3) 数据库系统为用户提供方便的用户接口,可以使用查询语言、终端命令或程序方式操作数据, 也可以用程序方式操作数据库。 4 (4) 系统提供了四个方面的数据控制功能:数据库的恢复、并发控制、数据完整性和数据安全性, 以保证数据库中数据是安全的、正确的和可靠的。 (5) 对数据的操作不一定以记录为单位,还可以数据项为单位,增加了系统的灵活性。 1.4 你怎样理解实体、属性、记录、字段这些概念的类型和值的差别?试举例说明。 实体(entity):是指客观存在可以相互区别的事物。实体可以是具体的对象,如:一个学生,一辆汽车等; 也可以是抽象的事件,如:一次借书、一场足球赛等。 属性(attribute):实体有很多特性,每一个特性称为属性。每个属性有一个值域, 其类型可以是整数型、实数型、字符串型。比如,学生(实体)有学号、姓名、年龄、性别等属性, 相应值域为字符、字符串、整数和字符串型。 字段(field):标记实体属性的命名单位称为字段或数据项。它是可以命名的最小信息单位, 所以又称为数据元素或初等项。字段的命名往往和属性名相同,比如,学生有学号、姓名、年龄、性别等字段。 记录(record):字段的有序集合称为记录。一般用一个记录描述一个实体, 所以记录又可以定义为能完整地描述一个实体的字段集。如:一个学生记录,由有序的字段集(学号、姓名、年龄、性别等)组成。 1.5 逻辑记录与物理记录,逻辑文件与物理文件有些什么联系和区别? 联系: (1)逻辑记录与物理记录都是记录,是字段的有序集合; (2)逻辑文件与物理文件都是文件,是同一类记录的汇集。 区别: (1)逻辑记录与逻辑文件是逻辑数据描述,物理记录与物理文件是物理数据描述。 (2)物理数据描述是指数据在存储设备上的存储方式,物理记录、物理文件(还有物理联系、物理结构等术语), 都是用来描述实际存储设备上的数据。 (3)逻辑数据描述是指程序员或用户用以操作的数据形式,是抽象的概念化数据。 逻辑记录、逻辑文件(还有逻辑联系、逻辑结构等术语),都是用户观点的数据描述。 5 1.6 为某百货公司设计一个ER模型。 百货管辖若干个连锁商店,每家商店经营若干商品, 每家商店有若干职工,但每个职工只能服务于一家商店。实体类型“商店”的属性有:商店编号,店名,店址,店经理。 实体类型“商品”的属性有:商品编号,商品名,单价,产地。实体类型“职工”的属性有:职工编号,职工名,性别,工资。 在联系中应反映出职工参加某商店工作的开始时间,商店销售商品的月销售量。 试画出反映商店、商品、职工实体类型及联系类型的ER图,并将其转换成关系模式集。 实体:商店(商店编号,店名,店址,店经理) 商品(商品编号,商品名,单价,产地) 职工(职工编号,职工名,性别,工资) 联系:SC(商店—商品之间1:N的联系,联系属性为“职工参加商店工作的开始时间”。 SE(商店—职工之间1:N的联系),联系属性为“月销售量”。 ER图: 关系模式集:商店模式(商店编号,店名,店址,店经理) 商品模式(商品编号,商品名,单价,产地,商店编号,月销售量) 职工模式(职工编号,职工名,性别,工资,商店编号,开始时间) 1.7 试述ER模型、层次模型、网状模型、关系模型和面向对象模型的主要特点。 ER模型的主要特点: 6 (1)优点:接近于人的思维,容易理解;与计算机无关,用户容易接受。 (2)缺点:只能说明实体间语义的联系,不能进一步说明详细的数据结构。 层次模型的特点: (1)优点:记录之间的联系通过指针实现,查询效率较高。 (2)缺点:只能表示1:N联系,实现M:N结构较复杂;由于层次顺序的严格和复杂,引起数据的查询和更新操作也很复杂。 网状模型的特点: (1)优点:记录之间联系通过指针实现,M:N联系也容易实现(每个M:N联系可拆成两个1:N联系),查询效率较高。 (2)缺点:编写应用程序比较复杂,程序员必须熟悉数据库的逻辑结构。 关系模型的特点: 用关鍵码而不是用指针导航数据,表格简单,用户易懂,编程时并不涉及存储结构、访问技术等细节。 1.8 试述概念模式在数据库结构中的重要地位。 概念模式是数据库中全部数据的整体逻辑结构的描述。它由若干个概念记录类型组成。 概念模式不仅要描述概念记录类型,还要描述记录间的联系、操作、数据的完整性、安全性等要求。 数据按外模式的描述提供给用户,按内模式的描述存储在磁盘中,而概念模式提供了连接这两级的相对稳定的中间观点, 并使得两级的任何一级的改变都不受另一级的牵制。 1.9 数据独立性与数据联系这两个概念有什么区别? 数据独立性是指应用程序与数据之间相互独立,不受影响。 数据联系是指同一记录内部各字段间的联系,以及记录之间的联系。 7 1.10 试述DBMS在用户访问数据库过程中所起的作用. 用户对数据库进行操作,DBMS把操作从应用程序带到外部级、概念级、再导向内部级,进而操作存储器中的数据。 (结合P22“用户访问数据的过程”来理解) 1.11 试述DBMS的主要功能。 DBMS的主要功能有: (1)数据库的定义功能 (2)数据库的操纵功能 (3)数据库的保护功能 (4)数据库的存储管理 (5)数据库的维护功能 (6)数据字典 1.12 试叙DBMS对数据库的保护功能。 DBMS对数据库的保护主要通过四个方面实现: (1)数据库的恢复。 (2)数据库的并发控制。 (3)数据库的完整性控制。 (4)数据库的安全性控制。 1.13 试叙DBMS对数据库的维护功能。 DBMS中有一些程序提供给数据库管理员运行数据库系统时使用,这些程序起着数据库维护的功能。 主要有四个实用程序: (1)数据装载程序(loading) (2)备份程序(backup) (3)文件重组织程序 8 (4)性能监控程序 1.14 从模块结构看,DBMS由哪些部分组成? 从模块结构看,DBMS由两大部分组成:查询处理器和存储管理器 (1)查询处理器有四个主要成分:DDL编译器,DML编译器,嵌入型DML的预编译器,查询运行核心程序 (2)存储管理器有四个主要成分:授权和完整性管理器,事务管理器,文件管理器,缓冲区管理器 (以上几题具体可参照书上p20-21) 1.15 DBS由哪几个部分组成? DBS由四部分组成:数据库、硬件、软件、数据库管理员。 1.16 什么样的人是DBA?DBA应具有什么素质?DBA的职责是什么? DBA是控制数据整体结构的人,负责DBS的正常运行。DBA可以是一个人,在大型系统中也可以是由几个人组成的小组。 DBA承担创建、监控和维护整个数据库结构的责任。 DBA应具有下列素质: (1)熟悉企业全部数据的性质和用途; (2)对用户的需求有充分的了解; (3)对系统的性能非常熟悉。 DBA的主要职责有五点: (1)概念模式定义 (2)内模式定义 (3)根据要求修改数据库的概念模式和内模式 (4)对数据库访问的授权 (5)完整性约束的说明 9 1.17 试对DBS的全局结构作详细解释。 参照教材p24-25。 1.18 使用DBS的用户有哪几类? 使用DBS的用户有四类: 1)DBA 2)专业用户 3)应用程序员 4)最终用户 1.19 DBMS的查询处理器有哪些功能? DBMS的查询处理器可分成四个成分: 1)DML编译器 2)嵌入型DML的预编译器 3)DDL编译器 4)查询运行核心程序 (各成分功能参照P24) 1.20 DBMS的存储处理器有哪些功能? DBMS的存储处理器提供了应用程序访问数据库中数据的界面,可分成四个成分: 1)授权和完整性管理器 2)事务管理器 3)文件管理器 4)缓冲区管理器 (各成分功能参照P25) 1.21 磁盘存储器中有哪四类主要的数据结构? 10 数据文件:存储了数据库中的数据; 数据字典(DD):存储三级结构的描述; 索引文件:为提高查询速度而设置的逻辑排序手段; 统计数据组织:存储DBS运行时统计分析数据。 数据库原理之关系模型课后习题及答案 2.1 名词解释 (1)关系模型:用二维表格结构表示实体集,外键表示实体间联系的数据模型称为关系模型。 (2)关系模式:关系模式实际上就是记录类型。它的定义包括:模式名,属性名,值域名以及模式的主键。 关系模式不涉及到物理存储方面的描述,仅仅是对数据特性的描述。 (3)关系实例:元组的集合称为关系和实例,一个关系即一张二维表格。 (4)属性:实体的一个特征。在关系模型中,字段称为属性。 (5)域:在关系中,每一个属性都有一个取值范围,称为属性的值域,简称域。 (6)元组:在关系中,记录称为元组。元组对应表中的一行;表示一个实体。 (7)超键:在关系中能唯一标识元组的属性集称为关系模式的超键。 (8)候选键:不含有多余属性的超键称为候选键。 (9)主键:用户选作元组标识的一个候选键为主键。(单独出现,要先解释“候选键”) (10)外键:某个关系的主键相应的属性在另一关系中出现,此时该主键在就是另一关系的外键, 如有两个关系S和SC,其中S#是关系S的主键,相应的属性S#在关系SC中也出现,此时S#就是关系SC的外键。 (11)实体完整性规则:这条规则要求关系中元组在组成主键的属性上不能有空值。 如果出现空值,那么主键值就起不了唯一标识元组的作用。 (12)参照完整性规则:这条规则要求“不引用不存在的实体”。 其形式定义如下:如果属性集K是关系模式R1的主键,K也是关系模式R2的外键,那么R2的关系中, K的取值只允许有两种可能,或者为空值,或者等于R1关系中某个主键值。 这条规则在使用时有三点应注意: 1)外键和相应的主键可以不同名,只要定义在相同值域上即可。 2)R1和R2也可以是同一个关系模式,表示了属性之间的联系。 3)外键值是否允许空应视具体问题而定。 11 (13)过程性语言:在编程时必须给出获得结果的操作步骤,即“干什么”和“怎么干”。如Pascal和C语言等。 (14)非过程性语言:编程时只须指出需要什么信息,不必给出具体的操作步骤。 各种关系查询语言均属于非过程性语言。 (15)无限关系:当一个关系中存在无穷多个元组时,此关系为无限关系。 如元组表达式{t|┐R(t)}表示所有不在关系R中的元组的集合,这是一个无限关系。 (16)无穷验证:在验证公式时需对无穷多个元组进行验证就是无穷验证。 如验证公式(u)(P(u))的真假时需对所有的元组u进行验证,这是一个无穷验证的问题。 2.2 为什么关系中的元组没有先后顺序? 因为关系是一个元组的集合,而元组在集合中的顺序无关紧要。因此不考虑元组间的顺序,即没有行序。 2.3 为什么关系中不允许有重复元组? 因为关系是一个元组的集合,而集合中的元素不允许重复出现,因此在关系模型中对关系作了限制, 关系中的元组不能重复,可以用键来标识唯一的元组。 2.4 关系与普通的表格、文件有什么区别? 关系是一种规范化了的二维表格,在关系模型中,对关系作了下列规范性限制: 1)关系中每一个属性值都是不可分解的。 2)关系中不允许出现相同的元组(没有重复元组)。 3)由于关系是一个集合,因此不考虑元组间的顺序,即没有行序。 4)元组中,属性在理论上也是无序的,但在使用时按习惯考虑列的顺序。 2.5 笛卡尔积、等值联接、自然联接三者之间有什么区别? 笛卡尔积对两个关系R和S进行乘操作,产生的关系中元组个数为两个关系中元组个数之积。 12 等值联接则是在笛卡尔积的结果上再进行选择操作,从关系R和S的笛卡儿积中选择对应属性值相等的元组; 自然连接则是在等值联接(以所有公共属性值相等为条件)的基础上再行投影操作,并去掉重复的公共属性列。 当两个关系没有公共属性时,自然连接就转化我笛卡尔积。 2.6 设有关系R和S(如下:) 计算: 2.7 设有关系R和S(如下:) 13 计算: 2.8 如果R是二元关系,那么下列元组表达式的结果是什么? {t|(u)(R(t)∧R(u)∧(t[1]≠u[1]∨t[2]≠u[2]))} 这个表达式的意思是:从关系R中选择元组,该元组满足:第1分量值或第2分量值至少有一个不等于其他某元组。 由于R是二元关系,只有两个分量,由于没有重复元组,上述条件显然满足。 所以,这个表达式结果就是关系R。 2.9 假设R和S分别是三元和二元关系,试把表达式π1,5(σ2=4∨3=4(R×S))转换成等价的:(1)汉语查询句子;(2)元组表达式;(3)域表达式。 (1)汉语表达式: 从R×S关系中选择满足下列条件的元组: 第2分量(R中第2分量)与第4分量(S中第1分量)值相等,或第3分量(R中第3分量)与第4分量(S中第1分量)值相等;并取第1列与第5列组成的新关系。 (2)元组表达式:{t|(u)(v)(R(u)∧S(v)∧(u[2]=v[1]∨u[3]=v[1])∧t[1]=u[1]∧t[2]=v[2])} (3)域表达式:{xv|(y)(z)(u)(R(xyz)∧S(uv)∧(y=u∨z=u))} 14 2.10 假设R和S都是二元关系,试把元组表达式{t|R(t)∧(u)(S(u)∧ u[1]≠t[2])}转换成等价的: (1)汉语查询句子;(2)域表达式:(3)关系代数表达式。 (1)汉语表达式:选择R关系中元组第2分量值不等于S关系中某元组第1分量值的元组。 (2)域表达式:{xy|(u) (v)(R(xy)∧S(uv)∧(u≠y))} (3)关系代数表达式:π1,2(σ2≠3(R×S)) 2.11 试把域表达式{ab|R(ab)∧R(ba)}转换成等价的: (1)汉语查询句子;(2)关系代数表达式;(3)元组表达式。 (1)汉语查询句子:选择R中元组第1分量值与第2分量值互换后仍存在于R中的元组。 (2)关系代数表达式:π1,2(σ1=4∧2=3(R×R)); (3)元组表达式:{t|(u)(R(t)∧R(u)∧t[1]=u[2]∧t[2]=u[1])} 2.12 设有两个关系R(A,B,C)和S(D,E,F),试把下列关系代数表达式转换成等价的元组表达式: (1)πA(R);(2)σB='17'(R);(3)R×S;(4)πA,F(σC=D(R×S)) (1){t|(u)(R(u)∧t[1]=u[1])} (2){t|R(t)∧t[2]='17')} (3){t|(u)(v)(R(u)∧S(v)∧t[1]=u[1]∧t[2]=u[2]∧t[3]=u[3]∧t[4]=v[1]∧t[5]=v[2]∧t[6]=v[3])} (4){t|(u)(v)((R(u)∧S(v)∧u[3]=v[1]∧t[1]=u[1]∧t[2]=v[3])} 2.13 设有三个关系: S(S#,SNAME,AGE,SEX) SC(S#,C#,GRADE) C(C#,CNAME,TEACHER) 试用关系代数表达式表示下列查询语句。(见下一题) 2.14 试用元组表达式表示上题中各个查询语句。 (1)检索LIU老师所授课程的课程号、课程名。 πC#,CNAME(σTEACHER='LIU'(C)) {t|(u)(C(u)∧C[3]='LIU'∧t[1]=u[1]∧t[2]=u[2])} (2)检索年龄大于23岁的男学生的学号与姓名。 πS#,SNAME(σAGE>'23'∧SEX='男'(S)) 15 {t|(u)(S(u)∧u[3]>'23'∧u[4]='男'∧t[1]=u[1]∧t[2]=u[2])} (3)检索学号为S3学生所学课程的课程名与任课教师名。 πCNAME,TEACHER(σS#='S3'(SCC)) {t|(u)(v)(SC(u)∧C(v)∧u[1]='S3'∧v[1]=u[2]∧t[1]=v[2]∧t[2]=v[3])} (4)检索至少选修LIU老师所授课程中一门课程的女学生的姓名。 πSNAME(σSEX='女'∧TEACHER='LIU'(SSCC)) {t|(u)(v)(w)(S(u)∧SC(v)∧C(w)∧u[4]='女'∧v[1]=u[1]∧v[2]=w[1]∧w[3]='LIU'∧t[1]=u[2])} (5)检索WANG同学不学的课程号。 πC#(C)-πC#(σSNAME='WANG'(SSC)) 或者, πC#(SC)-πC#(σSNAME='WANG'(SSC)) (全部课程号减去WANG同学所学的课程号) {t|(u)(v)(C(u)∧SC(v)∧(u[1]=v[2]=>(w)(s(w)∧w[1]=v[1]∧W[2]≠'wang'))∧t[1]=u[1])} (从C中选择满足条件的元组:SC中的所有元组,如果学号与C中所选元组相同的话,其在S中对应的姓名肯定不是'wang'。) Notice:\的含义是:如果p1为真,则p2为真。 (6)检索至少选修两门课程的学生学号。 πS#(σ1=4∧2≠5(SC×SC)) SC自乘之后,再选择(同一个学号中两个课程号不同的元组),投影。 {t|(u)(v)(SC(u)∧SC(v)∧u[1]=v[1]∧u[2]≠v[2])∧t[1]=u[1]} (7)检索全部学生都选修的课程的课程号与课程名。 πC#,CNAME(C(πS#,C#(SC)?πS#(S))) (涉及到全部值时,应用除法,“除数”是\全部\ {t|(u)(v)(w)(S(u)∧SC(v)∧C(w)∧u[1]=v[1]∧v[2]=w[1]∧t[1]=v[1]∧t[2]=V[2])} (8)检索选修课程包含LIU老师所授课程的学生学号。 πS#(σTEACHER='LIU'(SCC)) {t|(u)(v)(SC(u)∧C(v)∧u[2]=v[1]∧v[3]='LIU'∧t[1]=u[1])} 如果LIU老师有多门课程,则选修课程包含LIU老师所授全部课程的学生学号为: πS#,C#(SC)?πC#(σTEACHER='LIU'(C)) 16 2.15 在教学数据库S、SC、C中,用户有一查询语句:检索女同学选修课程的课程名和任课教师名。(1)试写出该查询的关系代数表达式;(2)试写出查询优化的关系代数表达式。 (1)πCNAME,TEACHER(σSEX='女'(SSCC)) (2)优化为:πCNAME,TEACHER(CπC#(πS#,C#(SC)πS#(σSEX='女'(S)))) (基本思路:尽量提前做选择操作;在每个操作后,应做个投影操作,去掉不用的属性值。 2.16 在2.15题中, (1)画出该查询初始的关系代数表达式的语法树。 (2)使用2.4.4节的优化算法,对语法树进行优化,并画出优化后的语法树。 该查询初始的关系代数表达式的语法树 优化后的语法树 2.17 为什么要对关系代数表达式进行优化? 在关系代数运算中,各个运算所费时间和空间是不一样的。如何安排若干关系的运算操作步骤, 直接影响到整个操作所需要的时间和空间。对关系代数表达式进行优化, 可以提高系统的操作效率,达到执行过程即省时间又省空间的目的。 17 数据库原理之关系数据库SQL语言课后习题及答案 3.1 名词解释 (1)SQL模式:SQL模式是表和授权的静态定义。一个SQL模式定义为基本表的集合。 一个由模式名和模式拥有者的用户名或账号来确定,并包含模式中每一个元素(基本表、视图、索引等)的定义。 (2)SQL数据库:SQL(Structured Query Language),即?结构式查询语言?,采用英语单词表示和结构式的语法规则。 一个SQL数据库是表的汇集,它用一个或多个SQL模式定义。 (3)基本表:在SQL中,把传统的关系模型中的关系模式称为基本表(Base Table)。 基本表是实际存储在数据库中的表,对应一个关系。 (4)存储文件:在SQL中,把传统的关系模型中的存储模式称为存储文件(Stored File)。 每个存储文件与外部存储器上一个物理文件对应。 (5)视图:在SQL中,把传统的关系模型中的子模式称为视图(View),视图是从若干基本表和(或)其他视图构造出来的表。 (6)行:在SQL中,把传统的关系模型中的元组称为行(row)。 (7)列:在SQL中,把传统的关系模型中的属性称为列(coloumn)。 (8)实表:基本表被称为“实表”,它是实际存放在数据库中的表。 (9)虚表:视图被称为“虚表”,创建一个视图时,只把视图的定义存储在数据词典中,而不存储视图所对应的数据。 (10)相关子查询:在嵌套查询中出现的符合以下特征的子查询:子查询中查询条件依赖于外层查询中的某个值, 所以子查询的处理不只一次,要反复求值,以供外层查询使用。 (11)联接查询:查询时先对表进行笛卡尔积操作,然后再做等值联接、选择、投影等操作。 联接查询的效率比嵌套查询低。 (12)交互式SQL:在终端交互方式下使用的SQL语言称为交互式SQL。 (13)嵌入式SQL:嵌入在高级语言的程序中使用的SQL语言称为嵌入式SQL。 (14)共享变量:SQL和宿主语言的接口。共享变量有宿主语言程序定义,再用SQL的DECLARE语句说明, SQL语句就可引用这些变量传递数据库信息。 18 (15)游标:游标是与某一查询结果相联系的符号名,用于把集合操作转换成单记录处理方式。 (16)卷游标:为了克服游标在推进时不能返回的不便,SQL2提供了卷游标技术。 卷游标在推进时不但能沿查询结果中元组顺序从头到尾一行行推进,也能一行行返回。 3.2 对于教学数据库的三个基本表 学生 S(S#,SNAME,AGE,SEX) 学习 SC(S#,C#,GRADE) 课程 C(C#,CNAME,TEACHER) 试用SQL的查询语句表达下列查询: (1)检索LIU老师所授课程的课程号和课程名。 SELECT C#,CNAME FROM C WHERE TEACHER=?LIU? (2)检索年龄大于23岁的男学生的学号和姓名。 SELECT S#,SNAME FROM S WHERE (AGE>23) AND (SEX=?M?) (3)检索至少选修LIU老师所授课程中一门课程的女学生姓名。 SELECT SNAME FROM S WHERE SEX=?F? AND S# IN (SELECT S# FROM SC WHERE C# IN (SELECT C# 19 FROM C WHERE TEACHER=?LIU?) NOTICE:有多种写法,比如联接查询写法: SELECT SNAME FROM S,SC,C WHERE SEX=?F? AND SC.S#=S.S# AND SC.C#=C.C# AND TEACHER='LIU' 但上一种写法更好一些。 (4)检索WANG同学不学的课程的课程号。 SELECT C# FROM C WHERE C# NOT IN (SELECT C# FROM SC WHERE S# IN (SELECT S# FROM S WHERE SNAME='WANG')) (5)检索至少选修两门课程的学生学号。 SELECT DISTINCT X.SNO FROM SC X,SC Y WHERE X.SNO=Y.SNO AND X.CNO<>Y.CNO Notice:对表SC进行自连接,X,Y是SC的两个别名。 (6)检索全部学生都选修的课程的课程号与课程名。 SELECT C#,CNAME FROM C WHERE NOT EXISTS (SELECT * FROM S WHERE S# NOT IN (SELECT * FROM SC 20 PRIMARY KEY(J#,P#), FOREIGN KEY(J#) REFERENCE PROJECT(J#), FOREIGN KEY(P#) REFERENCE PART(P#)) CREATE TABLE P_S (P# CHAR(4),S# CHAR(4),QUANTITY INTEGER, PRIMARY KEY(P#,S#), FOREIGN KEY(P#) REFERENCE PART(P#), FOREIGN KEY(S#) REFERENCE SUPLIER(S#)) (2)试将PROGECT、P_P、PART三个基本表的自然联接定义为一个视图VIEW1,PART、P_S、SUPPLIER 三个基本表的自然联接定义为一个视图VIEW2。 CREATE VIEW VIEW1(J#,JNAME,DATE,P#,PNAME,COLOR,WEIGHT,TOTAL) AS SELECT PROJECT.J#,JNAME,DATE,PART.P#,PNAME,COLOR,WEIGHT,TOTAL FROM PROJECT,PART,P_P WHERE PART.P#=P_P.P# AND P_P.J#=PROJECT.J# CREATE VIEW VIEW2(P#,PNAME,COLOR,WEIGHT,S#,SNAME,SADDR,QUANTITY) AS SELECT PART.P#,PNAME,COLOR,WEIGHT,SUPPLIER.S#,SNAME,SADDR,QUANTITY FROM PART,P_S,SUPPLIER WHERE PART.P#=P_S.P# AND P_S.S#=SUPPLIER.S# (3)试在上述两个视图的基础上进行数据查询: 1)检索上海的供应商所供应的零件的编号和名字。 SELECT P#,PNAME FROM VIEW2 WHERE SADDR='SHANGHAI' 2)检索项目J4所用零件的供应商编号和名字。 SELECT S#,SNAME FROM VIEW2 WHERE P# IN(SELECT P# FROM VIEW1 WHERE J#='J4') 3.9 对于教学数据库中基本表SC,已建立下列视图: CREATE VIEW S_GRADE(S#,C_NUM,AVG_GRADE) AS SELECT S#,COUNT(C#),AVG(GRADE) 26 FROM SC GROUP BY S# 试判断下列查询和更新是否允许执行。若允许,写出转换到基本表SC上的相应操作。 (1) SELECT * FROM S_GRADE 允许 SELECT S#,COUNT(C#),AVG(GRADE) FROM SC GROUP BY S# (2) SELECT S#,C_NUM FROM S_GRADE WHERE AVG_GRADE>80 允许 SELECT S#,COUNT(C#) FROM SC WHERE AVG(GRADE)>80 (3) SELECT S#,AVG_GRADE FROM S_GRADE WHERE C_NUM>(SELECT C_NUM FROM S_GRADE WHERE S#=?S4?) 允许 SELECT S#,AVG(GRADE) FROM SC AS X WHERE COUNT(X.C#)>(SELECT COUNT(Y.C#) FROM SC AS Y WHERE Y.S#='S4') GROUP BY S# (4) UPDATE S_GRADE SET C_NUM=C_NUM+1 WHERE S#=?S4? 不允许 (5) DELETE FROM S_GRADE WHERE C_NUM>4 不允许 3.10 预处理方式对于嵌入式SQL的实现有什么重要意义? 27 预处理方式是先用预处理程序对源程序进行扫描,识别出SQL语句,并处理成宿主语言的函数调用形式; 然后再用宿主语言的编译程序把源程序编译成目标程序。这样,不用扩充宿主语言的编译程序, 就能处理SQL语句。 3.11 在宿主语言的程序中使用SQL语句有哪些规定? 在宿主语言的程序中使用SLQ语句有以下规定: (1)在程序中要区分SQL语句与宿主语言语句 (2)允许嵌入的SQL语句引用宿主语言的程序变量(称为共享变量),但有两条规定: 1)引用时,这些变量前必须加“:”作为前缀标识,以示与数据库中变量有区别。 2)这些变量由宿主语言的程序定义,并用SQL的DECLARE语句说明。 (3)SQL的集合处理方式与宿主语言单记录处理方式之间要协调。 需要采用游标机制,把集合操作转换成单记录处理方式。 3.12 SQL的集合处理方式与宿主语言单记录处理方式之间如何协调? 由于SQL语句处理的是记录集合,而宿主语言语句一次只能处理一个记录, 因此需要用游标(cousor)机制,把集合操作转换成单记录处理方式。 2.13 嵌入式SQL语句何时不必涉及到游标?何时必须涉及到游标? (1)INSERT、DELETE、UPDATE语句,查询结果肯定是单元组时的SELECT语句, 都可直接嵌入在主程序中使用,不必涉及到游标。 (2)当SELECT语句查询结果是多个元组时,此时宿主语言程序无法使用, 一定要用游标机制把多个元组一次一个地传送给宿主语言处理。 数据库原理之关系数据库的模式设计课后习题及答案 4.1 名词解释 (1) 函数依赖:FD(function dependency),设有关系模式R(U),X,Y是U的子集, r是R的任一具体关系,如果对r的任意两个元组t1,t2,由t1[X]=t2[X]导致t1[Y]=t2[Y], 则称X函数决定Y,或Y函数依赖于X,记为X→Y。X→Y为模式R的一个函数依赖。 (2) 函数依赖的逻辑蕴涵:设F是关系模式R的一个函数依赖集,X,Y是R的属性子集, 如果从F中的函数依赖能够推出X→Y,则称F逻辑蕴涵X→Y,记为F|=X→Y。 (3) 部分函数依赖:即局部依赖,对于一个函数依赖W→A,如果存在XW(X包含于W)有X→A成立, 那么称W→A是局部依赖,否则称W→A为完全依赖。 (4) 完全函数依赖:见上。 (5) 传递依赖:在关系模式中,如果Y→X,X→A,且X(A不属于X),那么称Y→A是传递依赖。 (6) 函数依赖集F的闭包F+: 被逻辑蕴涵的函数依赖的全体构成的集合,称为F的闭包(closure),记为F+。 28 Y(X不决定Y), AX (7) 1NF:第一范式。如果关系模式R的所有属性的值域中每一个值都是不可再分解的值, 则称R是属于第一范式模式。如果某个数据库模式都是第一范式的,则称该数据库存模式属于第一范式的数据库模式。 第一范式的模式要求属性值不可再分裂成更小部分,即属性项不能是属性组合和组属性组成。 (8) 2NF:第二范式。如果关系模式R为第一范式,并且R中每一个非主属性完全函数依赖于R的某个候选键, 则称是第二范式模式;如果某个数据库模式中每个关系模式都是第二范式的,则称该数据库模式属于第二范式的数据库模式。 (注:如果A是关系模式R的候选键的一个属性,则称A是R的主属性,否则称A是R的非主属性。) (9) 3NF:第三范式。如果关系模式R是第二范式,且每个非主属性都不传递依赖于R的候选键, 则称R是第三范式的模式。如果某个数据库模式中的每个关系模式都是第三范式,则称为3NF的数据库模式。 (10) BCNF:BC范式。如果关系模式R是第一范式,且每个属性都不传递依赖于R的候选键,那么称R是BCNF的模式。 (11) 4NF:第四范式。设R是一个关系模式,D是R上的多值依赖集合。如果D中成立非平凡多值依赖X→→Y时, X必是R的超键,那么称R是第四范式的模式。 (12) 推理规则的正确性和完备性:正确性是指,如果X→Y是从推理规则推出的,那么X→Y在F+中。 完备性是指,不能从F使用推理规则导出的函数依赖不在F+中。 (13) 依赖集的覆盖和等价:关系模式R(U)上的两个函数依赖集F和G,如果满足F+=G+,则称F和G是等价的。 如果F和G等价,则可称F覆盖G或G覆盖F。 (14) 最小依赖集:如果函数集合F满足以下三个条件:(1)F中每个函数依赖的右部都是单属性; (2)F中的任一函数依赖X→A,其F-{X→A}与F是不等价的;(3)F中的任一函数依赖X→A,Z为X的子集,(F-{X→A})∪{Z→A}与F不等价。则称F为最小函数依赖集合,记为Fmin。 (15) 无损联接:设R是一关系模式,分解成关系模式ρ={R1,R2...,Rk},F是R上的一个函数依赖集。 如果对R中满足F的每一个关系r都有r=πR1(r)πR2(r)...πRk(r)则称这个分解相对于F是\无损联接分解\。 (16) 保持依赖集:所谓保持依赖就是指关系模式的函数依赖集在分解后仍在数据库中保持不变, 即关系模式R到ρ={R1,R2,...,Rk}的分解,使函数依赖集F被F这些Ri上的投影蕴涵。 (17) 多值依赖:设R(U)是属性集U上的一个关系模式,X,Y,Z是U的子集,并且Z=U-X-Y, 用x,y,z分别代表属性集X,Y,Z的值,只要r是R的关系,r中存在元组(x,y1,z1)和(x,y2,z2)时, 就也存在元组(x,y1,z2)和(x,y2,z1),那么称多值依赖(MultiValued Dependency MVD) X→→Y在关系模式R中成立。 4.2 关系模式R有n个属性,在模式R上可能成立的函数依赖有多少个? 其中平凡的函数依赖有多少个?非平凡的函数依赖有多少个? (要考虑所有可能的情况,数学排列组合问题。对于数据库本身而言,本题没多大意义) 所有属性相互依赖时,函数依赖最多。 29 ? 平凡的函数依赖:对于函数依赖X→Y,如果YX,那么称X→Y是一个“平凡的函数依赖”。 4.3 建立关于系、学生、班级、社团等信息的一个关系数据库, 一个系有若干个专业,每个专业每年只招一个班,每个班有若干个学生,一个系的学生住在同一宿舍区, 每个学生可以参加若干个社团,每个社团有若干学生。 描述学生的属性有:学号、姓名、出生年月、系名、班级号、宿舍区。 描述班级的属性有:班级号、专业名、系名、人数、入校年份。 描述系的属性有:系名、系号、系办公地点、人数。 描述社团的属性有:社团名、成立年份、地点、人数、学生参加某社团的年份。 请给出关系模式,写出每个关系模式的最小函数依赖集,指出是否存在传递函数依赖, 对于函数依赖左部是多属性的情况,讨论函数依赖是完全函数依赖还是部分函数依赖。 指出各关系的候选键、外部键,有没有全键存在? 各关系模式如下: 学生(学号,姓名,出生年月,系名,班级号,宿舍区) 班级(班级号,专业名,系名,人数,入校年份) 系(系名,系号,系办公地点,人数) 社团(社团名,成立年份,地点,人数) 加入社团(社团名,学号,学生参加社团的年份) 学生(学号,姓名,出生年月,系名,班级号,宿舍区) ●“学生”关系的最小函数依赖集为: Fmin={学号→姓名,学号→班级号,学号→出生年月,学号→系名,系名→宿舍区} ●以上关系模式中存在传递函数依赖,如:学号→系名,系名→宿舍区 ●候选键是学号,外部键是班级号,系名。 notice: 在关系模式中,如果Y→X,X→A,且X么称Y→A是传递依赖。 班级(班级号,专业名,系名,人数,入校年份) ●“班级”关系的最小函数依赖集为: Y(X不决定Y), A不属于X,那 30 Fmin={(系名,专业名)→班级号,班级号→人数,班级号→入校年份,班级号→系名,班级号→专业名} (假设没有相同的系,不同系中专业名可以相同) ●以上关系模式中不存在传递函数依赖。 ●“(系名,专业名)→班级号”是完全函数依赖。 ●候选键是(系名,专业名),班级号,外部键是系名。 系(系名,系号,系办公地点,人数) ●“系”关系的最小函数依赖集为: Fmin={系号→系名,系名→系办公地点,系名→人数,系名→系号} ●以上关系模式中不存在传递函数依赖 ●候选键是系名,系号 社团(社团名,成立年份,地点,人数) ●“社团”关系的最小函数依赖集为: Fmin={社团名→成立年份,社团名→地点,社团名→人数) ●以上关系模式中不存在传递函数依赖。 ●候选键是社团名 加入社团(社团名,学号,学生参加社团的年份) ●“加入社团”关系的最小函数依赖集为: Fmin={(社团名,学号)→学生参加社团的年份) ●“(社团名,学号)→学生参加社团的年份”是完全函数依赖。 ●以上关系模式中不存在传递函数依赖。 ●候选键是(社团名,学号)。 4.4 对函数依赖X→Y的定义加以扩充,X和Y可以为空属性集,用φ表示, 那么X→φ,φ→Y,φ→φ的含义是什么? 根据函数依赖的定义,以上三个表达式的含义为: 31 (1)一个关系模式R(U)中,X,Y是U的子集,r是R的任一具体关系,如果对r的任意两个元组t1,t2, 由t1[X]=t2[X]必有t1[φ]=t2[φ]。即X→φ表示空属性函数依赖于X。这是任何关系中都存在的。 (2)φ→Y表示Y函数依赖于空属性。由此可知该关系中所有元组中Y属性的值均相同。 (3)φ→φ表示空属性函数依赖于空属性。这也是任何关系中都存在的。 4.5 已知关系模式R(ABC),F={A→C,B→C},求F+。 可以直接通过自反律、增广律、传递律加以推广: F+={φ→φ,A→φ,B→φ,C→φ,A→C,B→C,AB→φ,AB→A,AB→B,AB→C,AB→BC,AB→AB,AB→ABC,BC→φ,BC→C,BC→B,BC→BC,AC→φ,AC→C,AC→A,AC→AC,ABC→φ,ABC→A,ABC→B,ABC→C,ABC→BC,ABC→AB,ABC→ABC} 4.6 试分析下列分解是否具有无损联接和保持函数依赖的特点: (1)设R(ABC),F1={A→B} 在R上成立,ρ1={AB,AC}。 首先,检查是否具有无损联接特点: 第1种解法--算法4.2: AB AC A a1 a1 B a2 b22 C b13 a3 A a1 a1 B a2 a2 C b13 a3 (1) 构造表 (2)根据A→B进行处理 结果第二行全是a行,因此分解是无损联接分解。 第2种解法:(定理4.8) 设 R1=AB,R2=AC 32 R1∩R2=A R2- R1=B ∵A→B,∴该分解是无损联接分解。 然后,检查分解是否保持函数依赖 πR1(F1)={A→B,以及按自反率推出的一些函数依赖} πR2(F1)={按自反率推出的一些函数依赖} F1被πR1(F1)所蕴涵,∴所以该分解保持函数依赖。 (2)设R(ABC),F2={A→C,B→C}在R上成立,ρ2={AB,AC} 首先,检查是否具有无损联接特点: 第1种解法(略) 第2种解法:(定理4.8) 设 R1=AB,R2=AC R1∩R2=A R2- R1=C ∵A→C,∴该分解是无损联接分解。 33 然后,检查分解是否保持函数依赖 πR1(F2)={按自反率推出的一些函数依赖} πR2(F2)={A→C,以及按自反率推出的一些函数依赖} ∵F1中的B→C没有被蕴涵,所以该分解没有保持函数依赖。 (3)设R(ABC),F3={A→B},在R上成立,ρ3={AB,BC}. 首先,检查是否具有无损联接特点: 第1种解法: AB BC A a1 b21 B a2 a2 C b13 a3 A a1 a1 B a2 b22 C a3 a3 (1) 构造表 (2)根据A→B进行处理 没有一行全是a行。因此这个分解不具有无损联接特性。 第2种解法:(定理4.8) 设 R1=AB,R2=BC R1∩R2=B 34 R2- R1=C,R1- R2=A ∵B→C,B→A不在F3中 ∴该分解不具有无损联接特性。 然后,检查分解是否保持函数依赖 πR1(F3)={A→B,以及按自反率推出的一些函数依赖} πR2(F3)={按自反率推出的一些函数依赖} F1被πR1(F3)所蕴涵,所以该分解保持函数依赖。 (4)设R(ABC),F4={A→B,B→C}在R上成立,ρ4={AC,BC} 首先,检查是否具有无损联接特点: 第1种解法(略) 第2种解法:(定理4.8) 设 R1=AC,R2=BC R1(AC)∩R2(BC)=C R2- R1=B,R1- R2=A ∵C→B,C→A不在F4中 ∴该分解不具有无损联接特性。 35 然后,检查分解是否保持函数依赖 πR1(F2)={按自反率推出的一些函数依赖} πR2(F2)={B→C,以及按自反率推出的一些函数依赖} ∵F1中的A→B没有被蕴涵,所以该分解没有保持函数依赖。 4.7 设R=ABCD,R上的函数依赖集F={A→B,B→C,A→D,D→C},R的一个分解ρ={AB,AC,AD},求:(1)F在ρ的每个模式上的投影。(2)ρ相对于F是无损联接分解吗?(3)ρ保持依赖吗? (1) πAB(F)={A→B,及按自反律所推导出的一些平凡函数依赖} πAC(F)={A→C,及按自反律所推导出的一些平凡函数依赖} πAD(F)={A→D,及按自反律所推导出的一些平凡函数依赖} (2) AB AC AD A a1 a1 a1 B a2 b22 b32 C b13 a3 b33 D b14 b24 a4 A a1 a1 a1 B a2 a2 a2 C a3 a3 a3 D a4 a4 a4 (1) 构造表 (2)根据A→B,B→C,A→D,D→C进行处理 36 每一行都是a,ρ相对于F是无损联接分解。 (3)πAB(F)∪πAC(F)∪πAD(F)={A→B,A→C,A→D}, 没有满足B→C,D→C函数依赖, 因此ρ相对于F的这个分解不保持函数依赖。 4.8 设R=ABCD,R上的F={A→C,D→C,BD→A}, 试证明ρ={AB,ACD,BCD}相对于F不是无损联接分解。 根据算法4.2 AB ACD BCD A a1 a1 b31 B a2 b22 a2 C b13 a3 a3 D b14 a4 a4 A a1 a1 b31 B a2 b22 a2 C a3 a3 a3 D b14 a4 a4 (1) 构造表 (2)根据A→C,D→C,BD→A进行处理 没有一行都是a,所以,ρ相对于F不是无损联接分解。 4.9 设R=ABCD,R上的F={A→B,B→C,D→B},把R分解成BCNF模式集。 37 (1)若首先把R分解成{ACD,BD},试求F在这两个模式上的投影。 (2)ACD和BD是BCNF吗?如果不是,请进一步分解。 (1)πACD(F)={A→C} πBD(F)={D→B} (2)因为根据BCNF的定义,要求关系模式是第一范式,且每个属性都不传递依赖于R的侯选键。 BCD中(A,D)为候选键,可是(A,D)→A, A→C,所以它不是BCNF模式。 它可进一步分解为:{AC,DC},此时AC,DC均为BCNF模式。 BD是BCNF,因为R2(BD)是第一范式,且每个属性都不传递依赖于D(候选键),所以它是BCNF模式。 4.10 设R=ABCD,ρ={AB,BC,CD}。F1={A→B,B→C};F2={B→C,C→D}; (1)如果F1是R上的函数依赖集,此时ρ是无损联接分解吗?若不是,试举出反例。 (2)如果F2是R上的函数依赖集呢? (1)不是无损联接。可由算法4.2判断或由定理4.8判断。 根据算法4.2 38 AB BC CD A a1 b21 b31 B a2 a2 b32 C b13 a3 a3 D b14 b24 a4 A a1 b21 b31 B a2 a2 b32 C a3 a3 a3 D b14 b24 a4 (1) 构造表 (2)根据A→B,B→C进行处理 结果没有出现一行全a的情况,所以它不是无损联接。举例如下: 设模式R的一关系r为{(a1b1c1d1),(a2b2c1d2)} 则有:r1=πAB(r)={(a1b1),(a2b2)} r2=πBC(r)={(b1c1),(b2c1)} r3=πCD(r)={(c1d1),(c1d2)} 令a=r1r2r3={ (a1b1c1d1),(a1b1c1d2),(a2b2c1d1),(a2b2c1d2)} r≠a,所以ρ不是无损联接。 (2)如果F2是R上的函数依赖,则可以判断,ρ是无损联接。判断过程同上。 4.11 设关系模式R(S#,C#,GRADE,TNAME,TADDR),其属性分别表示学生学号、 选修课程的编号,成绩、任课教师地址等意义。如果规定,每个学生每学一门课只有一个成绩; 每门课只有一个教师任教;每个教师只有一个地址(此处不允许教师同名同姓)。 (1)试写出关系模式R基本的函数依赖和候选键。 39 (2)试把R分解成2NF模式集并说明理由。 (3)试把R分解成3NF模式集,并说明理由。 (1)F={(S#,C#)→GRADE,C#→TNAME,TNAME→TADDR} 侯选键是(S#,C#)。 (2)在模式R中,TNAME不完全依赖于键(S#,C#),因此需进行分解,可分解为下列两个关系。 SC={S#,C#,GRADE} C={C#,TNAME,TADDR} 分解后,SC中,GRADE完全依赖于侯选键(S#,C#),在C中,主属性是C#,TNAME、TADDR均完全依赖于C#。 因此,该分解符合2NF模式。 (3)3NF:若每个关系模式是2NF,则每个非主属性都不传递于R的候选键。 按上述已分好的两个模式,SC中已满足“每个非主属性都不传递于R的候选键”,已是3NF,而在C中, C#→TNAME,TNAME→TADDR,TADDR传递依赖于C#,因此还需分成两个模式:CT(C#,TNAME), T(TNAME,TADD)。 分解后,总共有SC={S#,C#,GRADE},CT(C#,TNAME), T(TNAME,TADD)三个模式。 该分解符合3NF模式。 4.12 图4.6表示一个公司各部门的层次结构,对每个部门,数据库中包含部门号 (唯一的)D#,预算费(BUDGET)以及此部门领导人员的职工号(唯一的)E#等信息。 对每一个部门,还存有部门的全部职工,生产科研项目以及办公室的信息。 40 5.11 概念设计的具体步骤是什么? 概念设计的主要步骤为: (1)进行数据抽象、设计局部概念模式; (2)将局部概念模式综合成全局概念模式; (3)评审。 (具体解释参见教材p131) 5.12 什么是数据抽象?主要有哪两种形式的抽象?数据抽象在数据库设计过程中起什么作用? 数据抽象是对人、物、事或概念的人为处理,它抽取人们关心的共同特性,忽略非本质的细节, 并把这些特性用各种概念精确地加以描述,这些概念组成了某种模型。 数据抽象有两种形式: (1)系统状态的抽象,即抽象对象; (2)系统转换的抽象,即抽象运算。 数据抽象是概念设计中非常重要的一步。 通过数据抽象,可以将现实世界中的客观对象首先抽象为不依赖任何具体机器的信息结构。 5.13 什么是ER图?构成ER图的基本要素是什么? ER图是用来表示数据库概念设计ER模型的工具,它提供了表示实体、属性和联系的方法。 构成ER图的基本要素是实体、属性和联系。 5.14 试述采用ER方法的数据库概念设计的过程. 利用ER方法进行数据库的概念设计,可分成三步进行: 首先设计局部ER模式,然后把各局部ER模式综合成一个全局ER模式, 最后对全局ER模式进行优化,得到最终的ER模式,即概念模式。 5.15 逻辑设计的目的是什么?试述逻辑设计过程的输入和输出环境。 46 逻辑设计的目的是把概念设计阶段设计好的基本ER图转换为与选用的具体机器上的DBMS所支持的数据模型相符合的逻辑结构(包括数据库模式和外模式)。 逻辑设计过程中的输入信息有: (1)独立于DBMS的概念模式,即概念设计阶段产生的所有局部和全局概念模式; (2)处理需求,即需求分析阶段产生的业务活动分析结果; (3)约束条件,即完整性、一致性、安全性要求及响应时间要求等; (4)DBMS特性,即特定的DBMS特性,即特定的DBMS所支持的模式、子模式和程序语法的形式规则。 逻辑设计过程输出的信息有: (1)DBMS可处理的模式; (2)子模式; (3)应用程序设计指南; (4)物理设计指南。 5.16 试述逻辑设计阶段的主要内容。 逻辑设计主要是把概念模式转换成DBMS能处理的模式。 转换过程中要对模式进行评价和性能测试,以便获得较好的模式设计。 逻辑设计的主要步骤包括: (1)初始模式的形成 (2)子模式设计 (3)应用程序设计梗概 (4)模式评价 (5)修正模式。 5.17 规范化理论对数据库设计有什么指导意义? 在概念设计阶段,已经把关系规范化的某些思想用作构造实体类型和联系类型的标准, 在逻辑设计阶段,仍然要使用关系规范化的理论来设计模式和评价模式。 规范化的目的是减少乃至消除关系模式中存在的各种异常,改善完整性,一致性和存储效率。 5.18 什么是数据库结构的物理设计?试述其具体步骤。 数据库结构的物理设计是指对一个给定的逻辑数据模型选取一个最适合应用环境的物理结构的过程, 所谓数据库的物理结构主要指数据库在物理设备上的存储结构和存取方法。 47 物理设计的步骤为: (1)设计存储记录结构,包括记录的组成、数据项的类型和长度,以及逻辑记录到存储记录的映射; (2)确定数据存储安排; (3)设计访问方法,为存储在物理设备上的数据提供存储和检索的能力; (4)进行完整性和安全性的分析、设计; (5)程序设计。 5.19 数据实现阶段主要做哪几件事情? 数据库实现阶段的主要工作有以下几点: (1)建立实际数据库结构 (2)试运行 (3)装入数据 (具体解释参见教材p150) 5.20 什么是数据的再组织设计?试述其重要性。 对数据的概念模式、逻辑结构或物理结构的改变称作数据再组织。 数据再组织,通常是由于环境,需求的变化或性能原因而进行的,如信息定义的改变, 增加新的数据类型,对原有的数据提出了新的使用要求, 改用具有不同物理特征的新存储设备以及数据库性能下降等都要求进行数据库的重新组织。 5.21 数据系统投入运行后,有哪些维护工作? 数据系统投入运行后,主要维护工作有: (1)维护数据库的安全性与完整性控制及系统的转储和恢复; (2)性能的监督、分析与改进; (3)增加新功能; (4)发现错误,修改错误。 数据库原理之数据库保护课后习题及答案 6.1 名词解释 (1)事务:事务是指一个操作序列,这些操作要么什么都做,要么都不做,是一个不可分割的工作单位, 是数据库环境中的逻辑工作单位,相当于操作系统环境下的\进程\概念。 (2)封锁:封锁就是事务可以向系统发出请求,对某个数据对象加锁,此事务对这个数据对象有一定控制, 而其他事务则不能更新数据直到事务释放它的锁为止。 48 (3)X封锁:如果事务T对数据R实现X封锁,那么其他的事务要等T解除X封锁以后,才能对这个数据进行封锁。 只有获准X封锁的事务,才能对被封锁的数据进行修改。 (4)PX协议:X封锁的规则称为PX协议,其内容为:任何企图更新记录R的事务必须先执行LOCK X(R)操作, 以获得对该记录进行寻址的能力,并对它取得X封锁。如果未获得X封锁,那么这个事务进入等待状态, 一直到获准X封锁,事务继续进行。 (5)PXC协议:它由PX协议及一条规则\封锁必须保留到事务终点(COMMIT或ROLLBACK)\组成。 (6)死锁:有两个或以上的事务处于等待状态,每个事务都在等待另一个事务解除封锁, 它才能继续执行下去,结果任何一个事务都无法执行,这种现象就是死锁。 (7)串行调度:多个事务依次执行,称为串行调度。 (8)并发调度:利用分时的方法,同时处理多个事务,称为事务的并发调度。 (9)可串行化调度:如果某事务集的一个并发调度的结果与某个串行调度等价, 则称此并发调度是是可串行化调度。 (10)不可串行化调度:某事务集的一个并发调度结果,如果与任一串行调度均不等价,则该并发调度是不可串行化调度。 (11)S封锁:共享型封锁。果事务T对某数据R加上S封锁,那么其它事务对数据R的X封锁便不能成功, 而对数据R的S封锁请求可以成功。这就保证了其他事务可以读取R但不能修改R,直到事务T释放S封锁。 (12)PS协议:任何要更新记录R的事务必须先执行LOCK S(R)操作,以获得对该记录寻址的能力并对它取得S封锁。 如果未获准S封锁,那么这个事务进入等待状态,一直到获准S封锁,事务才继续进行下去。 当事务获准对记录R的S封锁后,在记录R修改前必须把S封锁升级为X封锁。 (13)PSC协议:由PS协议和“将S封锁保持到事务终点”组成。 任何更新记录R的事务必须先执行LOCK S(R)操作,以获得对该记录寻址的能力并对它取得S封锁。 如果未获准S封锁,那么这个事务进入等待状态,一直到获准S封锁,事务才继续进行下去。并将S封锁保持到事务终点。 (14)两段封锁协议:(1)在对任何数据进行读写操作之前,事务首先要获得对该数据的封锁; (2)在释放一个封锁之后,事务不再获得任何其他封锁。 49 6.2 试叙事务的四个性质,并解释每一个性质对DBS有什么益处? 事务的四个性质是:原子性、一致性、隔离性和持久性。 (1)原子性(具体含义见教材):事务中所有操作应视为整体,不可分割。 (2)一致性(具体含义见教材):一个事务独立执行的结果将保证数据库的一致性,即数据不会因事务的执行而遭受破坏。 (3)隔离性(具体含义见教材):隔离性要求在并发事务被执行时,系统应保证与这些事务先后单独执行时结果一样, 使事务如同在单用户环境下执行一样。 (4)持久性(具体含义见教材):要求事务对数据库的所有更新应永久地反映在数据库中。 6.3 事务的COMMIT操作和ROLLBACK操作各做些什么事情? COMMIT操作表示事务成功地结束(提交),此时告诉系统,数据库要进入一个新的正确状态, 该事务对数据库的所有更新都已交付实施。 ROLLBACK操作表示事务不成功地结束,此时告诉系统,已发生错误,数据库可能处在不正确的状态, 该事务对数据库的更新必须被撤销,数据库应恢复该事务到初始状态。 6.4 UNDO操作和REDO操作各做些什么事情? UNDO操作是反向扫描\日志\文件,撤销对数据库的更新操作,使数据库恢复到更新前的状态; REDO操作正向扫描日志文件,重新做一次更新,使数据库恢复到更新后的状态。 6.5 DBS中有哪些类型的故障?哪些故障破坏了数据库? 哪些故障未破坏数据库,但其中某些数据变得不正确? 数据库系统故障有事务故障、系统故障、介质故障。 其中介质故障破坏数据库,事务故障、系统故障未破坏数据库但使其中某些数据变得不正确。 6.6 什么是“运行记录优先原则”?其作用是什么? 50 百度搜索“70edu”或“70教育网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,70教育网,提供经典综合文库自学考试数据库系统原理(丁宝康主编,经济科学出版社)课后习题答在线全文阅读。
相关推荐: