《数据库系统概论》(王珊 萨师煊)复习笔记(三)

第三章 关系数据库标准语言SQL

1 SQL概述

  1. QL(Structured Query Language):结构化查询语言,是关系数据库的标准语言,SQL是一个通用的、功能极强的关系数据库语言

  2. 特点

    (1)综合统一

    • 集数据定义语言(DDL),数据操纵语言(DML),数据控制语(DCL)功能于一体。
    • 可以独立完成数据库生命周期中的全部活动:
      • 定义关系模式,插入数据,建立数据库;
      • 对数据库中的数据进行查询和更新;
      • 数据库重构和维护
      • 数据库安全性、完整性控制等
    • 用户数据库投入运行后,可根据需要随时逐步修改模式,不影响数据的运行。
    • 数据操作符统一

    (2)高度非过程化

    • 非关系数据模型的数据操纵语言“面向过程”,必须指定存取路径
    • SQL只要提出“做什么”,无须了解存取路径。
    • 存取路径的选择以及SQL的操作过程由系统自动完成。

    (3)面向集合的操作方式

    • 非关系数据模型采用面向记录的操作方式,操作对象是一条记录
    • SQL采用集合操作方式
      • 操作对象、查找结果可以是元组的集合
      • 一次插入、删除、更新操作的对象可以是元组的集合

    (4)多种使用方式

    • 交互式SQL
      • 一般DBMS都提供联机交互工具
      • 用户可直接键入SQL命令对数据库进行操作
      • 由DBMS来进行解释
    • 嵌入式SQL
      • 能将SQL语句嵌入到高级语言(宿主语言)
      • 使应用程序充分利用SQL访问数据库的能力、宿主语言的过程处理能力
      • 一般需要预编译,将嵌入的SQL语句转化为宿主语言编译器能处理的语句
  3. SQL的功能

    • 数据定义(DDL)

      • 定义、删除、修改基本表(Base Table)
      • 定义、删除视图(View)
      • 定义、删除索引(Index)
    • 数据操纵(DML)

      • 数据查询
      • 数据增、删、改
    • 数据控制(DCL)

      • 用户访问权限的授予、收回
  4. SQL数据库的体系结构

  5. 基本表

    • 本身独立存在的表
    • SQL中一个关系就对应一个基本表
    • 一个(或多个)基本表对应一个存储文件
    • 一个表可以带若干索引
  6. 存储文件

    • 逻辑结构组成了关系数据库的内模式
    • 物理结构是任意的,对用户透明
  7. 视图

    • 从一个或几个基本表导出的表
    • 数据库中只存放视图的定义而不存放视图对应的数据
    • 视图是一个虚表
    • 用户可以在视图上再定义视图

2 数据查询

  1. SQL查询表达式的基本结构

    select 属性名表
    from 关系名表
    where (条件表达式)

  2. 语句结构

    SELECT [ALL|DISTINCT] <目标列表达式> [,<目标列表达式>] …
    FROM <表名或视图名>[, <表名或视图名> ] …
    [ WHERE <条件表达式> ]
    [ GROUP BY <列名1> [ HAVING <条件表达式> ] ]
    [ ORDER BY <列名2> [ ASC|DESC ] ];

  3. 单表查询

    示例:

    • 学生-课程模式 S-T :
      学生表:Student(Sno,Sname,Ssex,Sage,Sdept)
      课程表:Course(Cno,Cname,Cpno,Ccredit)
      学生选课表:SC(Sno,Cno,Grade)

    (1) 选择表中的若干列

    1
    2
    3
    4
    5
    6
    SELECT Sno,Sname FROM Student; 
    SELECT * FROM Student;
    //SELECT子句的<目标列表达式>可以为:算术表达式、字符串、常量函数、列别名
    SELECT Sname,2009-Sage FROM Student;
    SELECT Sname,LOWER(Sdept) FROM Student;//小写字母表示所有系名
    SELECT Sname NAMELOWER(Sdept) DEPARTMENT FROM Student;

    (2) 选择表中的若干元组

    • 消除取值重复的行,如果没有指定DISTINCT关键词,则缺省为ALL
    • 指定DISTINCT关键词,去掉表中重复的行
    1
    2
    SELECT Sno   FROM SC;//等价于:SELECT ALL  Sno  FROM SC;
    SELECT DISTINCT Sno FROM SC;
    • 查询满足条件的元组
    • 常用的查询条件

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    //查询计算机科学系全体学生的名单。
    SELECT Sname
    FROM Student
    WHERE Sdept=‘CS’;

    //查询年龄在20~23岁(包括20岁和23岁)之间的学生的姓名、系别和年龄
    SELECT Sname,Sdept,Sage
    FROM Student
    WHERE Sage BETWEEN 20 AND 23
    //查询信息系(IS)、数学系(MA)和计算机科学系(CS)学生的姓名和性别。
    SELECT Sname,Ssex
    FROM Student
    WHERE Sdept IN ( 'IS''MA''CS' );

    //匹配串为固定字符串
    //查询学号为200215121的学生的详细情况。
    SELECT *
    FROM Student
    WHERE Sno LIKE '200215121';

    //匹配串为含通配符的字符串
    //查询所有姓刘学生的姓名、学号和性别。
    SELECT Sname,Sno,Ssex
    FROM Student
    WHERE Sname LIKE ‘刘%’;

    //查询以"DB_"开头,且倒数第3个字符为 i的课程的详细情况。
    SELECT *
    FROM Course
    WHERE Cname LIKE 'DB\_%i_ _' ESCAPE '\';

    //查所有有成绩的学生学号和课程号。
    SELECT Sno,Cno
    FROM SC
    WHERE Grade IS NOT NULL

    (3)ORDER BY子句

    • ORDER BY子句
      • 可以按一个或多个属性列排序
      • 升序:ASC; 降序:DESC;缺省值为升序
    • 当排序列含空值时
      • ASC:排序列为空值的元组最后显示
      • DESC:排序列为空值的元组最先显示
    1
    2
    3
    4
    //查询全体学生情况,查询结果按所在系的系号升序排列,同一系中的学生按年龄降序排列。
    SELECT *
    FROM Student
    ORDER BY Sdept,Sage DESC

    (4) 聚集函数

    • 计数

      • COUNT([ DISTINCT | ALL ] *)
      • COUNT([ DISTINCT | ALL ] <列名>)
    • 计算总和

      • SUM([ DISTINCT | ALL ] <列名>)
    • 计算平均值

      • AVG([ DISTINCT | ALL ] <列名>)
    • 最大最小值

      • MAX([ DISTINCT | ALL ] <列名>)
      • MIN([ DISTINCT | ALL ] <列名>)
    1
    2
    3
    查询选修了课程的学生人数。
    SELECT COUNT(DISTINCT Sno)
    FROM SC;

    (5)GROUP BY子句

    • 细化聚集函数的作用对象
    • 未对查询结果分组,聚集函数将作用于整个查询结果
    • 对查询结果分组后,聚集函数将分别作用于每个组
    • 作用对象是查询的中间结果表
    • 按指定的一列或多列值分组,值相等的为一组
    1
    2
    3
    4
    5
    查询选修了3门以上课程的学生学号。
    SELECT Sno
    FROM SC
    GROUP BY Sno
    HAVING COUNT(*) >3
    • HAVING短语与WHERE子句的区别:
      作用对象不同
      WHERE子句作用于基表或视图,从中选择满足条件的元组
      HAVING短语作用于组,从中选择满足条件的组。
  4. 集合查询

    并操作UNION
    交操作INTERSECT
    差操作EXCEPT

1
2
3
4
5
6
7
8
9
10
  查询计算机科学系的学生及年龄不大于19岁的学生。
SELECT *
FROM Student
WHERE Sdept= 'CS'
UNION
SELECT *
FROM Student
WHERE Sage<=19
UNION:将多个查询结果合并起来时,系统自动去掉重复元组。
UNION ALL:将多个查询结果合并起来时,保留重复元组
  1. 连接查询:同时涉及多个表的查询

    • 连接条件或连接谓词:用来连接两个表的条件

    • 一般格式:

      • [<表名1>.]<列名1> <比较运算符> [<表名2>.]<列名2>
      • [<表名1>.]<列名1> BETWEEN [<表名2>.]<列名2> AND [<表名2>.]<列名3>
    • 连接字段:连接谓词中的列名称

    • 连接条件中的各连接字段类型必须是可比的,但名字不必是相同的

      • 等值连接:连接运算符为 =
        查询每个学生及其选修课程的情况
      1
      2
      3
      SELECT  Student.*,SC.*
      FROM Student,SC
      WHERE Student.Sno = SC.Sno;
      • 自然连接
        查询每个学生及其选修课程的情况
      1
      2
      3
      SELECT  Student.Sno,Sname,Ssex,Sage,Sdept,Cno,Grade
      FROM Student,SC
      WHERE Student.Sno = SC.Sno;
      • 自身连接:一个表与其自己进行连接
        需要给表起别名以示区别
        由于所有属性名都是同名属性,因此必须使用别名前缀
      1
      2
      3
      4
      例如:查询每一门课的间接先修课(即先修课的先修课)
      SELECT FIRST.Cno,SECOND.Cpno
      FROM Course FIRST,Course SECOND
      WHERE FIRST.Cpno = SECOND.Cno;
      • 外连接与普通连接的区别
        普通连接操作只输出满足连接条件的元组
        外连接操作以指定表为连接主体,将主体表中不满足连接条件的元组一并输出
      1
      2
      3
      查询每个学生及其选修课程的情况
      SELECT Student.Sno,Sname,Ssex,Sage,Sdept,Cno,Grade
      FROM Student LEFT OUT JOIN SC ON (Student.Sno=SC.Sno);
      • 复合条件连接:WHERE子句中含多个连接条件
      1
      2
      3
      4
      5
      6
      查询每个学生的学号、姓名、选修的课程名及成绩
      SELECT Student.Sno,Sname,Cname,Grade
      FROM Student,SC,Course /*多表连接*/
      WHERE Student.Sno = SC.Sno
      and SC.Cno = Course.Cno;

  1. 嵌套查询

    • 一个SELECT-FROM-WHERE语句称为一个查询块,将一个查询块嵌套在另一个查询块的WHERE子句或HAVING短语的条件中的查询称为嵌套查询

    • 子查询的限制

      • 不能使用ORDER BY子句
      • 层层嵌套方式反映了 SQL语言的结构化
      • 有些嵌套查询可以用连接运算替代
    • 带有IN谓词的子查询

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    查询与“刘晨”在同一个系学习的学生。
    SELECT Sno,Sname,Sdept
    FROM Student
    WHERE Sdept IN
    (SELECT Sdept
    FROM Student
    WHERE Sname= ‘ 刘晨 ’);
    用自身连接完成查询要求
    SELECT S1.Sno,S1.Sname,S1.Sdept
    FROM Student S1,Student S2
    WHERE S1.Sdept = S2.Sdept AND
    S2.Sname = '刘晨'
    • 带有比较运算符的子查询
      • 当能确切知道内层查询返回单值时,可用比较运算符(>,<,=,>=,<=,!=或< >)。
      • 与ANY或ALL谓词配合使用
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    假设一个学生只可能在一个系学习,并且必须属于一个系,
    SELECT Sno,Sname,Sdept
    FROM Student
    WHERE Sdept =
    (SELECT Sdept
    FROM Student
    WHERE Sname= ‘刘晨’);
    找出每个学生超过他选修课程平均成绩的课程号。 SELECT Sno, Cno
    FROM SC x
    WHERE Grade >=( SELECT AVG(Grade)
    FROM SC y
    WHERE y.Sno=x.Sno ) ;
    • 带有ANY(SOME)或ALL谓词的子查询
    1
    2
    3
    4
    5
    6
    7
    查询其他系中比计算机科学某一学生年龄小的学生姓名和年龄
    SELECT Sname,Sage
    FROM Student
    WHERE Sage < ANY (SELECT Sage
    FROM Student
    WHERE Sdept= ' CS ')
    AND Sdept <> ‘CS ' ;
    • 带有EXISTS谓词的子查询
      • EXISTS谓词
        • 带有EXISTS谓词的子查询不返回任何数据,只产生逻辑值“true”或逻辑假值“false”。
        • 若内层查询结果非空,则外层的WHERE子句返回真值
        • 若内层查询结果为空,则外层的WHERE子句返回假值
        • 由EXISTS引出的子查询,其目标列表达式通常都用* ,因为带EXISTS的子查询只返回真值或假值,给出列名无实际意义
    1
    2
    3
    4
    5
    6
    7
    查询没有选修1号课程的学生姓名。
    SELECT Sna me
    FROM Student
    WHERE NOT EXISTS
    (SELECT *
    FROM SC
    WHERE Sno = Student.Sno AND Cno='1');

3 数据定义

  • SQL的数据定义功能: 模式定义、表定义、视图和索引的定义

  • 模式

    • 定义模式实际上定义了一个命名空间,在这个空间中可以定义该模式包含的数据库对象,例如基本表、视图、索引等。
    • 删除模式:DROP SCHEMA <模式名> <CASCADE | RESTRICT>
      • CASCADE(级联)
        删除模式的同时把该模式中所有的数据库对象全部删除
      • RESTRICT(限制)
        如果该模式中定义了下属的数据库对象(如表、视图等),则拒绝该删除语句的执行。当该模式中没有任何下属的对象时才能执行。
  • 基本表

    • 定义基本表
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    建立“学生”表Student,学号是主码,姓名取值唯一。
    CREATE TABLE Student
    (Sno CHAR(9) PRIMARY KEY
    Sname CHAR(20) UNIQUE/* Sname取唯一值*/
    Ssex CHAR(2),
    Sage SMALLINT
    Sdept CHAR(20)
    );
    建立一个“课程”表Course
    CREATE TABLE Course
    ( Cno CHAR(4) PRIMARY KEY
    Cname CHAR(40),
    Cpno CHAR(4) ,
    Ccredit SMALLINT
    FOREIGN KEY (Cpno) REFERENCES Course(Cno)
    );
    建立一个“学生选课”表SC
    CREATE TABLE SC
    (Sno CHAR(9),
    Cno CHAR(4),
    Grade SMALLINT
    /* 主码由两个属性构成,必须作为表级完整性进行定义*/
    PRIMARY KEY (Sno,Cno),
    /* 表级完整性约束条件,Sno是外码,被参照表是Student */
    FOREIGN KEY (Sno) REFERENCES Student(Sno),
    /* 表级完整性约束条件, Cno是外码,被参照表是Course*/
    FOREIGN KEY (Cno) REFERENCES Course(Cno)
    );
    • 修改基本表:不论基本表中原来是否已有数据,新增加的列一律为空值。
    1
    2
    3
    4
    5
    6
    /*向Student表增加“入学时间”列,其数据类型为日期型。*/
    ALTER TABLE Student ADD S_entrance DATE
    /*将年龄的数据类型由字符型(假设原来的数据类型是字符型)改为整数。*/
    ALTER TABLE Student ALTER COLUMN Sage INT
    /*增加课程名称必须取唯一值的约束条件。*/
    ALTER TABLE Course ADD UNIQUE(Cname);
  • 删除基本表:DROP TABLE <表名>[RESTRICT| CASCADE];

    • RESTRICT:删除表是有限制的。
      欲删除的基本表不能被其他表的约束所引用。如果存在依赖该表的对象,则此表不能被删除
    • CASCADE:删除该表没有限制。
      在删除基本表的同时,相关的依赖对象一起删除
  • 索引

    • 建立索引的目的:加快查询速度
    • 谁可以建立索引
      DBA 或 表的属主(即建立表的人)
      DBMS一般会自动建立以下列上的索引
        PRIMARY  KEY
        UNIQUE
    • 谁维护索引
       DBMS自动完成 
    • 使用索引
       DBMS自动选择是否使用索引以及使用哪些索引
    • RDBMS中索引一般采用B+树、HASH索引来实现
      • B+树索引具有动态平衡的优点 ,HASH索引具有查找速度快的特点,采用B+树,还是HASH索引 则由具体的RDBMS来决定
      • 索引是关系数据库的内部实现技术,属于内模式的范畴
      • CREATE INDEX语句定义索引时,可以定义索引是唯一索引、非唯一索引或聚簇索引
      • 在最经常查询的列上建立聚簇索引以提高查询效率 ,一个基本表上最多只能建立一个聚簇索引 ,经常更新的列不宜建立聚簇索引
    1
    2
    3
    4
    /*在Student表的Sname(姓名)列上建立一个聚簇索引*/
    CREATE CLUSTER INDEX Stusname ON Student(Sname);
    /* SC表按学号升序和课程号降序建唯一索引*/
    CREATE UNIQUE INDEX SCno ON SC(Sno ASC,Cno DESC);
    • 删除索引时,系统会从数据字典中删去有关该索引的描述。

4 数据更新

  1. 插入数据

  2. 修改数据

    • 语句格式
      UPDATE <表名>
      SET  <列名>=<表达式>[,<列名>=<表达式>]…
      [WHERE <条件>];
    • 功能
      修改指定表中满足WHERE子句条件的元组的指定列值
  3. 删除数据

    语句格式

       DELETE
       FROM     <表名>
       [WHERE <条件>];
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    /*插入一条选课记录( '200215128','1 ')。*/
    INSERT INTO SC(Sno,Cno) VALUES (‘ 200215128 ’,‘1');

    /*将计算机科学系全体学生的成绩置零。*/
    UPDATE SC
    SET Grade=0
    WHERE 'CS'=
    (SELETE Sdept
    FROM Student
    WHERE Student.Sno = SC.Sno);
    /*删除学号为200215128的学生记录。*/
    DELETE FROM Student WHERE Sno= ‘200215128 '

5 视图

  1. 视图的特点

    • 虚表,是从一个或几个基本表(或视图)导出的表
    • 只存放视图的定义,不存放视图对应的数据
    • 基表中的数据发生变化,从视图中查询出的数据也随之改变
  2. 基于视图的操作

    • 查询
    • 删除
    • 受限更新
    • 定 义基于该视图的新视图。
  3. 定义视图

    • 语句格式
         CREATE  VIEW  <视图名>  [(<列名>  [,<列名>]…)]
         AS  <子查询>
         [WITH  CHECK  OPTION];
    • 成视图的属性列组名:全部省略或全部指定
    • 子查询不允许含有ORDER B‘’‘Y子句和DISTINCT短语
    • RDBMS执行CREATE VIEW语句时只是把视图定义存入数据字典,并不执行其中的SELECT语句。
    • 在对视图查询时,按视图的定义从基本表中将数据查出。
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    /*建立信息系学生的视图,并要求进行修改和插入操作时仍需保证该视图只有信息系的学生。*/
    CREATE VIEW IS_Student
    AS
    SELECT Sno,Sname,Sage
    FROM Student
    WHERE Sdept= 'IS'
    WITH CHECK OPTION
    /*
    带WITH CHECK OPTION选项时对IS_Student视图的更新操作:
    修改操作:自动加上Sdept= 'IS'的条件
    删除操作:自动加上Sdept= 'IS'的条件
    插入操作:自动检查Sdept属性值是否为'IS'
    如果不是,则拒绝该插入操作
    如果没有提供Sdept属性值,则自动定义Sdept为'IS'
    */
    • 基于多个基表的视图
    1
    2
    3
    4
    5
    6
    7
    8
    /*建立信息系选修了1号课程的学生视图。*/
    CREATE VIEW IS_S1(Sno,Sname,Grade)
    AS
    SELECT Student.Sno,Sname,Grade
    FROM Student,SC
    WHERE Sdept= 'IS' AND
    Student.Sno=SC.Sno AND
    SC.Cno= '1'
    • 基于视图的视图
    1
    2
    3
    4
    5
    6
    /* 建立信息系选修了1号课程且成绩在90分以上的学生的视图。*/
    CREATE VIEW IS_S2
    AS
    SELECT Sno,Sname,Grade
    FROM IS_S1
    WHERE Grade>=90
    • 带表达式的视图
    1
    2
    3
    4
    5
    /*定义一个反映学生出生年份的视图。*/
    CREATE VIEW BT_S(Sno,Sname,Sbirth)
    AS
    SELECT Sno,Sname,2007-Sage
    FROM Student;
    • 分组视图
    1
    2
    3
    4
    5
    6
    /*将学生的学号及他的平均成绩定义为一个视图,假设SC表中“成绩”列Grade为数字型*/
    CREATE VIEW S_G(Sno,Gavg)
    AS
    SELECT Sno,AVG(Grade)
    FROM SC
    GROUP BY Sno;
    • 不指定属性列:

      缺点:修改基表Student的结构后,Student表与F_Student视图的映象关系被破坏,导致该视图不能正确工作。

    1
    2
    3
    4
    5
    CREATE VIEW F_Student(F_Sno,name,sex,age,dept)
    AS
    SELECT *
    FROM Student
    WHERE Ssex=‘女’;
  4. 删除视图

    • 语句的格式:DROP VIEW <视图名>;
    • 该语句从数据字典中删除指定的视图定义
    • 如果该视图上还导出了其他视图,使用CASCADE级联删除语句,把该视图和由它导出的所有视图一起删除
    • 删除基表时,由该基表导出的所有视图定义都必须显式地使用DROP VIEW语句删除
  5. 查询视图

    • 用户角度:查询视图与查询基本表相同
    • RDBMS实现视图查询的方法
      • 视图消解法(View Resolution)
      • 进行有效性检查
      • 转换成等价的对基本表的查询
      • 执行修正后的查询
      • 有些情况下,视图消解法不能生成正确查询。
  6. 更新视图

    • 更新视图的限制:一些视图是不可更新的,因为对这些视图的更新不能唯一地有意义地转换成对相应基本表的更新
  7. 视图的作用

    • 视图能够简化用户的操作
      视图机制使用户可以将注意力集中在他所关心的数据上。如果这些数据不是直接来自基本表,则可以通过定义视图,使用户眼中的数据库结构简单、清晰,并且可以简化用户的数据查询操作。
    • 视图使用户能以多种角度看待同一数据
      视图机制能使不同的用户以不同的方式看待同一数据,当许多不同种类的用户使用同一个数据库时,这种灵活性是非常重要的。
    • 视图对重构数据库提供了一定程度的逻辑独立性
    • 视图能够对机密数据提供安全保护
      有了视图机制,就可以在设计数据库应用系统时,对不同的用户定义不同的视图,使机密数据不出现在不应看到这些数据的用户视图上,这样就由视图的机制自动提供了对机密数据的安全保护功能。