数据库系统原理(二)
数据库系统原理(二)
关系数据模型
-
数据模型的三要素:
- 数据结构
- 数据操作
- 数据约束
-
关系数据模型的三要素:
- 关系数据结构
- 关系操作集合
- 关系完整性约束
表:也称为关系,是一个二维的数据结构,由表名、列、和若干行数据组成
-
关系的三种类型
- 基本关系(基本表、基表) ------------------真是存在的表
- 查询表 ---------------------------------------导出的虚表
- 视图表 ---------------------------------------导出的虚表
-
关系(表)中的相关概念和别称:
- 列:也称 字段 或 属性
- 属性的个数称为关系的元或度
- 列的值称为属性值,取值范围称为值域
- 行:也称 元组 或 记录,表中的数据按行存储
- 分量:元组(行)中的一个属性值,称为分量,具体的数据项(或者说具体的一个单元格)
- 码或键(Key):一个属性(或属性组)的值都能用来唯一标识该关系的元组,则称这个属性(或属性组)为该关系的码或键
- 超码或超键: 在码中去除某个属性,它仍然是这个关系的码;一个关系中有多个超码或超键
- 候选码或候选键或候选关键字: 在码中不能从中移去任何一个属性,否则它就不再是这个关系的码或键,这样的码称为候选码或候选键;候选码或候选键是这个关系的最小超码或超键
- 主属性或非主属性:包含在任何一个候选码中的属性称为主属性或码属性
- 主码或主键: 在若干个候选码中指定一个唯一标识关系的元组(行)
- 全码或全键: 一个关系模式的所有属性集合是这个关系的主码或主键,这样的主码或主键称为全码或全键
- 外码或外键: 某个属性(或属性组)不是这个关系的主码或候选码,而是另一个关系的主码,这个属性称为这个关系的外码或外键
- 参照关系和被参照关系: 参照关系也称为从关系,被参照关系也称为主关系,它们是指以外码相关联的两个关系
- 域: 表示属性的取值范围
- 数据类型: 每个列都有相应的数据类型,它用于限制(或容许)该列中存储的数据
- 关系模式: 关系模式是型(type),关系是 值(value),即关系模式是对关 系的描述;关系模式是静态的、稳定的;关系是动态的、随时间不断变化的
- 关系数据库: 所有关系的集合,构成一个关系数据库;以关系模型作为数据的逻辑模型,并采用关系作为数据组织方式的一类数据库,其数据库操作建立在关系代数的基础上
基本的关系操作
- 查询(Query)
- 并
- 差
- 选择
- 投影
- 笛卡尔积
- 插入(insert)
- 删除(Delete)
- 修改(Update)
关系操作的特点是:集合操作方式(一次一集合)
-
关系语言的分类
- 关系代数语言
- 关系演算语言
- 元组关系演算
- 域关系演算
- SQL 结构化查询语言
-
传统集合运算:
- 并(U) 多表求和
- 差(-) 多表求差
- 交(∩) 多表求交集
- 笛卡尔积(X) 多表求积
-
专门的关系运算
- 选择:σF(R) F表示表名,R表示条件,得到的是一行行的数据
- 投影:πA(R) A表示表名,R表示字段,多个字段用,隔开;得到的是属性对应的值
共同特点:具有完备的表达能力,是非过程化的集合操作语言,功能强,能够独立使用也可以嵌入高级语言中使用
- 任何一种操作都包含三大要素:
- 操作对象
- 操作符
- 操作结果
- 关系数据库对关系的限定/要求:
- 每一个属性都是不可分解的(不允许表中有表)
- 每一个关系仅仅有一种关系模式
- 每一个关系模式中的属性必须命名,属性名不同
- 同一个关系中不允许出现候选码或候选键值完全相同的元组
- 在关系中元组的顺序(即行序)是无关紧要的,可以任意交换
- 在关系中属性的顺序(即列序)是无关紧要的,可以任意交换。
同一库中,表名必须唯一;同一表中,字段名必须唯一
关系完整性约束
数据完整性是指数据库中数据的正确性、相容性、一致性
- 实体完整性约束
- 主码的组成不能为空,主属性不能是空值null
- 参照完整性约束
- 定义外码和主码之间的引用规则
- 外码等于主码中某个元组的主码值或者为空值
- 用户定义完整性约束
- 域完整性约束(针对某一应用环境的完整性约束)
关系模式中可能存在的冗余和异常问题
- 数据冗余:指同一数据被反复存储的情况
- 更新异常:数据冗余造成的
- 插入异常
- 删除异常