数据库笔记(一)

SQL教程

DBS(Database System)

  • 传统的文件处理系统中存储组织信息的主要弊端
    • 数据的冗余和不一致性(data redundancy and inconsistency)
    • 数据访问困难(dificulty in accessing data)
    • 数据孤立(data isolation)
    • 完整性问题(integrity problem)
    • 原子性问题(atomicity problem)
    • 并发访问异常(concurrent-access anomaly)
    • 安全性问题(security problem)
  • 数据库系统的目标:提供一种可以方便高效地存取数据库信息的途径

数据视图

数据库系统的一个主要目的是给用户提供数据的抽象视图,也就是说隐藏关于数据存储和维护的某些细节

  • 数据抽象

    数据视图

    • 物理层(physical level)
      • 最低层次的抽象
      • 描述了数据实际上是怎么存的(比如是都存在一个文件里还是分散在多个文件里)
    • 逻辑层(logical level)
      • 比物理层层次稍高的抽象
      • 描述了数据库中存什么数据以及数据之间的关系
      • 逻辑层的用户不需要去关系数据具体是怎么存的,这称作物理数据独立性(physical data independence)

        ps: 对于具有物理数据独立性的设计,即便底层的物理存储改变了,逻辑层也不需要做任何的修改

    • 视图层(view level)
      • 最高层次的抽象,只描述整个数据库的某个部分
      • 简而言之,对于逻辑层的数据,我们可以通过不同的视图,以不同的视角以及视野去查看它
  • 实例和模式

    类比:模式类比于变量的声明,实例类比于变量在特定时刻的值

    • 模式: 数据库的总体设计
      • 数据库的模式限定了数据库中都有哪些表,表中都有哪些字段以及表与表之间的关系
    • 实例: 特定时刻存储在数据库中的信息的集合
      • 数据库的一个实例包含了数据库在一个时刻下的所有表的信息
  • 数据模型

    • 关系模型
    • 实体—联系模型
    • 基于对象的数据模型
    • 半结构化的模型
    • 网状数据模型
    • 层次数据模型

关系型数据库的一些基本术语

  • relation(关系)==>表
  • column(列)==>字段(同一字段内所有数据的数据类型一致)
  • row(行)==>对应于数据库表中的一行数据(对应于数学概念中的元组)
  • SQL(Structured Query Language)==>结构化的查询语言
  • DDL:Data Define Language(数据定义语言)==>执行 该类SQL语句会导致表结构的变化
  • DML:Data Manipulation Language(数据操纵(管理)语言)==>执行该类SQL语句对表中的数据进行增删改查
  • 查询语言(query language):DML中涉及信息检索的部分称之为查询语言
  • tuple(元组)==>对应于数据表中的一行数据
  • domain(域)==>字段的取值范围
  • schema(方案/模式)==>数据库中的Schema,为数据库对象的集合,一个用户一般对应一个schema
  • Cartesian product(笛卡儿积)

DDL (数据定义语言)
数据库模式定义语言DDL(Data Definition Language),是用于描述数据库中要存储的现实世界实体的语言。一个数据库模式包含该数据库中所有实体的描述定义。DDL用来定义一个数据库的模式

  • 执行此类语句会导致数据库结构的变化
  • create(创建一个表)

    1
    2
    3
    4
    5
    6
    7
    -- 下面的语句创建了一个用户表,以id为主键,并添加了username和age字段
    CREATE TABLE User(
    id INT PRIMARY KEY AUTO_INCREMENT,
    username VARCHAR(20) DEFAULT "",
    age INT DEFAULT 18
    );
    CREATE UNIQUE INDEX User_id_uindex ON User (id);
  • alter(修改表的结构)

    1
    2
    -- 下面的语句修改了user表的id属性
    ALTER TABLE user MODIFY id INT(11) unsigned NOT NULL AUTO_INCREMENT;
  • drop(删除一张表)

    1
    2
    -- 下面的语句删除了为user表
    DROP TABLE demo.user;
  • rename(用于对一张表的名字进行重命名)

    • Oracle数据库将其划分到DDL
    • SQL server数据库将其归到DML
      1
      2
      -- 下面的语句将user表的表名改成new_user
      rename table user to new_user
  • truncate(截断==>用于删除数据表中的所有数据,但是保留表结构,不同公司的数据库实现的机制不同)

    DML
    数据操纵语言(Data Manipulation Language, DML)SQL语言中,负责对数据库对象运行数据访问工作的指令集,以INSERT、UPDATE、DELETE三种指令为核心,分别代表插入、更新与删除,是开发以数据为中心的应用程序必定会使用到的指令,因此有很多开发人员都把加上SQL的SELECT语句的四大指令以“CRUD”来称呼。

  • 此类语句对数据进行增删改查(CRUD)

  • insert

    1
    2
    -- 下面的语句往user用户表中插入一条记录
    INSERT into user(username, age) VALUES('Robbin', 18)
  • update

    1
    2
    -- 下面的语句修改了user表中username为Robbin的表项(元组)的数据
    UPDATE user SET username = 'Robbin2', age = 17 WHERE username = 'Robbin'
  • delete

    1
    2
    -- 下面的语句删除user表中username为Robbin2的表项(元组)
    DROP FROM user WHERE username = 'Robbin2'
  • select

    • DB2将select归到DML
    • Oracle将select单独划为一类(因为select操作只是对数据库进行查询操作,没有实质改变数据库中的数据)
      1
      2
      -- 下面的语句查询user表中的所有数据
      SELECT * FROM user

DML和DDL的区别

  • DML语句支持回滚,采用事务,可以保证数据的一致性;而DDL语句采用隐式commit,是不支持回滚的(一旦执行就不可撤回)
  • 四种SQL语句

Key(键/码)

  • superkey(超码)==>一个或多个字段的集合,可唯一标识一行数据
  • candidate keys(候选码)==>最小的超码(即本集合为超码,且集合内除本身外的任何子集都不能作为超码)
  • Primary key(主码/主键)==>从候选码中选取一个作为主码(主键),可以由多个字段组成
  • Primary attribute(主属性)==>包含于某个候选码的属性
  • Non-Prime attribute(非主属性)==>不包含于某个候选码的属性

Note:

  • 数据表中字段的个数是有限的
  • 属性在元组中是无序的(但是设计的时候一般把主键放在前面)
  • 设计字段的时候要保证字段的原子性
  • NULL==>空值表示不确定的值,不代表0,也不代表空串
坚持原创技术分享,您的支持将鼓励我继续创作!