01数据库概述¶

1.为什么要使用数据库¶

持久化（persistence）:把数据保存到可掉电式的存储设备上以供之后使用。大多数情况下，特别是企业级应用数据持久化意味着将内存中的数据保存到硬盘上加以“固化”，而持久化的实现过程大多通过各种关系型数据库来完成。
持久化的主要作用是将内存中的数据存储在关系型数据库中，当然也可以存储在磁盘文件、XML数据文件中。

2.数据库与数据库管理系统¶

2.1数据库的相关概念¶

DB：数据库（Database）
存放数据的“仓库”，其本质是一个文件系统。它保存了一系列有组织的数据。
DBMS：数据库管理系统（Database Management System）
是一种操纵和管理数据库的大型软件，用语建立、使用和维护数据库，对数据库进行统一的管理和控制。用户通过数据库管理系统访问数据中的数据。
SQL：结构化查询语言（Structure Query Language）
专门用来与数据通信的语言

2.2数据库与数据库管理系统的关系¶

数据库管理系统（DBMS）一般管理多个数据库（DB），一般开发人员会针对每一个应用创建一个数据、为保存应用中实体的数据，一般会在数据库中创建多个表，以保存程序中实体的用户数据。

一般来说用户可以使用SQL语言在DBMS当中对其所管理的DB进行相关的数据库操作。

数据库管理系统、数据库和表的关系：

2.3常见的数据库管理系统排名

互联网上常见的数据库管理软件（DBMS）有Oracle、Mysql、MS SQL Server、DB2、PostgreSQL、Access、Sybase、Infomix这几种。以下2023年6月27日10:48:29的DB-Engine Ranking对各个数据库受欢迎程度进行调查后的统计结果。

DB-Engine Ranking排名

合作伙伴¶

4.RDBMS与非RDBMS¶

从排名中我们能看出来，关系型数据绝对是DBMS的主流，其中使用最多的DBMS分别是Oracle、MySQL、MS SQL Server这些都是关系型数据库。

4.1关系型数据库（RDBMS）¶

4.11实质¶

这种类型的数据库是最古老的数据库类型，关系型数据库模型是把复杂的结构归纳为简单的二元关系。（即二维表格格式）
关系型数据库以行（row）和列（column）的形式存储数据，以便于用户理解。这一系列的行和列被称为表（table），一组表组成了一个库（Database）
表与表之间的数据记录有关系（relationship）。现实世界中各种实体以及实体之间的各种联系均用关系模型来表示。关系型数据库，就是建立在关系模型的基础上。

关系模型：在数据库中，关系模型是一种用于描述数据的方法，它使用表格来表示数据实体和它们之间的关系。每个表格都包含了多个列，每一列代表了一个属性，每一行代表了一个记录。表格之间的关系可以通过外键来建立。关系模型是一种非常常用的数据模型，被广泛应用于关系型数据库系统中。常见的关系型数据库系统包括 MySQL、Oracle、SQL Server 等。

SQL就是关系型数据库的查询语言。

4.12非关系型数据库¶

复杂查询

可是使用SQL语句方便的在一个表以及多个表中之间做非常复杂的数据查询。

事务支持

使得对于安全性很高的数据访问需求得以实现。

4.2非关系型数据库（非RDBMS）¶

4.2.1介绍各种非关系型数据库（NoSQL）¶

非关系型数据库也被称为 NoSQL 数据库，它们与传统的关系型数据库不同，没有固定的表格结构和关系模型。下面是一些常见的非关系型数据库：

文档数据库：文档数据库是一种基于文档的数据库，它使用类似于 JSON 的格式来存储数据。文档数据库通常用于存储半结构化数据，如文档、日志、配置文件等。常见的文档数据库包括 MongoDB、CouchDB 等。
列族数据库：列族数据库是一种基于列的数据库，它将数据存储在列族中而不是表格中。列族数据库通常用于存储大量的结构化数据，如日志、用户行为数据等。常见的列族数据库包括 HBase、Cassandra 等。
图形数据库：图形数据库是一种基于图形模型的数据库，它使用节点和边来表示数据实体和它们之间的关系。图形数据库通常用于存储复杂的关系数据，如社交网络、知识图谱等。常见的图形数据库包括 Neo4j、OrientDB 等。
键值数据库：键值数据库是一种基于键值对的数据库，它使用一个唯一的键来标识每个数据实体。键值数据库通常用于存储简单的数据结构，如缓存、会话数据等。常见的键值数据库包括 Redis、Memcached 等。

非关系型数据库具有高可扩展性、高性能、灵活性等优点，适用于大数据量、高并发、分布式等场景。但也存在一些缺点，如数据一致性、事务支持等方面相对较弱。因此，在选择使用非关系型数据库时需要根据具体的业务需求和场景做出权衡。

4.2.3NoSQL的演变¶

由于SQL一直称霸DBMS，因此许多人子啊思考是否有一种数据库技术能够远离SQL，于是NoSQL诞生了。但是随着发展却发现越来越离不开SQL。到目前为止NoSQL阵营中的DBMS都有会实现类似SQL的功能。下面是“No SQL”这个名词在不同时期的诠释。

1970	NoSQL = We have no SQL
1980	NoSQL = know SQL
2000	NoSQL= No SQL!
2005	NoSQL = Not only SQL
2013	NoSQL = No,SQL

NoSQL对SQL做出了很好的补充，比如在实际开发中，有很多业务需求，其实并不需要完整的关系型数据库功能，非关系型数据库功能就足够使用了。在这种情况下，使用性能更高、成本更低的非关系型数据库当然是更明智的选择。比如：日志收集，排行榜、定时器等。

5.关系型数据库的设计规则¶

关系型数据库典型的数据结构就是**数据表**，这些数据表的组成都是结构化的（Structured）。
将数据放到表中，表再放到库中。
一个数据库中可以有多个表，每个表都有一个名字，用来标识自己。表名具有唯一性。
表具有一些特性，这些特性定义了数据在表中如何存储，类似Java和Python中“类”的设计。

5.1表、记录、字段¶

E-R（Entity-relationship，实体关系-联系）模型中有三个主要概念是：实体集、属性、联系集。
一个实体集（class）对应数据库当中的一个表（table），一个实体（instance）则对应数据库表中的一行（row），也称为一条记录（record）。一个属性（attribute）则对应数据库表中的一列（column），也称为一个字段（field）。

5.2 表的关联关系¶

表与表之间的数据记录有关系（relationship）。现实世界中各个实体之间的各种联系均用关系模型来表示。

四种：一对一关联、一对多关联、多对多关联、自我引用。

5.2.1 一对一关联（one-to-one）¶

在实际的开发应用中并不多，因为一对一可以创建成一张表。
举例：设计**学生表**：学号、姓名、手机号码、班级、系别、身份证号、家庭住址、籍贯、紧急联系人、... ...
拆分为两个表：两个表的记录是一一对应关系。
基础信息表（常用信息）：学号、姓名、手机号码、班级、级别
档案信息表（不常用信息）：学号、身份证号码、家庭住址、籍贯、紧急联系人
两种建表原则
外键唯一：主表的主键和从表的外键（唯一），形成主外键关系，外键唯一。
外键是主键：主表的主键和从表的主键，形成主键关系。

5.2.2 一对多关系（one-to-many）¶

常见的实例场景：客户和订单表，分类表和商品表，部门表和员工表。
举例：
员工表：编号、姓名、...... 所属部门
部门表：编号、名称、简介
一对多建表原则：在表（多方）创建一个字段。字段作为外键指向主表（一方）的主键。

5.2.3 多对多关系（many-to-many）¶

要创建多对多关系，必须创建第三个表，这个表通常被称为中间表（联接表），它将多对多关系划分为两个一对多关系来定义的。一个订单可以有多个产品，每个产品可以出现在多个订单中。

举例1：学生-课程
学生信息表：一行代表一个学生信息（学号、姓名、手机号码、班级、系别）
课程信息表：一行代表一个课程的信息（课程编号、授课老师、简介......）
选课信息表：一个学生可以选多门课，一门课可以被多个学生选择。

学号    课程编号
1       1001
2       1001
1       1002