数据库: 是指长期存储在计算机内的、有组织的、可共享的数据集合
数据库管理系统: 是一种操作和管理数据库的大型软件,用于建立使用维护数据库。
数据库管理系统主要的功能有:数据定义、数据库操作、数据库运行管理、数据组织存储和管理数据库的建立与维护及其他功能。
数据库管理系统主要分为三类:关系型数据库、面向对象的数据库系统、对象关系数据库系统。
数据库系统采用三级模式结构,模式/内模式映像、外模式/模式映像来保证数据库中数据具有较高的逻辑独立性和物理独立性。

概念模型中最常用的方法为书体-联系法简称E-R方法主要组成是实体、联系、属性。

重点: E-R模型强调的是语义,与现实世界的问题密切相关。扩充的E-R模型包括弱实体、特殊化、概括和聚集等。
规范化理论研究的是关系模式种各属性之间的依赖关系及对关系模式性能的影响。关系数据库设计理论的核心是数据之间的函数依赖,衡量的标准是关系规范化的程度及分解的无损连接和保持函数依赖性。
数据依赖是通过一个关系中属性间值的相等与否体现出来的数据间的相互关系,是现实世界属性间联系和约束的抽象,是数据内在的性质,是语义的体现。
函数依赖是一种最重要的最基本的数据依赖,包括函数依赖、非平凡的函数依赖、平凡的函数依赖、完全函数依赖、部分函数依赖、传递依赖、码、主属性和非主属性、外码值依赖定义、函数依赖的公理系统。
范式是关系模型满足的确定约束条件。范式有1NF(第一范式)、2NF(第二范式)、3NF(第三范式)、BCNF(巴克斯范式)、4NF(第四范式)、5NF。其中1NF级别最低5NF最高。
关系模型的规范化是指把一个低一级范式的关系模式转换成若干个高一等级范式的关系模式过程。关系数据库设计的方法之一就是设计满足适当范式的模式,并通过判断分解后的模式达到第几范式来评价模式规范化的程度。
事务是一个操作序列,这些操作“要么都做要么不做”,是位于是数据库环境中不可分割的逻辑工作单位,事务和程序是两个不同的概念,一般一个程序可包含多个事务。
事务的四个特性,原子性、一致性、隔离性、持久性,这四个也就是事务的ACID性质。
在SQL语言中事务定义的语句有三条:事务开始、提交、回滚。
并发操作是指再多用户共享的系统中,用户可能同时对同一数据进行操作。并发操作会带来脏读、幻读、不可重复读的问题,这就要考虑到数据库使用的隔离级别去解决这些问题
| 隔离级别 | 脏读 | 不可重复读 | 幻读 |
|---|---|---|---|
| 读取未提交 | √ | √ | √ |
| 读取已提交 | × | √ | √ |
| 可重复读 | × | × | √ |
| 可串行化 | × | × | × |
并发控制的主要技术是封锁。封锁的类型有排他锁(简称X锁或写锁)和共享锁(简称S锁或读锁)。并发控制还与三级封锁协议、活锁与死锁、并发调度的可串行性、两段封锁协议、封锁的粒度、事务的嵌套等有关。
以下基于mysql:
数据库的锁可以分为三大类,表级锁和行级锁、页锁
表级锁又分为两类
一般MyISAM使用表锁(不支持行锁),所以不支持事务
INNODB支持表和行锁,默认是行锁,并且支持事务
页锁
数据库的4类故障是事务故障、系统故障、介质故障、计算机病毒
事务故障恢复一般有两个操作:撤销、重做
介质故障比较严重,需要管理员先装入数据库副本或者日志文件副本,然后系统执行撤销和重做。
一般出现问题两种是同时采用。
直观设计法、规范设计法、计算机辅助设计法、自动化设计法
需求分析》概念结构设计》逻辑结构设计》物理结构设计》应用程序设计》运行维护

分布式 数据库通俗的来讲就是不受单体物理机限制,可以分散到多个物理机器自治性的数据库。
特点是:数据的集中控制性、数据独立性、数据冗余可控性、场地自治性、存取有效性。
抽象为四层的结构模式
全局外层》全局概念层》局部概念层》局部内层

智能商业系统主要将原始业务数据转换为企业决策信息的过程,主要是四个阶段数据预处理》建立数据仓库》数据分析》数据展现。
三大组成部分是数据仓库》分析处理》数据挖掘

内容太多了,举几个例子自行学习,现在比较流行的hadoop、spark
基本上是面对海量数据根据某些关键因子生成出来的数据模型进行分析识别应用。
关系型的 oracle、mysql、sqlServer
非关系型 mongo、redis
所有图片来自于网络,如果有侵权,我立刻删除。