后端存储实战课——高速增长篇

后端存储实战课——高速增长篇
《后端存储实战课》的学习笔记，欢迎阅读斧正。

数据库超时

MySQL CPU 的利用率一直是 100% 的话，MySQL 基本属于不可用的状态，执行的 SQL 都会超时。

CPU 利用率高的情况，绝大多数是由于慢 SQL 引起的，可以通过分析慢 SQL 日志查找类似问题原因。由于数据库忙的时候，执行的 SQL 都很慢，所以慢 SQL 日志中的 SQL 不一定都是有问题的，不能简单通过执行次数和执行时长进行判断，但是要关注单词执行时间特别长的 SQL。

给编写 SQL 带来的启示：
1. SQL 涉及的表是哪些，数据规模如何？
2. SQL 遍历的数据量是多少？
3. 避免写出慢 SQL
给系统设计带来的启示：
1. 利用缓存减少数据库查询，使用缓存时注意缓存命中率（击穿、穿透、雪崩现象）
2. 做好监控，及时处理
3. 做好降级方案
慢 SQL

一个前提：查询的执行时长基本上是和遍历的数据行数正相关的。

影响 MySQL 处理能力的因素：服务器配置、数据量大小、参数配置、繁忙程度。一台 MySQL 数据库，处理能力的极限大概是每秒一万条简单的 SQL（根据主键查询不需要遍历很多条记录的 SQL），一般一台 MySQL 服务器，平均每秒中执行的 SQL 数量在几百左右就算繁忙了。

一些经验：
1. 如果遍历行数在百万以内的，只要不是每秒钟都要执行几十上百次的频繁查询，可以认为是安全的。遍历数据行数在几百万的，查询时间最少也要几秒钟，你就要仔细考虑有没有优化的办法。遍历行数达到千万量级和以上的，这种查询就不应该出现在你的系统中。当然我们这里说的都是在线交易系统，离线分析类系统另说。
2. 遍历行数在千万左右，是 MySQL 查询的一个坎儿。MySQL 中单个表数据量，也要尽量控制在一千万条以下，最多不要超过二三千万这个量级。原因也很好理解，对一个千万级别的表执行查询，加上几个 WHERE 条件过滤一下，符合条件的数据最多可能在几十万或者百万量级，这还可以接受。但如果再和其他的表做一个联合查询，遍历的数据量很可能就超过千万级别了。所以，每个表的数据量最好小于千万级别。
如果真需要遍历大量数据，两种方案：
1. 使用索引避免全表扫描（增加索引的代价是降低数据插入、删除、更新的性能，对于更新频繁并且对更新性能要求高的表尽量少建索引），关联阅读：MySQL 索引入门、MySQL 查询优化
2. 分析 SQL 的执行计划，关联阅读：MySQL explain 使用
缓存使用

更新策略简单贴图，雪崩、击穿、穿透问题不再赘述

Read/Write Through：

Cache Aside：

Write Back：Write Back（写回）策略在更新数据的时候，只更新缓存，同时将缓存数据设置为脏的，然后立马返回，并不会更新数据库。对于数据库的更新，会通过批量异步更新的方式进行。

MySQL 读写分离

 步骤

 部署一主多从 MySQL 实例

参考 MySQL 官方文档

 分离应用对数据库的读写请求
1. 手动实现，在 DAO 层做修改
2. 使用 Sharding-JDBC 组件（代码侵入少）
3. 代理方式：在应用程序和数据库实例之间部署一组数据库代理实例，比如说 Atlas 或者 MaxScale。对应用程序来说，数据库代理把自己伪装成一个单节点的 MySQL 实例，应用程序的所有数据库请求被发送给代理，代理分离读写请求，然后转发给对应的数据库实例。（会加长请求的链路，有一定性能损失）
主从延迟
1. 如果有插入后立马要求查询到的业务，可以直连主库查询
2. MySQL 的并行复制
3. 业务上规避（在应用程序和数据库实例之间部署一组数据库代理实例，比如说 Atlas 或者 MaxScale。对应用程序来说，数据库代理把自己伪装成一个单节点的 MySQL 实例，应用程序的所有数据库请求被发送给代理，代理分离读写请求，然后转发给对应的数据库实例）
MySQL 主从

 大概步骤

MySQL 可以通过修改配置的方式来更改下述的时序。
主库需要执行的操作：
1. 提交事务
2. 更新存储的数据
3. 写 binlog
4. 向客户端返回响应
5. 将 binlog 复制到所有从库
从库需要做的：
1. 将上述的 binlog 暂存
2. 回放 binlog
3. 更新对应数据
4. 向主库发送复制成功的响应
复制方式

默认情况下，MySQL 采用的是异步复制的方式，因此执行事务操作的线程不会等待复制 binlog 的线程。

异步复制：主库向客户端返回操作成功的响应后，从库中会有专门线程从主库接收 binlog，并将其保存到中继日志中。从库中还有专门用来回放 binlog 的线程，读取中继日志，回收 binlog，更新数据

同步复制：同步复制的时序和异步复制基本是一样的，唯一的区别是，什么时候给客户端返回响应。异步复制时，主库提交事务之后，就会给客户端返回响应；而同步复制时，主库在提交事务的时候，会等待数据复制到所有从库之后，再给客户端返回响应。

半同步复制：异步复制是，事务线程完全不等复制响应；同步复制是，事务线程要等待所有的复制响应；半同步复制介于二者之间，事务线程不用等着所有的复制成功响应，只要一部分复制响应回来之后，就可以给客户端返回了。

关联阅读

后端存储实战课——设计篇

后端存储实战课——海量数据篇
相关阅读:
ufw配置：外网ip禁止访问配置
 VS2019创建动态库，包含普通函数，类，C语言函数
 EasyX库的下载及基本作图函数的使用【VS编译器】
C++无依赖库的websocket实现
 Adam优化算法
 即拼七人团增加消费者复购欲望，为企业赋能
 基于Java毕业设计学校图书馆管理系统源码+系统+mysql+lw文档+部署软件
 C# Convert和BitConverter类学习
 Windsor Hall - 位于列治文的IB私立学校
 【精选】矩阵加速
原文地址：https://blog.csdn.net/MrBaymax/article/details/128172446

数据库超时

慢 SQL

缓存使用

MySQL 读写分离

步骤

部署一主多从 MySQL 实例

分离应用对数据库的读写请求

主从延迟

MySQL 主从

大概步骤

复制方式

关联阅读