缓存(cache)是计算机中的一个经典的概念,在很多场景中都会涉及到。核心思路就是把一些常用的数据放到触手可及(访问速度更快)的地方,方便随时读取。
举例:我需要去高铁站坐高铁,坐高铁是需要反复刷身份证的(进入高铁站、检票、上车、乘车过程中、出站...)。正常来说,我的身份证是放在行李箱里的(行李箱的存储空间大,足够能装),但是每次刷身份证都需要开一次行李箱找身份证就非常不方便。因此我就可以把身份证先放到口袋里,虽然口袋空间小,但是访问速度比行李箱快很多。这样的话每次刷身份证我只需要从口袋里掏身份证就行了,就不必打开行李箱了。此时 “口袋” 就是 “皮箱” 的缓存,使用缓存能够大大提高访问效率。
这里所说的 “触手可及” 是个相对的概念。对于硬件的访问速度来说,通常情况下:CPU 寄存器 > 内存 > 硬盘 > 网络。那么硬盘相对于网络来说是 “触手可及的”,就可以使用硬盘作为网络的缓存。内存相对于硬盘是 “触手可及的”,就可以使用内存作为硬盘的缓存。CPU 寄存器相对于内存是 “触手可及的”,就可以使用 CPU 寄存器作为内存的缓存。
对于计算机硬件来说,往往访问速度越快的设备成本越高,存储空间越小。缓存是更快,但是空间上往往是不足的,因此大部分的时候,缓存只放一些热点数据(访问频繁的数据),就非常有用了。
关于 “二八定律”:20% 的热点数据能够应对 80% 的访问场景。因此只需要把这少量的热点数据缓存起来,就可以应对大多数场景,从而在整体上有明显的性能提升。
在一个网站中,经常会使用关系型数据库(比如 MySQL)来存储数据。关系型数据库虽然功能强大,但是有一个很大的缺陷:性能不高(换而言之,进行一次查询操作消耗的系统资源较多)。
- 数据库把数据存储在硬盘上,硬盘的 IO 速度并不快,尤其是随机访问。
- 如果查询不能命中索引,就需要进行表的遍历,这就会大大增加硬盘 IO 次数。
- 关系型数据库对于 SQL 的执行会做一系列的解析、校验、优化工作。
- 如果是⼀些复杂查询,比如联合查询,需要进行笛卡尔积操作,效率更是降低很多。
- ... ...
因此,如果访问数据库的并发量比较高,对于数据库的压力是很大的,很容易就会使数据库服务器宕机。
服务器每次处理一个请求,都是需要消耗一定的硬件资源的。所谓的硬件资源包括不限于 CPU、内存、硬盘、网络带宽... ... ⼀个服务器的硬件资源本身是有限的,一个请求消耗一份资源,请求多了自然把资源就耗尽了。后续的请求没有资源可用,自然就无法正确处理,更严重的还会导致服务器程序的代码出现崩溃。
核心思路主要是两个:
- 开源:引入更多的机器,部署更多的数据库实例,构成数据库集群(主从复制、分库分表等...)。
- 节流:引入缓存,使用其他的方式保存经常访问的热点数据,从而降低直接访问数据库的请求数量。
实际开发中,这两种方案往往是会搭配使用的。
Redis 就是一个用来作为数据库缓存的常见方案。
Redis 访问速度比 MySQL 快很多,或者说处理同⼀个访问请求,Redis 消耗的系统资源比 MySQL 少很多,因此 Redis 能支持的并发量更大。
- Redis 数据在内存中,访问内存比硬盘快很多。
- Redis 只是支持简单的 key-value 存储,不涉及复杂查询的那么多限制规则。
就像一个 “护盾” 一样,把 MySQL 给罩住了:

按照上述讨论的 “二八定律”,只需要在 Redis 中放 20% 的热点数据就可以使 80% 的请求不再真正查询数据库了。当然,实践中究竟是 “二八”,还是 “一九”,还是 “三七”,这个情况可能会根据业务场景的不同,存在差异。但是至少绝大多数情况下,使用缓存都能够大大提升整体的访问效率,降低数据库的压力。
注意 :缓存是用来加快 “读操作” 的速度的,如果是 “写操作”,还是要老老实实写数据库,缓存并不能提高性能。
每隔一定的周期(比如一天 / 一周 / 一个月),对于访问的数据频次进行统计,挑选出访问频次最高的前 N% 的数据。
以搜索引擎为例:用户在搜索引擎中会输入一个 “查询词”,有些词是属于高频的,大家都爱搜(鲜花、蛋糕、交友...),有些词就属于低频的,大家很少搜。
搜索引擎的服务器会把哪个用户在什么时间搜了什么词,都通过日志的方式记录的明明白白,然后每隔一段时间对这期间的搜索结果进行统计(日志的数量可能非常巨大,这个统计的过程可能需要使用 hadoop 或者 spark 等方式完成),从而就可以得到 “高频词表”。
![]()
先给缓存设定容量上限(可以通过 Redis 配置文件的 maxmemory 参数设定),接下来把用户每次查询:
如果缓存已经满了(达到上限),就触发缓存淘汰策略,把⼀些 “相对不那么热门” 的数据淘汰掉。按照上述过程持续一段时间之后 Redis 内部的数据自然就是 “热门数据” 了。
通用的淘汰策略主要有以下几种:
下列策略并非局限于 Redis,其他缓存也可以按这些策略展开。
把缓存中存在时间最久的(也就是先来的数据)淘汰掉。
记录每个 key 的最近访问时间,把最近访问时间最⽼的 key 淘汰掉。
记录每个 key 最近⼀段时间的访问次数,把访问次数最少的淘汰掉。
从所有的 key 中抽取幸运儿被随机淘汰掉。
想象你是个皇帝,有后宫佳丽三千。虽然你是 “真龙天子”,但是经常宠幸的妃子也就那么寥寥数人(精力有限)。后宫佳丽三千相当于数据库中的全量数据,经常宠幸的妃子相当于热点数,是放在缓存中的。今年选秀的一批新的小主,其中有一个被你看上了。宠信新人自然就需要有旧人被冷落,到底谁是哪个要被冷落的人呢?
Redis 内置的淘汰策略如下:
整体来说 Redis 提供的策略和我们上述介绍的通用策略是基本一致的,只不过 Redis 这里会针对 “过期 key” 和 “全部 key” 做分别处理。
使用 Redis 作为 MySQL 的缓存的时候,当 Redis 刚刚启动或者 Redis 大批 key 失效之后,此时由于 Redis 服务器是没有什么缓存数据的,那么所有的请求就会打给 MySQL,MySQL 就可能直接被访问到,从而造成较大的压力。随着时间的推移,redis 上的数据积累的越来越多,MySQL 承担的压力也就越来越小。因此就需要提前把热点数据准备好,直接写入到 Redis 中,使 Redis 可以尽快为 MySQL 撑起保护伞。
热点数据可以基于之前介绍的统计的方式生成即可。这份热点数据不一定非得那么 “准确”,只要能帮助 MySQL 抵挡大部分请求即可。随着程序运行的推移,缓存的热点数据会逐渐自动调整,来更适应当前情况。
访问的 key 在 Redis 和 数据库中都不存在,此时这样的 key 不会被放到缓存上,后续如果仍然在访问该 key,依然会访问到数据库,这就会导致数据库承担的请求太多,压力很大。这种情况称为缓存穿透。
- 业务设计不合理。比如缺少必要的参数校验环节,导致非法的 key 也被进行查询了。
- 开发 / 运维误操作。不小新把部分数据从数据库上误删了。
- 黑客恶意攻击。
- 针对要查询的参数进行严格的合法性校验,比如要查询的 key 是用户的手机号,那么就需要校验当前 key 是否满足⼀个合法的手机号的格式。
- 针对数据库上也不存在的 key , 也存储到 Redis 中,比如 value 就随便设成⼀个 "",避免后续频繁访问数据库。
- 使用布隆过滤器先判定 key 是否存在,再真正查询。
这种和可能是短时间内在 Redis 上缓存了大量的 key,并且设定了相同的过期时间。
- 部署高可用的 Redis 集群,并且完善监控报警体系。
- 不给 key 设置过期时间或者设置过期时间的时候添加随机时间因子。
此处把 breakdown 翻译成 “击穿”,我以为并非是⼀个好的选择,容易和缓存穿透混淆,翻译成 “瘫痪” / “崩溃” 也许更合适一些。
相当于缓存雪崩的特殊情况,针对热点 key,突然过期了,导致大量的请求直接访问到数据库上,甚至引起数据库宕机。