数据库缓存服务——NoSQL之Redis配置与优化

一缓存概念

缓存是为了调节速度不一致的两个或多个不同的物质的速度，在中间对速度较慢的一方起到加速作用，比如CPU的一级、二级缓存是保存了CPU最近经常访问的数据，内存是保存CPU经常访问硬盘的数据，而且硬盘也有大小不一的缓存，甚至是物理服务器的raid 卡有也缓存，都是为了起到加速CPU 访问硬盘数据的目的，因为CPU的速度太快了，CPU需要的数据由于硬盘往往不能在短时间内满足CPU的需求，因此CPU缓存、内存、Raid 卡缓存以及硬盘缓存就在一定程度上满足了CPU的数据需求，即CPU 从缓存读取数据可以大幅提高CPU的工作效率。

1.系统缓存

buffer与cache：

buffer： 缓冲也叫写缓冲，一般用于写操作，可以将数据先写入内存再写入磁盘，buffer 一般用于写缓冲，用于解决不同介质的速度不一致的缓冲，先将数据临时写入到里自己最近的地方，以提高写入速度，CPU会把数据先写到内存的磁盘缓冲区，然后就认为数据已经写入完成看，然后由内核在后续的时间在写入磁盘，所以服务器突然断电会丢失内存中的部分数据。
cache： 缓存也叫读缓存，一般用于读操作，CPU读文件从内存读，如果内存没有就先从硬盘读到内存再读到CPU，将需要频繁读取的数据放在里自己最近的缓存区域，下次读取的时候即可快速读取。

2. 缓存保存位置及分层结构

互联网应用领域，提到缓存为王。

用户层：浏览器DNS缓存,应用程序DNS缓存,操作系统DNS缓存客户端
代理层：CDN,反向代理缓存
Web层：Web服务器缓存
应用层：页面静态化
数据层：分布式缓存,数据库
系统层：操作系统cache
物理层：磁盘cache, Raid Cache

DNS缓存

浏览器的DNS缓存默认为60秒，即60秒之内在访问同一个域名就不在进行DNS解析。

应用层缓存

Nginx、PHP等web服务可以设置应用缓存以加速响应用户请求，另外有些解释性语言，比如：PHP/Python/Java不能直接运行，需要先编译成字节码，但字节码需要解释器解释为机器码之后才能执行，因此字节码也是一种缓存，有时候还会出现程序代码上线后字节码没有更新的现象。所以一般上线新版前,需要先将应用缓存清理,再上线新版。

另外可以利用动态页面静态化技术,加速访问,比如:将访问数据库的数据的动态页面,提前用程序生成静态页面文件html 电商网站的商品介绍,评论信息非实时数据等皆可利用此技术实现。

数据层缓存

分布式缓存服务：Redis，Memcached

数据库：MySQL查询缓存，innodb缓存，MYISAM缓存

硬件缓存

CPU缓存（L1的数据缓存和L1的指令缓存）、二级缓存、三级缓存
磁盘缓存：Disk Cache
磁盘阵列缓存：Raid Cache，可使用电池防止断电丢失数据

二关系型数据库与非关系型数据库

关系型数据库

关系型数据库是一个结构化的数据库，创建在关系模型(二维表格模型)基础上，一般面向于记录。
SQL语句（标准数据查询语言）就是一种基于关系型数据库的语言，用于执行对关系型数据库中数据的检索和操作。
主流的关系型数据库包括Oracle、 MySQL、SQL Server、Microsoft Access、 DB2、PostgreSQL 等。

以上数据库在使用的时候必须先建库建表设计表结构，然后存储数据的时候按表结构去存，如果数据与表结构不匹配就会存储失败。

非关系型数据库

NoSQL（NoSQL=NotonlysQL），意思是“不仅仅是SQL"，是非关系型数据库的总称。
除了主流的关系型数据库外的数据库，都认为是非关系型。
不需要预先建库建表定义数据存储表结构，每条记录可以有不同的数据类型和字段个数(比如微信群聊里的文字、图片、视频、音乐等)。
主流的NOSQL 数据库有Redis、MongBD、 Hbase（分布式非关系型数据库，大数据使用）、Memcached、ElasticSearch（简称ES，索引型数据库）、TSDB（时续型数据库）等。

关系型数据库和非关系型数据库区别

（1）数据存储方式不同

关系型和非关系型数据库的主要差异是数据存储的方式。

关系型数据天然就是表格式的，因此存储在数据表的行和列中。数据表可以彼此关联协作存储，也很容易提取数据。
与其相反，非关系型数据不适合存储在数据表的行和列中，而是大块组合在一起。非关系型数据通常存储在数据集中，就像文档、键值对或者图结构。你的数据及其特性是选择数据存储和提取方式的首要影响因素。（很容易切换数据类型，一个数据集当中有多种数据类型）

（2）扩展方式不同

SQL和NoSQL数据库最大的差别可能是在扩展方式上，要支持日益增长的需求当然要扩展。

要支持更多并发量，SQL数据库是纵向扩展，也就是说提高处理能力，使用速度更快速的计算机，这样处理相同的数据集就更快了。因为数据存储在关系表中，操作的性能瓶颈可能涉及很多个表，这都需要通过提高计算机性能来克服。虽然SQI数据库有很大打展空间，但最终肯定会达到纵向扩展的上限。（数据一般存储在本地的文件系统中。读可以通过读写分离、负载均衡来分摊性能，但读写仍然很消耗IO性能）
而NoSQL数据库是横向扩展的。因为非关系型数据存储天然就是分布式的，NoSQL数据库的扩展可以通过给资源池添加更多普通的数据库服务器(节点)来分担负载。（数据分布存储在不同服务器上，可以并发地读写，加快效率）

小贴士：

横向扩展：加服务器。（比较便宜）
纵向扩展：提高硬件配置，比如换更高性能的CPU、加CPU核数、硬盘、磁盘IO、内存条。（除硬盘外，其他需要停机才能加）

（3）对事务性的支持不同

如果数据操作需要高事务性或者复杂数据查询需要控制执行计划，那么传统的SQL数据库从性能和稳定性方面考虑是你的最佳选择。SQL数据库支持对事务原子性细粒度控制，并且易于回滚事务。
虽然NoSQL数据库也可以使用事务操作，但稳定性方面没法和关系型数据库比较，所以它们真正闪亮的价值是在操作的扩展性和大数据量处理方面。
非关系型数据库在事务的处理和稳定性方面，不如关系型数据库。但读写性能好、易于扩展，处理大数据方面占优势。

关系型数据库：特别适合高事务性要求和需要控制执行计划的任务，事务细粒度控制更好。

非关系型数据库：事务控制会稍显弱势，其价值点在于高扩展性和大数据量处理方面。

非关系型数据库产生背景

可用于应对Web2.0纯动态网站类型的三高问题。

（1）High performance —— 对数据库高并发读写需求。

（2）Hugestorage——对海量数据高效存储与访问需求。

（3）HighScalability&&HighAvailability——对数据库高可扩展性与高可用性需求。

关系型数据库和非关系型数据库都有各自的特点与应用场景，两者的紧密结合将会给web2.0的数据库发展带来新的思路。让关系型数据库关注在关系上和对数据的一致性保障，非关系型数据库关注在存储和高效率上。例如，在读写分离的MySQI数据库环境中，可以把经常访问的数据（即高热数据）存储在非关系型数据库中，提升访问速度。

总结

关系型数据库:

实例-->数据库-->表(table)-->记录行(row)、数据字段(column)

非关系型数据库:

实例-->数据库-->集合(collection) -->键值对(key-value)
非关系型数据库不需要手动建数据库和集合(表)。

三 Redis简介

Redis (远程字典服务器)是一个开源的、使用C语言编写的NoSQL 数据库。

Redis 基于内存运行并支持持久化，采用key-value (键值对)的存储形式，是目前分布式架构中不可或缺的一环。

Redis服务器程序是单进程模型，也就是在一台服务器上可以同时启动多个Redis进程，Redis的实际处理速度则是完全依靠于主进程的执行效率。

若在服务器上只运行一个Redis进程，当多个客户端同时访问时，服务器的处理能力是会有一定程度的下降；
若在同一台服务器上开启多个Redis进程，Redis在提高并发处理能力的同时会给服务器的CPU造成很大压力。

即：在实际生产环境中，需要根据实际的需求来决定开启多少个Redis进程。若对高并发要求更高一些，可能会考虑在同一台服务器上开启多个进程。若CPU资源比较紧张，采用单进程即可。

Redis的优点

（1）具有极高的数据读写速度： 数据读取的速度最高可达到110000 次/s，数据写入速度最高可达到81000次/s。

（2）支持的数据结构： key-value，支持丰富的数据类型：Strings、 Lists、Hashes、 Sets 及Sorted Sets 等数据类型操作。

Strings 字符串型
Lists 列表型
Hashes 哈希（散列）
Sets 无序集合
Sorted Sets 有序集合（或称zsets）

（redis也可以做消息队列，可以通过Sorted Sets实现）

（3）支持数据的持久化： 可以将内存中的数据保存在磁盘中，重启的时候可以再次加载进行使用。

（4）原子性： Redis所有操作都是原子性的。（支持事务，所有操作都作为事务）

（5）支持数据备份： 即 master-salve 模式的数据备份。（支持主从复制）

Redis的缺点

缓存和数据库双写一致性问题
缓存雪崩问题
缓存击穿问题
缓存的并发竞争问题

Redis的适用场景

Redis作为基于内存运行的数据库，是一个高性能的缓存，一般应用在session缓存、队列、排行榜、计数器、最近最热文章、最近最热评论、发布订阅等。
Redis适用于数据实时性要求高、数据存储有过期和淘汰特征的、不需要持久化或者只需要保证弱一致性、逻辑简单的场景。

Redis为什么这么快

Redis是一款纯内存结构，避免了磁盘 I/O 等耗时操作。（基于内存运行）
2、Redis命令处理的核心模块为单线程，减少了锁竞争，以及频繁创建线程和销毁线程的代价，减少了线程上下文切换的消耗。（单线程模型）
3、采用了 I/O 多路复用机制，大大提升了并发效率。（epoll模式）

注：

linux系统中有两种I/O类型：磁盘I/O，网络请求I/O。

在Redis6.0中新增加的多线程也只是针对处理网络请求过程采用了多线性，而数据的读写命令，仍然是单线程处理的。

Redis与memcached比较

	Memcached	Redis
类型	Key-value数据库	Key-value数据库
过期策略	支持	支持
数据类型	单一数据类型	五大数据类型
持久化	不支持	支持
主从复制	不支持	支持
虚拟内存	不支持	支持

四 Redis安装部署

#关闭防火墙
systemctl stop firewalld
setenforce 0
#安装环境依赖包
yum install -y gcc gcc-c++ make

#上传软件包并解压
cd /opt/
tar zxvf redis-5.0.7.tar.gz -C /opt/
cd /opt/redis-5.0.7/
#开2核编译安装，指定安装路径为/usr/local/redis
make -j2 && make PREFIX=/usr/local/redis install
#由于Redis源码包中直接提供了Makefile 文件，所以在解压完软件包后，不用先执行./configure 进行配置，可直接执行make与make install命令进行安装。

#执行软件包提供的install_server.sh 脚本文件，设置Redis服务所需要的相关配置文件
cd /opt/redis-5.0.7/utils
./install_server.sh
.......#一直回车

Please select the redis executable path [] /usr/local/redis/bin/redis-server
#这里默认为/usr/local/bin/redis-server，需要手动修改为/usr/local/redis/bin/redis-server，注意要一次性正确输入

---------------------- 虚线内是注释 ----------------------------------------------------
Selected config:
Port: 6379                                      #默认侦听端口为6379
Config file: /etc/redis/6379.conf               #配置文件路径
Log file: /var/log/redis_6379.log               #日志文件路径
Data dir : /var/lib/redis/6379                  #数据文件路径
Executable: /usr/local/redis/bin/redis-server   #可执行文件路径
Cli Executable : /usr/local/bin/redis-cli       #客户端命令工具
-----------------------------------------------------------------------------------

#当install_server.sh 脚本运行完毕，Redis 服务就已经启动，默认监听端口为6379
netstat -natp | grep redis

#把redis的可执行程序文件放入路径环境变量的目录中便于系统识别
ln -s /usr/local/redis/bin/* /usr/local/bin/

#Redis服务控制
/etc/init.d/redis_6379 stop     #停止
/etc/init.d/redis_6379 start    #启动
/etc/init.d/redis_6379 restart #重启
/etc/init.d/redis_6379 status   #查看状态

#编辑配置文件，参数
vim /etc/redis/6379.conf
......
70 bind 127.0.0.1 192.168.72.60      #监听的IP地址
93 port 6379                          #监听端口
137 daemonize yes                     #使用守护进程的方式启动，即后台启动
159 pidfile /var/run/redis_6379.pid   #Redis的进程号保存位置
172 logfile /var/log/redis_6379.log   #日志保存的位置
187 databases 16                      #监听库的数量（编号0-15）

/etc/init.d/redis_6379 restart #重启redis服务

五 Redis命令工具

工具	作用
redis_server	用于启动redis的工具
redis-benchmark	用于检测redis在本机的运行效率
redis-check-aof	修复AOF持久化文件
redis-check-rdb	修复RDB持久化文件
redis-cli	redis命令行工具

1.redis-cli：Redis命令行工具

语法：redis-cli -h host -p port -a password

-h：指定远程主机机
-p：指定Redis服务的端口号
-a：指定密码，未设置数据库密码可以省略-a选项
#-a选项若不添加任何选项表示使用127.0.0.1:6379连接本机上的Redis数据库

#登录本机
redis-cli
#远程登录
redis-cli -h 远程主机ip地址 -p 6379 [-a 密码]

2.redis-benchmark测试工具

redis-benchmark是官方自带的Redis性能测试工具，可以有效的测试Redis服务的性能。

基本的测试语法：redis-benchmark [选项] [选项值]

-h：指定服务器主机名。
-p：指定服务器端口。
-s：指定服务器 socket
-c：指定并发连接数。
-n：指定请求数。
-d：以字节的形式指定SET/GET值的数据大小。
-k：l=keep alive 0=reconnect
-r：SET/GET/INCR 使用随机key,SADD使用随机值
-P：通过管道传输请求
-q：强制退出redis，仅显示query/sec值
--csv：以CSV格式输出
-l：生成循环,永久执行测试
-t：仅运行以逗号分隔的测试命令列表
-I：Idle模式，仅打开N个idle连接并等待

例子1：

向IP地址为xxx.xxx.xxx.xxx、端口为6379 的Redis 服务器发送100个并发连接与100000 个请求测试性能。

redis-benchmark -h xxx.xxx.xxx.xxx -p 6379 -c 100 -n 100000

例子2：

测试存取大小为100字节的数据包的性能。

redis-benchmark xxx.xxx.xxx.xxx -h -p 6379 -q -d 100

例子3：

测试本机上Redis服务在进行set与lpush操作时的性能

redis-benchmark -t set,lpush -n 100000 -q

六 Redis数据库常用命令

命令	作用
set	存放数据
get	获取数据
keys*	查看所有的key
keys k？	查看k开头后面任意一位的数据
exists	判断键是否存在（存在1，不存在0）
del	删除键
type	查看键对应的value值类型
rename key1 key2	改名，不管key2是否存在都会改名成功。如果存在，key1的值会覆盖key2的值
renamenx key1 key2	改名，若key2不存在，可以改名成功。若key2存在则不进行改名
dbsize	查看当前数据库中key的数目

1.set，get设置和获取键的值

set：存放数据，命令格式为 set key value
get：获取数据，命令格式为 get key

示例：
redis-cli
127.0.0.1:6379> set student hhh
OK
127.0.0.1:6379> get student
"hhh"

2.keys获取键值列表

keys命令可以获取符合规则的键值列表,通常情况可以结合 *、? 等选项来使用。

keys * #查看当前数据库中所有键

keys v* #查看当前数据库中以v开头的键

keys v? #查看当前数据库中以v开头，后面包含任意一位字符的键

keys v?? #查看当前数据库中以v开头，后面包含任意两位字符的键

3.exists判断键是否存在

exists 命令可以判断键是否存在。

返回1，表示键存在。

返回0，表示键不存在。

4.del删除键

del 命令可以删除当前数据库的指定key。

5.type查看键存储的数据类型

type 命令可以获取 key 对应的 value 值类型。

6.rename重命名

rename 命令是对已有 key 进行重命名。（覆盖）

使用rename命令进行重命名时，无论目标key是否存在都会进行重命名，且源key的值会覆盖目标key的值。
在实际使用过程中，建议先用exists命令查看目标key 是否存在，然后再决定是否执行rename 命令，以避免覆盖重要数据。

命令格式： rename 源key 目标key

7.renamenx会检查目标键名是否已存在

renamenx 命令的作用是对已有key进行重命名，并检测新名是否存在，如果目标key存在则不进行重命名。（不覆盖）

8.dbsize查看键数目

dbsize 命令的作用是查看当前数据库中key的数目。

9.设置和清空密码

9.1设置和查看密码

使用 config set requirepass password 命令设置密码。（一旦设置密码，必须先验证通过密码，否则所有操作不可用）

使用 config get requirepass 命令查看密码。

9.2清空密码

使用 config set requirepass '' 清空密码。

七 Redis多数据库操作

Redis 支持多数据库，Redis默认情况下包含16个数据库，数据库名称是用数字0-15来依次命名的。

使用redis-cli连接Redis数据库后，默认使用的是序号为0的数据库。

多数据库相互独立，互不干扰。

1.多数据库间切换select

命令格式：select 序号

#使用redis-cli连接Redis数据库后，默认使用的是序号为0的数据库。

2.多数据库间移动数据

命令格式：move 键值序号

3.清除数据库内数据

FLUSHDB：清空当前数据库数据
FLUSHALL：清空所有数据库的数据

八 Redis运维的故障与处理方法

1.Redis常见运维故障

使用 keys* 把库堵死。——建议使用别名把这个命令改名。
超过内存使用后,部分数据被删除。——这个有删除策略的,选择适合自己的即可。
没开持久化，却重启了实例,数据全掉。——记得非缓存的信息需要打开持久化。
RDB的持久化需要 Vm.overcommit_memory=1 ，否则会持久化失败。
没有持久化情况下,主从,主重启太快,从还没认为主挂的情况下,从会清空自己的数据，人为重启主节点前,先关闭从节点的同步。

2.Redis故障排查

结合Redis 监控查看QPS、缓存命中率、内存使用率等信息。
确认机器层面的资源是否有异常。
故障时及时上机，使用 redis-cli monitor 打印出操作日志，然后分析（事后分析此条失效）。
和研发沟通，确认是否有大Key在堵塞（大Key也可以在日常的巡检中获得）和组内同事沟通，确实是否有误操作。
和同事、研发一起排查流量是否正常，是否存在被刷的情况。

相关阅读:
Java 编程问题：四、类型推断
 探索多线程编程：线程的本质、状态和属性
 Eureka 服务注册与发现
 Spring5源码-监听器原理
 【图结构从入门到应用】图的表示和遍历，图搜索算法详解与示例
 一文带你了解PCB设计中的常用基本概念
 多条件分页查询
 JAVA并发编程--4.1理解Condition
CODESYS以文件形式保存RETAIN变量
 视频监控系统/视频汇聚平台EasyCVR平台页面展示优化
原文地址：https://blog.csdn.net/weixin_59792733/article/details/127722779